moe

DeepSeek闷声发大招!1750亿参数暗更新

当全球科技巨头都在为AI发布会搭建炫目舞台时,国内AI公司深度求索(DeepSeek)完成了一次近乎"隐形"的版本迭代。没有线上直播,没有媒体通稿,甚至连版本号都隐藏在GitHub代码库的角落——这个被网友戏称为"史上最沉默更新"的举动,却悄然改写了多个NLP

github deepseek moe deepseek闷声 2025-03-27 05:09  2

需要新故事

资本市场向来看好那些具备新故事的企业。从阿里全面“押注”AI大模型,到小米一辆接着一辆的高性能新车发布。先不管这些“新”业务能为企业带来多少即刻现金流,但对未来的“美好预期”,往往令舆论为之振奋,也还会让芸芸众生充满了想象空间。

模型 开源 范式 moe 现金等价物 2025-03-28 06:35  1

3月25日A股盘前要闻

1.国务院总理李强日前签署国务院令,公布《实施〈中华人民共和国反外国制裁法〉的规定》。《规定》自公布之日起施行,全文共22条,主要内容包括,一是完善反制措施;二是细化反制程序;三是加强部门协同;四是强化措施执行。

李强 moe a股 授信 印花税 2025-03-25 08:44  2

与时代 共昇腾!

2025年3月21日,在华为中国合作伙伴大会期间,昇腾人工智能伙伴峰会在深圳正式召开。会上,华为昇腾计算业务总裁张迪煊发表了《与时代 共昇腾》的演讲。他表示,长思考能力将scaling延展到推理,集群推理成为大模型推理系统的标配,昇腾率先落地大规模专家并行方案

模型 推理 开源 deepseek moe 2025-03-22 11:52  2

国内首个通用具身基座模型发布

3月10日,上海机器人初创公司智元机器人正式发布智元启元大模型GenieOperator-1(GO-1),这是中国首个通用具身基座模型。智元机器人表示,这款模型具有泛化能力,能够在极少数据甚至零样本下泛化到新场景、新任务,降低了具身模型的使用门槛,降低了后训练

模型 通用 基座 moe villa 2025-03-19 02:30  4