美团发布首个开源大模型,特斯拉发布“宏图计划4” | 蓝媒GPT

B站影视 港台电影 2025-09-02 19:42 1

摘要:美团发布并开源其560B参数的混合专家(MoE)模型——LongCat-Flash(龙猫)。据介绍,LongCat-Flash-Chat这一模型采用创新性混合专家模型(MoE)架构,总参数 5600 亿,通过 “零计算专家” 机制及底层优化,实现了计算效率与性

美团首个开源大模型来了

美团发布并开源其560B参数的混合专家(MoE)模型——LongCat-Flash(龙猫)。据介绍,LongCat-Flash-Chat这一模型采用创新性混合专家模型(MoE)架构,总参数 5600 亿,通过 “零计算专家” 机制及底层优化,实现了计算效率与性能的双重提升。相比传统模型,美团大模型在训练和推理速度上优势明显,能在 H800 上实现单用户每秒 100+ tokens 的推理速度,输出成本低至 5 元 / 百万 token。在性能表现上,龙猫虽为非思考型基础模型,但据多项基准测试综合评估,LongCat-Flash-Chat在仅激活少量参数的前提下,在智能体任务中具备突出优势,同时推理速度超过100tps。阿里推出智能体开发框架AgentScope 1.0据通义大模型官微消息,阿里通义实验室推出新一代智能体开发框架——AgentScope 1.0。据介绍,AgentScope 1.0是一款以开发者为核心,专注于多智能体开发的开源框架。特斯拉发布“宏图计划4”:正在打造把AI带入物理世界的产品特斯拉发布其“宏图计划”第四篇章(Master Plan Part 4)的完整文件,其中提到,特斯拉故事的下一篇章,将创造一个人类才刚刚开始想象的世界,并以前所未有的规模实现。目前正在打造把AI带入物理世界的产品和服务。截至今年6月底 ,我国智能算力规模达788百亿亿次/秒截至今年6月底,我国在用算力中心机架总规模达1085万标准机架,智能算力规模达788百亿亿次/秒(EFLOPS);存力规模超过1680艾字节(EB),相比2023年增长约40%;已发布1509个大模型,在全球位居前列。腾讯混元最新开源翻译模型发布腾讯混元宣布将旗下刚刚获得国际翻译比赛冠军的模型开源,供开发者免费下载部署。据了解,这一模型命名为Hunyuan-MT-7B,总参数量仅7B,支持33个语种、5种民汉语言/方言互译,是一个能力全面的轻量级翻译模型。同时开源的还有一个翻译集成模型Hunyuan-MT-Chimera-7B(奇美拉),它能够根据原文和多个翻译模型给出的不同内容,再生成一个更优的翻译结果,不仅原生支持Hunyuan-MT-7B,也支持接入Deepseek等模型。度小满App升级上线AI经营助手9月1日,度小满App升级焕新正式上线AI经营助手,通过AI照相馆、AI创意海报和智能记账本三大核心功能,为小微商家提供覆盖日常经营关键环节的实用AI工具。据介绍,“AI经营助手”基于千亿参数金融大模型打造,服务于真实经营场景。该助手将在9月5日面向所有小微企业主开放。

你期待怎样的AI时代?

咱们评论区聊聊~

来源:蓝媒汇

相关推荐