摘要:「新皮层」实测体验,该功能生成对话播客几乎没有延时,双人对话的AI声音自然,甚至会模仿人说「然后」、「这个」等连接词,与真人声音相似度极高。在内容表达方面,AI播客并非直接逐字朗读原文,而是总结网页内容,还会给出评价,比如针对「快手可灵AI年化收入破1亿美元」
Key Points
豆包推出AI播客生成功能;
小红书开源大模型dots.llm1,中文理解能力强是亮点;
OpenAI称年度经常性收入已达100亿美元;
Meta计划投资Scale AI,金额或超百亿美元;
硅基流动完成新一轮数亿元融资,阿里云领投。
豆包推出AI播客生成功能
近日,豆包推出AI播客生成功能。用户在豆包PC端打开文章的网页链接,在问问豆包的页面点击「网页播客」,即可体验该功能。
「新皮层」实测体验,该功能生成对话播客几乎没有延时,双人对话的AI声音自然,甚至会模仿人说「然后」、「这个」等连接词,与真人声音相似度极高。在内容表达方面,AI播客并非直接逐字朗读原文,而是总结网页内容,还会给出评价,比如针对「快手可灵AI年化收入破1亿美元」的新闻,给出了可灵AI「迭代速度很快」的评价。上述朗读内容还可以生成文字,供用户查看。
豆包AI播客是基于豆包端到端语音大模型开发的产品。 2025年1月20日,豆包发布了最新的端到端语音大模型,并基于该模型更新豆包App的实时语音通话功能。此前,豆包语音通话功能采用的是ASR+LLM+TTS的方案:用户输入语音通过ASR(自动语音识别)转写为文本,通过LLM(大语言模型)生成对话文本,最后通过TTS(文生音频)转成语音输出。端到端语音大模型则将上述环节放在同一个模型中解决,多模态输入和输出,提升了语音对话质量。 这种技术使得AI的声音不再冷冰冰,变得更流畅,更具情感,更加像人。
播客生成类产品最早应该是2023年Google推出的NotebookLM,它能够基于资料生成由两个AI主播主持的播客节目。目前,除了豆包外,理想汽车旗下的理想同学App也上线了AI播客,这些播客基于虎嗅的文章生成,用户无法自定义。
近日,小红书开源了自研大模型dots.llm1,该模型是小红书hi lab(Humane Intelligence Lab,人文智能实验室)团队研发的文本大模型, hi lab前身就是小红书的大模型技术与应用产品团队。
该团队在GitHub上展示了该模型的参数:dots.llm1是一个拥有1420亿参数的混合专家模型(MoE),在推理过程中仅激活140亿参数,保持高性能的同时,可降低训练和推理成本。该模型支持英文和中文两种语言,上下文长度达到32,768 tokens。
数据质量一定程度上决定了模型性能。 小红书称,dots.llm1在预训练阶段使用了11.2万亿非合成数据,这些数据主要来源于Common Crawl和自有Spider抓取到的web数据。 为确保质量,小红书还开启了三道工序处理数据:Web文档准备过滤黄赌毒内容;采用规则处理清除广告等高频噪声;模型处理方面引入多模型评估网页类型和语料质量,提升知识类内容占比。
官方技术文档显示 dots.llm1模型的中文能力相对突出。
性能方面, hi lab称,dots.llm1的综合性能优于DeepSeek-V2,与Qwen2.5 72B的结果相当;其中,dots.llm1在中文方面的表现格外突出 :CLUEWSC语义理解测试中,dots.llm1得分92.6,C-Eval综合知识评测得分92.2,均超越了DeepSeek-V3和Qwen2.5全系。
OpenAI称年度经常性收入已达100亿美元
6月9日消息,OpenAI表示,公司年度经常性收入(ARR)达到100亿美元,高于去年年底的55亿美元。这一财务指标包括ToC产品、ToB产品以及API的销售收入,但不包括微软的授权收入和其他一次性大额交易。 4月曾有报道称,预计OpenAI今年的收入将达到130亿美元。
目前, OpenAI的周活跃用户数为5亿,付费企业客户300万。据知情人士消息,OpenAI的目标是到2029年实现1250亿美元的收入。
Meta计划投资Scale AI,金额或超百亿美元
6月8日有报道称,Meta正洽谈向AI数据服务商Scale AI投资超100亿美元。目前仍在协商交易条款,若交易达成,将成为Meta迄今为止在AI领域最大单笔对外投资。去年5月,Scale AI完成了10亿美元F轮融资,估值138亿美元,Meta当时已参与投资。
Scale AI成立于2016年,核心业务是为AI模型训练提供数据标注服务。据2个月前的报道,Scale AI去年营收约8.7亿美元,预计今年营收达到20亿美元。 Scale AI初期从事自动驾驶图像数据标注业务,后扩展至大语言模型文本数据标注,客户包括OpenAI、微软、Meta、英伟达等。目前,公司转向更为复杂的数据标注任务,雇佣了大量持有高等学历的专业人士——截至今年年初,超过40%的标注专家拥有硕士学位、法律学位或MBA学位,12%拥有分子生物学等领域博士学位。
另外,Scale AI与美国政府的关系紧密,已获得美国国防部的AI技术合同,公司前高管Michael Kratsios现任特朗普的首席科技顾问,协助制定美国国家AI政策。
硅基流动完成新一轮数亿元融资,阿里云领投
6月9日,硅基流动宣布完成数亿元人民币A轮融资。本轮融资由阿里云领投,老股东创新工场等机构超额跟投,华兴资本担任独家财务顾问。
该公司上一轮融资在2024年年底,当时完成了亿元人民币Pre-A轮融资,华创资本领投,普华资本跟投,老股东耀途资本超额跟投。此外,在Pre-A融资前,硅基流动还引入了美团作为该公司的战略股东。
硅基流动成立于2023年8月,是一家AI基础设施提供商,向企业客户销售AI算力及配套服务。硅基流动的创始人为清华大学计算机博士袁进辉,曾任微软亚洲研究院主管研究员。目前,该公司已经推出了大模型云服务平台SiliconCloud、一站式工作流设计平台BizyAir。 今年年初DeepSeek爆火后,硅基流动是最早部署DeepSeek模型的服务商,使得该公司在一周内用户数增长8倍,突破150万。
来源:晚晚的星河日记一点号