摘要:在关税热闹的声势里,AI领域依然保持着高速进步的趋势,我们注意到DeepSeek、TikTok、Nvidia连发新的研究成果。
限时¥399早鸟优惠
这周,特朗普持续霸占各大头条,关税成为新闻榜一大哥。
在关税热闹的声势里,AI领域依然保持着高速进步的趋势,我们注意到DeepSeek、TikTok、Nvidia连发新的研究成果。
从中我们注意到AI技术必然还会变得更强,虽然AGI仍然不会到来,但用上AI、用好AI的人还会持续受益。
如果你也希望享受这轮技术红利,欢迎预约今晚8点的前哨AI小课,Tina会分享【如何用AI写长文报告、自动提取和改写视频文案】
接下来,我们和大家介绍三家AI领军企业的最新研究,看看AI技术的下一轮前沿在哪。
DeepSeek的强化学习探索
本周,DeepSeek和清华联合发布最新研究,公布了一种名为“自律批判调优”(Self-Principled Critique Tuning, SPCT)的新技术。
这个技术有什么用呢?
简单说,DeepSeek R1的突破在于把传统AI的训练方法成功用到了今天的AI大模型上,设计好奖励方法,AI就能自己持续学习,掌握工作方法。
过去的奖励模型多应用于特定领域,比如数学题、编程问题等明确领域,但在处理复杂的开放性任务时表现不佳。
DeepSeek这个新方法通过动态生成评判标准(principles)和评价内容(critiques),实现了在通用领域和主观任务上的精准反馈,使AI应用可以更广泛、更高效地适应各种真实场景。
在测试中,27B的小模型已经超越了GPT-4o和Nemotron-4-340B-Reward等大型模型,为开发更强大的通用AI铺平了道路。
DeepSeek论文原图
大厂加紧追赶
与此同时,字节跳动也亮出了他们在AI推理领域的新成果——Seed-Thinking-v1.5。
采用DeepSeek类似的混合专家(MoE)架构,还开发了定制的强化学习框架(VAPO、DAPO)和双层奖励模型(Seed-Verifier、Seed-Thinking-Verifier)。
新模型在多个基准测试中逼近甚至超越了谷歌的Gemini 2.5 Pro和OpenAI的o3-mini-high。
当然这个模型尚未开发,实际效果还得上线再说,毕竟论文数据再强都不如用起来的感受对比。
Nvidia本周也基于Meta的Llama-3.1发布了自家优化版本Llama-3.1-Nemotron-Ultra-253B-v1。
Nvidia通过神经架构搜索(NAS)优化模型结构,实现了在单个8x H100 GPU节点上的高效部署,并引入了可切换的“推理模式”,允许开发者根据任务需求平衡复杂度和响应速度,把近期热门的软硬件改进都用上了,也算是秀了把肌肉。
根据官方数据看,这款拥有2530亿参数的模型,性能已经与DeepSeek R1(6710亿)匹敌。
Nvidia后训练负责人发文
AI进入专才时代
这些看似独立的技术突破背后,涌动着一股清晰的产业趋势:人工智能正在从“通才”向“专才”,尤其是具备深度推理能力的“专才”快速进化,各个领域都会持续受益。
首先,“推理能力”已成为顶级AI竞争焦点。
无论是DeepSeek对奖励模型的革新以更好地指导复杂任务,还是字节跳动Seed-Thinking对STEM和逻辑推理的侧重,亦或是Nvidia Nemotron Ultra强调的推理模式切换,都指向同一个目标:
让AI不仅仅是模仿和生成,更能像人一样进行深度思考、逻辑推演和解决复杂问题。
这意味着AI的应用将从简单的问答、文本生成,拓展到更需要智慧和洞察力的领域。
其次,底层性能优化会让成本持续降低。
字节跳动的MoE架构、Nvidia对模型结构的优化和推理模式的设计,以及DeepSeek对奖励模型推理时可扩展性的研究,都反映了业界在追求更强能力的同时,对计算资源消耗和响应速度的高度关注。
如何用更少的资源、更快的时间获得更高质量的结果,已经是上游研发的焦点,下游AI应用的快速迭代和成本下降也将继续发生。
第三,高质量数据和先进的训练/评估方法是核心驱动力。
各家论文中都反复提及数据,继续凸显了数据质量和训练策略的重要性。
不再是简单地堆砌数据,而是需要结构化、高质量、针对性的数据,以及能够有效引导模型学习复杂能力的训练框架和评估体系。
AI成为专才,你的通才时代到了
面对AI如此迅猛的发展,普通用户和职场人士如何才能跟上步伐,将这些尖端技术转化为实实在在的生产力提升呢?
这正是今晚8点前哨AI小课要解决的核心问题,今晚Tina会分享【如何用AI写长文报告、自动提取和改写视频文案】
具体教你如何利用DeepSeek、DeepResearch等工具,实现快速翻译网页与长文件、自动生成视频分镜、以及快速高质量地撰写专业长文报告。
此外,Tina还将演示Coze工作流,教你如何自动抓取并改写短视频的文案内容,让你的工作效率翻倍提升。
掌握这些前沿的AI工具,不仅能够帮助你在短短9分钟内撰写出以往数小时才能完成的专业报告,更意味着你能更早地适应AI时代,成为职场中的效率先锋。
告别熬夜加班,告别重复繁琐的工作流程,现在点击预约我们的直播课,第一时间掌握最新AI工具的实操技巧,抢先一步抓住AI带来的巨大红利。
今晚8点,我们直播间不见不散!
来源:王煜全一点号