摘要:2025年10月14日(周二),前特斯拉 AI 总监 Karpathy 推出开源项目“nanochat”,仅用约 8000 行代码复现ChatGPT 全流程。
悟鸣的 AI 周报时间!
让小鸣为大家盘点一下本周主要的 AI 大事件。
2025年10月14日(周二),前特斯拉 AI 总监 Karpathy 推出开源项目“nanochat”,仅用约 8000 行代码复现ChatGPT 全流程。
项目在 GitHub 发布仅 3 天,星标数已破 21.7k。用户只需一台 GPU、约 4 小时和 100 美元成本,就能训练出一个能写诗、回答基础问题的“小型 ChatGPT”。
GitHub 地址:https://github.com/karpathy/nanochat
2025年10月14日(周二),蚂蚁集团开源万亿参数思考大模型 Ring-1T。
基于 Ling 2.0 MoE 架构,在 20T 语料上预训练,通过自研强化学习系统 ASystem 进行推理能力训练。
支持128k上下文窗口,在多项国际竞赛和基准测试中表现接近或超越顶级闭源模型。
Hugging Face模型库:https://huggingface.co/inclusionAI/Ring-1T-preview
体验地址:https://ling.tbox.cn/chat
2025年10月15日(周三),阿里通义千问团队推出其最强视觉语言模型系列 Qwen3-VL的 4B 与 8B 版本,两个尺寸均提供 Instruct 与 Thinking 版本,在几十项权威基准测评中超越 Gemini 2.5 Flash Lite、GPT-5 Nano等同级别顶尖模型。
遗憾的是,235B 的版本也没通过六根手指的测试...
体验地址:https://chat.qwen.ai/
2025年10月16日(周四)谷歌最新推出的 Veo 3.1是一款先进的 AI 视频生成模型,在原有Veo 3的基础上实现了多项升级。
Veo 3.1支持高保真度的 8 秒 720p 或 1080p 视频生成,并首次全面引入原生音频功能,每个视频片段都可以生成同步的丰富音效与环境声,让 AI 视频更具真实感和情感维度。
核心优势:
更高的提示词遵循能力,生成画面高度真实。场景持续扩展,支持几分钟级的长镜头内容工作流。音画同步叙事,让AI视频具备导演级创作和后期编辑能力。Veo 3.1的发布标志着AI视频制作迈入“能导能剪”的新阶段,极大提升了视频生成的细致度与专业性。
项目官网:https://blog.google/technology/ai/veo-updates-flow/
体验地址:
Gemini:https://gemini.google.com/
Lovart:https://www.lovart.ai/zh
2025年10月16日(周四)阿里推出全新的 AI 编码工具 Qoder CLI。
Qoder CLI 是一款由阿里推出的AI编程助手命令行工具,集成了顶尖编程模型和轻量级智能体(Agent)框架,具备强大的代码生成、理解、自动化工程任务和全局代码索引能力。
CLI 现在大同小异,关键看模型。
阿里出品了好几个 CLI,早前还发布过 Qwen Code CLI 和 iFlow CLI。
其中 iFlow CLI 咱们公众号最近还介绍过,在 iFlow CLI 中可以免费使用国内先进大模型。
官网地址:https://qoder.com/cli
2025年10月16日(周四)Anthropic 发布 Claude Haiku 4.5,价格是 Claude Sonnet 4 的三分之一,速度快两倍以上!
在 SWE-bench Verified 这个衡量真实编程任务的基准测试上,Haiku 4.5 的表现极为亮眼。
它不仅追上了五个月前的 Sonnet 4,在某些任务上,如 Computer use 甚至有所超越。
Anthropic 官网晒出了很多合作方的好评。
当初英伟达发出“小型语言模型才是未来”的暴论时,很多人还很错愕。
对于重复性的、单一的任务小型的语言模型不仅能力足够,而且更快、更便宜。
5 个月前的旗舰配置,现在直接成为 “小模型”的标配,成本只有三分之一,速度却快了两倍!
或许未来大语言模型和小型语言模型相互合作,才能实现成本和效果的最佳平衡。
体验地址:https://claude.ai/
网传 Gemini 3 快发布了,不知道是否可以秒杀 Claude Sonnet 4.5 让我们拭目以待!
————
来源:明明如月学长