摘要:大模型如今已成为 AI 的基础设施,这场竞争堪称成王败寇。国外已形成 OpenAI 的 GPT、Anthropic 的 Claude 和谷歌的 Gemini 三足鼎立之势。国内从最初的众多参与者到如今,估计能留在大众手机上的大模型也就剩下字节跳动的豆包或其他个
大模型如今已成为 AI 的基础设施,这场竞争堪称成王败寇。国外已形成 OpenAI 的 GPT、Anthropic 的 Claude 和谷歌的 Gemini 三足鼎立之势。国内从最初的众多参与者到如今,估计能留在大众手机上的大模型也就剩下字节跳动的豆包或其他个别模型了,百度的文心一言还在艰难支撑。
从技术层面看,2024 年模型参数量迈入万亿时代,训练一次成本极高,动辄数月,这也使得模型智能提升的热度有所下降,更多是在基准测试的小数点后几位徘徊。价格方面,OpenAI 的 API 以美元计价,价格最贵但质量相对较好;国内则陷入价格战,部分 70 亿参数量的模型已经完全免费。模型智能难以进一步提升主要有两个原因:一是互联网上高质量数据已接近极限,而数据决定了模型的上限;二是模型算法改进对智能提升效果不明显,例如 ChatGLM 虽采用与 GPT 不同算法架构,但智能变化不大。不过,OpenAI 在 2024 年通过思维链和自我纠错方法在模型上取得突破,推出的 Orca 在处理数学、代码和科学问题上能力大幅提升,这也是人类方法论在 AI 领域的胜利。
随着大模型竞争格局的变化,大家不再一味地卷大模型,智能体成为新的竞争方向。给大模型设定角色并加上几个工具就构成了智能体。比如老中医智能体等,在短短一年间,智能体完成了从 IG 模式到多智能体框架,再到智能体平台的演进。
以百度文心的智能体平台为例,这类平台功能强大,不仅可以开发带界面的应用,还能将应用发布到小程序、公众号等,拥有丰富的插件生态。其核心要素包括知识库、插件和工作流,插件决定了智能体的能力边界。例如,插件涵盖搜索引擎、文生图、代码引擎等常见类型,还接入了高德地图、小破站视频搜索、快递查询等 API,覆盖生活的方方面面。以前全栈工程师开发一个智能应用可能需要一个月,现在普通人借助智能体平台,15 分钟就能搞定,基本实现无代码开发。所以,智能体平台无疑是普通人翻身逆袭的神器,建议大家日常一定要充分利用这些先进生产力,不要因循守旧,排斥 AI。毕竟,聪明的人早已将各种 AI 工具运用得炉火纯青,而大部分职场人还在埋头苦干,最终只能吃信息闭塞的亏。
在职场方面,有两个有趣的调查值得关注。全球人工智能指数 AIWI 评估显示,美国在 AI 专利数和投资领域排名第一,中国紧随其后,而中国在 AI 研究领域遥遥领先,不愧是学霸国。然而,切换到人均数据,相对于庞大的人口基数,中国的 AI 人才缺口仍然很大,这也意味着中国 AI 发展潜力巨大。
另一个关于公司所需 AI 技能变迁的调查表明,尽管新的技术需求不断涌现,如生成式人工智能大模型,但企业更看重人才的基础能力,如机器学习 spark 等。这告诉我们,在学习技术时,应更注重那些底层的、能穿越周期的能力,这些才是我们在职场立足的根本。
2024 年最受欢迎的 AI 应用场景当属辅助代码生成。据 CSDN 报告统计,高达 90% 的程序员都在偷偷使用代码生成工具,其中 35% 的人每天使用并认为极大提升了开发效率。开发工具多种多样,部分人喜欢像 ChatGPT 这样的对话式工具主动询问代码,更多人则选择通过插件集成在 IDE 里,其中最受欢迎的是 Copilot。在 vs code 中,Copilot 的下载量已突破 2300 万,毕竟其背靠 GitHub 庞大的代码库,样本模型强大。当然,也有搅局者,如今年 8 月,一个八岁小女孩使用 Cursor 45 分钟开发完一个聊天机器人的视频在 YouTube 上爆火。Cursor 在功能上与其他代码生成工具类似,但会自动引用相关联代码作为上下文输入给 AI。价格方面,Copilot 免费版每月有 50 次对话和 2000 次代码补全,Cursor 试用期内有相同次数限制,不过有项目可以重置 Cursor 试用期,实现无限续杯。但要注意,虽然 AI 能提供很多代码提示,但程序员仍需自行判断并对代码进行修修补补,而且基础代码质量会影响 AI 辅助效果,如果基础代码错误,AI 提示可能误导测试同学;若基础代码优雅,AI 则能成为开发神兵利器。
数字人技术作为通往元宇宙世界的大门,即使元宇宙概念遇冷,数字人技术却依然蓬勃发展。这是因为其需求爆发,根据中国互联网协会发布的报告,数字人应用场景可总结为虚拟主播、虚拟偶像和虚拟员工三类。超八成人接触过虚拟主播,直播业的发展带火了数字人,截至 2024 年,中国与数字人相关企业数量已达 114 万家,数字人行业进入影响生活方方面面的第三阶段。借助数字人平台,普通人几分钟就能打造自己的数字分身实现卖货,甚至有平台连狗都能做成数字人。数字人技术主要涉及形象、动作和语言三个要素,通过 AI 对这些要素进行替换或合成,如换脸技术、动作捕捉与驱动等,全部用 AI 合成则可打造虚拟偶像。中国虚拟数字人产业发展白皮书显示,有两成的人每月为虚拟偶像消费超 500 元,四成人更大方,七成人认为外貌完美是虚拟人的最大优势。超五成企业使用数字人技术,覆盖金融、媒体、文旅、制造、零售等领域,大量数字员工持证上岗。然而,当前就业率走低,很多人将此归咎于 AI,但实际上,虚拟偶像背后是厌倦明星塌房的经纪公司,AI 程序员背后是追求降本增效的老板,虚拟主播背后是想 7×24 小时直播的 MCN 公司,真正想替代你的不是 AI,而是 AI 背后的人。所以,AI 不是敌人,落后才是,持续学习、保持稀缺性才是打造竞争力的关键。
这一年我们还发现了许多有意思的 AI 项目,如利用大模型操作电脑的 Open Interpreter、照片风格化的 AI Instant ID、自动投简历的 Auto Drops Apply、更像神经网络的网络 Can 等。但最令人激动的是 AI 在蛋白质折叠领域的应用。蛋白质是生物体内功能执行者,由氨基酸链折叠成特定三维结构,结构异常会导致各种疾病。预测氨基酸组合对折叠的影响对研发新药、治疗罕见病至关重要,但实验室研究困难重重。2024 年,DeepMind 团队发布的 AlphaFold Three 在模型结构、应用范围和准确性上全面提升,在特定任务中将准确性从 76.8% 提升到 90.2%,因此其团队成员获得诺贝尔化学奖。11 月,DeepMind 团队还将模型源码和权重全部开源,AI 起源于神经网络,回归生物学造福生命是终极目标。所以,年轻人若有机会选择行业,应投身 AI 与科学领域。
2024 年 AI 领域给我们带来了诸多惊喜,期待 2025 年 AI 能继续创造奇迹,让我们共同见证。
来源:iridescentMan