摘要:在过去的2024年,AI赛道热度不减,市场竞争依然激烈,技术和产品不断更新迭代。岁末年初,是时候做个盘点了,笔者根据这一年的观察和复盘,对AI领域做了10大总结,现分享如下:
以下文章来源于技术领导力 ,作者Mr.K
在过去的2024年,AI赛道热度不减,市场竞争依然激烈,技术和产品不断更新迭代。岁末年初,是时候做个盘点了,笔者根据这一年的观察和复盘,对AI领域做了10大总结,现分享如下:
- 文章信息 -
本文作者:Mr.K,黄哲铿,知名数字商业顾问,「顿悟山丘」创始人,科技博主,曾担任海尔、中通快递、1药网技术高管,著有《技术人修炼之道》《技术管理之巅》。分享:个体成长、科技趋势、数字化转型、商业洞察。由「技术领导力」原创首发, 数字化企业经授权发布。
01
从“百模大战”到“十模共生”
再到“价格战”
2024 年,国内大模型领域的市场格局发生了深刻变革。最开始,大模型如火如荼,大量企业和研究机构纷纷投身其中,形成了“百模大战” 的壮观景象。随着竞争的加剧和市场的不断筛选,又逐渐形成了“十模共生” 的局面;再后来,就是难以免俗地开启了刀刀见血的“价格战”。
以腾讯混元大模型为例,其价格调整堪称大跳水,它的混元-Lite价格从 0.08 元/千tokens降至0元 ;混元-Standard价格降幅也高达88%。除腾讯外,科技巨头如阿里、百度、字节跳动,独角兽企业如智谱、DeepSeek、MiniMax ,也都先后入局,各种降价和压缩成本。拿DeepSeek来说,它最新发布的模型,训练成本仅为 GPT-4o 的二十分之一,显著的成本优势和价格优势,也让它在市场中更具竞争力和生命力。
02
开源越来越多
闭源越来越强
开源模型和闭源模型在 2024 年呈现出不同的发展轨迹。开源模型方面,LLaMA 系列等众多开源项目不断涌现,不仅为开发者提供了丰富的选择、促进了技术的快速传播和创新应用,还以其灵活性和社区驱动的特性,吸引了大量开发者参与,推动了模型的快速迭代和多样化应用场景的探索。
而闭源模型则在性能上不断强化,展现出更卓越的实力。如 GPT-4、Claude 3等闭源模型,在大规模多任务语言理解(MMLU)测试中表现更为优异。这也让闭源模型在对准确性要求较高的商业应用和专业领域中,占据主导地位。比如,在高端智能客服、专业内容创作等领域,闭源模型能够提供更加精准和高效的服务,显然更受欢迎。
03
从“快思考”到“慢思考”
AI 的思考模式,也在 2024 年发生了重要转变,从简单的 “快思考” 迈向了更为复杂和深入的 “慢思考” 阶段。其中一个重要标志就是GPT - 4o 等模型具备了推理能力,这是大模型实现 “慢思考” 的关键一步。
具有“慢思考”能力的大模型,通过递进式的深度推理和验证机制,能够构建系统化的思维链路。在处理复杂问题时,不再仅仅依赖表面的模式识别和快速响应,而是能够深入分析问题的各个方面,进行多步骤的分析和推理,并提出合理的假设和解决方案,从而得出更为可靠的结论。这种转变使得 AI 在面对诸如学术研究、复杂业务决策等需要深度理解和逻辑分析的任务和场景时,表现更为出色,也能更好地提供有价值的思路和解决方案。
04
“AI+”与“+AI”
百花齐放
大模型应用方面,过去一年出现了“AI+”与“+AI”两种模式并存、百花齐放的局面。钉钉在大模型产品形态创新方面,就很好的体现了这一点。
在 “AI+” 模式下,钉钉打造了“AI助理”智能体应用,能够根据用户的工作场景和需求,主动学习业务知识,自动执行任务,提供智能提醒和决策支持。而AI 搜索可以帮助用户从海量、碎片化信息中找到重点,构建出最懂用户的知识网络,帮助用户提升效率,两者都是大受企业用户欢迎的明星产品。
而“+AI”模式,则是在原有应用的基础上,通过引入AI大模型的能力,进行重构和升级。截至2023年年底,钉钉会议、文档、知识库、表格、邮箱等20+条产品线、80多个场景全面接入大模型,完成智能化再造,使原有应用的功能更加丰富和强大。其中的闪记AI是一款会议记录智能工具,能帮助用户转写、翻译和整理会议内容,实现会议的立体回顾,开会、上课、访谈、面试、看直播、看视频都能用得上。
其实不管是AI+还是+AI,本质都是帮助企业和个人解决真实的场景痛点,帮助提效或代替人去做各种繁琐的任务。去年11月,钉钉上线了一批精选 AI 助理,包括工单助理、行政助理、Excel 助理、法务助理等,均可按需选择,开箱即用。这些AI助理具备感知、记忆和行动能力,还可以结合工作流,轻松处理工作中那些多步骤的复杂任务。这就让AI自然地深入到我们的业务中了,而不仅是停留在协同层面。
05
从“超级应用”到“超级有用”
2024年大模型另外一个发展趋势,是应用的“价值取向”经历了从追求 “超级应用” 到聚焦 “超级有用” 的重要转变。
以前,很多企业和开发者,总是对打造一款功能全面、覆盖广泛、能满足更多用户需求的“超级应用”有着很深的执念。但从事实和市场反映来看,这种想法并不现实。因此,开发者们变得更务实,他们把更多的精力和资源放在了如何使大模型应用更加“超级有用”上,也就是开发者们开始聚焦于特定领域或场景,为垂直用户提供更加精准和高效的服务。
文心智能体就是一个典型的例子,它基于其强大的语言理解和生成能力,能够深入理解用户需求,提供高度个性化的服务。比如,在信息获取方面,它能够根据用户的问题精准检索和筛选信息,为用户提供最相关、最有价值的内容;在路线规划方面,它可以综合考虑用户的时间、预算、兴趣点等因素,制定出详细且合理的行程安排;在美食推荐方面,能根据用户的口味偏好和地理位置,精准推荐合适的餐厅和菜品。
这种从追求功能全面性,到注重实际应用效果的转变,将让大模型更深度参与到大众的生活和工作中,提高用户的满意度和使用体验,成为大家的得力助手。
06
iRAG崛起
文生图“幻觉”消除
百度创始人李彦宏在去年曾表示:“过去这24个月,对这个行业而言,最大的变化是什么?我的回答一定是,大模型基本消除了幻觉,回答问题的准确性大幅提升了,这让AI从‘一本正经的胡说八道’,变得可用、可被信赖。” 在过去的一年,随着RAG等技术不断成熟,大模型的幻觉问题基本消除,直接促使AI应用“上规模”,确实算得上年度一大亮点。
过去大模型在生成文本、图像等内容时,常常会出现生成内容与实际情况不符的“幻觉”现象,给用户带来很大困扰。但iRAG技术的崛起,能通过检索增强,结合生成模型的创新能力,提供更贴近现实、更准确可靠的信息生成服务,大大减少了“幻觉”现象的发生。
百度在这方面的表现就非常可圈可点,比如在文生图领域,百度iRAG技术通过优化算法,在图像生成过程中,能够根据用户的文本描述,生成更加逼真、符合逻辑的图像内容。显著提升了文生图的质量和准确性,能够满足用户在新闻报道、历史研究等不同场景下的需求。
07
世界模拟器
世界模拟器作为大模型领域的新兴概念,在 2024 年取得了一定的进展,但也面临诸多挑战。世界模拟器是一种通过构建虚拟世界,来模拟现实世界的复杂系统和环境的技术。大模型凭借其强大的生成和推理能力,可以为世界模拟器提供更加真实和精细的模拟效果。目前,其技术路线已逐渐明确,但仍面临成本高、模态不全、长视频不稳定等问题。
1、在成本方面;模拟现实世界的物理规律和复杂场景需要大量的计算资源,导致成本居高不下。
2、在模态方面;现有的技术在融合声音、视觉、空间等多模态信息时还存在困难,无法完全模拟真实世界的丰富性。
3、在长视频生成方面;稳定性较差,容易出现画面抖动、逻辑不连贯等问题。
但另一方面我们也看到,游戏生成模型的发展为世界模拟器带来了新的希望。比如 DIAMOND 可交互游戏画面预测、Oasis 开放世界实时模拟等技术的突破,为解决视频生成核心问题提供了新思路。未来,世界模拟器有望从游戏模拟逐步发展为受限世界模拟,最终实现通用世界模拟,在科学研究、教育培训、城市规划等多个领域发挥重要作用。
08
全栈式编程助手
2024年,全栈式编程助手成为大模型应用的一个重要方向。全栈式编程助手是指能够为开发者提供从代码编写、调试到测试、部署等全流程辅助的AI工具。商汤的代码小浣熊和字节的扣子都是其中的典型代表。
商汤的代码小浣熊通过大模型的生成和推理能力,能够帮助开发者快速生成代码、优化代码结构、查找和修复代码错误等,极大地提高了开发效率和代码质量。字节的扣子则注重与开发者的交互体验,提供了可视化AI开发工具,开发者可以通过拖拉拽的方式,轻松搭建AI应用,无需编写复杂的代码。
这些全栈式编程助手不仅能够减轻开发者的负担,还能够帮助开发者更好地理解和掌握AI技术,提升开发者的技能水平。未来,全栈式编程助手将更加智能化和个性化,不仅能为开发者提供更加全面高效的服务,也能更好地推动软件开发行业的发展。
09
“AI微笑曲线”,开始演进
AI微笑曲线是K哥提出的一个概念,指在AI产业链中,附加值高的环节主要集中在两端,即基础层的硬件(如GPU)和应用层的AI应用,而中间的大模型层附加值相对较低。
随着大模型技术的不断进步和应用的不断拓展,这一曲线去年开始演进。一方面,GPU 制造估值随着市场的进一步成熟,逐渐理性回归;而行业竞争也更加注重技术创新和应用落地;基础大模型公司,也在不断提升模型性能和数据质量,并积极探索开发C 端杀手级应用。
未来,“AI微笑曲线”将沿着这一趋势继续演进,大模型层的“价值洼地”将逐步被拉抬,整个AI产业链也将更均衡、协调地发展。
10
AI超级个体,闪亮登场
打造AI超级个体,去年最有代表性的例子就是陈云飞和他的小猫补光灯。陈云飞产品经理出身,不会代码的他却能通过AI为自己赋能,开发出了“小猫补光灯”这一爆款产品。
小猫补光灯能够让用户生成想要的背光板,满足了爱美爱自拍女生的需求。上架后下载量迅速突破 3 万,冲到应用榜单 top20。后来又快速迭代推出小猫补光灯pro,并以1块钱的价格,冲到了AppStore付费榜第一名。这样一个爆款产品,通过AI加持,不会写代码的陈云飞只用了1个小时就开发出来了。
陈云飞的真实故事表明,在大模型时代,个人借助 AI 技术,完全能将创意转化为实际产品,实现自身价值,成为 AI 超级个体。这个时代,会用让人意想不到的方式,奖励那些敢于尝试,敢于驾驭新技术的人。
回顾2024年,AI技术不断突破、市场竞争愈发激烈,科技正以前所未有的速度重塑千行百业,在这过程当中技术的边界不断拓展。展望2025年,AI将继续引领变革,为我们带来更多的惊喜与可能,为人类社会的发展注入更加强劲的动力。
来源:数字化企业