摘要:飞象原创(孙迎新/文)猝不及防而又美不胜收,这或许是AI在过去一年里给大多数人留下的最直观感受。同时我们也觉察到,世界像是被某种未知却又充满宿命感的代码所驱动,在这百花齐放而又令人眼花缭乱的成果背后,运转着一种更深层的逻辑。
飞象原创(孙迎新/文)猝不及防而又美不胜收,这或许是AI在过去一年里给大多数人留下的最直观感受。同时我们也觉察到,世界像是被某种未知却又充满宿命感的代码所驱动,在这百花齐放而又令人眼花缭乱的成果背后,运转着一种更深层的逻辑。
在2025年1月的CES(国际消费电子展)上,英伟达创始人兼首席执行官黄仁勋对AI技术的发展做出了高度的概括与展望。黄仁勋在详细梳理了人工智能技术的进化路径之后,他得出的结论是,包括感知AI(Perception AI)、生成式AI(Generative AI)以及当前火热的代理型AI(Agentic AI),AI技术正在从理解图像、文字和声音的感知阶段,逐步发展到能够创造内容的生成阶段,最终将进入能够运行、推理、计划和行动的物理AI阶段。
不可否认的是,在当今数字化浪潮的推动下,AI正以前所未有的速度改变着我们的生活、工作和社会结构。可以预见在2025年,AI领域将迎来一系列重大突破与改变,这些变革不仅源于技术的内在演进,也受到社会需求、环境和经济转型等外在因素的推动。
AI变革之因与驱动力:需求进化
从目前来看,AI领域的技术突破主要体现在大模型和多模态技术的深度融合上。例如,生成式AI能够处理文本、图像、音频和视频等多种数据类型,极大地拓展了其应用范围。行业大模型的发展,如针对医疗、金融和教育等特定行业的定制化模型,显著提升了产业数字化和决策效率。此外,具身智能(Embodied AI)的发展使AI具备类似人类的多感官和自主学习能力,进一步推动了AI与物理世界的交互。
而另一方面,大规模语言模型(LLM)和多模态大模型的突破,推动了AI在推理能力、自然语言处理和跨模态理解上的显著进步。AI基础设施的升级,包括算力的有效调度和高效协同运行,为AI技术的进一步发展提供了坚实基础。一个具体的例子就是,谷歌的TPU和英伟达的GPU等硬件技术的不断进步,为AI模型的训练和部署提供了强大的支持。
当然,我们也注意到人工智能的基础理论研究取得了重大进展,部分技术与应用达到了世界领先水平。在深度学习、自然语言处理和计算机视觉等领域不断涌现新的研究成果。研究者们探索了新的算法优化方法,如密度推断,以应对“规模定律”瓶颈,进一步提升了AI模型的性能。
AI在应用领域也有长足的发展。AI与量子计算、生物技术、绿色能源等领域的交叉融合,为AI技术的突破提供了新的可能性。例如,量子计算与AI的结合能够加速数据处理,支持复杂系统模拟和药物发现。此外,AI与科学的深度融合,如AlphaFold在蛋白质结构预测中的突破,为新药物设计和治疗方法的开发提供了支持。
除此之外,AI技术在医疗、金融、教育、法律等领域的广泛应用,推动了行业大模型的发展,并促进了数字化转型。例如,在医疗领域,AI技术能够帮助医生分析报告、加速药物发现,并预测蛋白质行为,从而推动个性化医疗的发展。此外,随着智能家居设备普及率的提高,AI技术被更广泛地融入日常生活,进一步推动了AI在消费领域的应用。
生成式AI的商业化落地:推动创意产业的变革
如果要问在2025年,AI行业最有可能实现应用落地并取得成果的,那必然首推生成式AI。毕竟,在过去的一年里,我们已经看到生成式AI在广告、电影、教育等领域实现广泛应用,并且这样的应用还在持续。生成式AI正在加速推动创意产业的变革,在内容创作领域,生成式AI能够生成高质量的图像、视频和文本,极大地提升了创作效率。据海通国际证券的研究,生成式AI在不同行业的应用中,其附加值主要体现在提高产出效率和降低生产成本上。此外,生成式AI还将进一步渗透到企业服务领域,通过与企业软件的结合,实现智能化的业务流程优化。
火山引擎、RollingAI和InfoQ研究中心联合撰写的《2024生成式AI商业落地白皮书》指出,生成式AI在零售、金融、汽车、医药、教育等多个领域展现了提升效率、降低成本和增强创新能力的潜力。然而,落地过程中仍面临诸多挑战,如评估价值、选择合适场景、构建基础设施等。华泰证券认为,第四范式通过将生成式AI与企业软件结合,促进了AI的商业化落地,显示出生成式AI在企业服务领域的应用潜力。
此外,A16Z在其报告《A16Z#26:生成式AI的机遇与挑战》中指出,尽管生成式AI在文本和图像领域取得了显著进展,但其商业化仍面临诸多挑战。报告强调基础设施供应商可能是生成式AI市场最大的赢家。微软通过Copilot等产品,展示了生成式AI在生产力工具中的应用潜力,而OpenAI则通过多样化商业模式(如订阅收费)实现了技术的商业化。
多模态大模型的统一构建:推动人机交互的新高度
在2025年,多模态大模型将进一步实现文本、视觉、音频等数据的融合,推动人机交互的新高度。我们知道,阿里巴巴达摩院发布的“通义千问”模型是国内首个实现模态表示、任务表示和模型结构统一的大模型。其采用Transformer Encoder-Decoder + ResNet结构,通过统一学习范式提升了效率,而这也是多模态大模型实现人机交互的一条必然路径。此外,多模态大模型将在智能机器人、自动驾驶、虚拟现实等领域实现广泛应用,进一步拓展AI的应用边界。
类似的观点还有,中国科学院自动化研究所紫东太初大模型研究中心常务副主任王金桥提出,全模态大模型的核心目标是通过统一架构完成多模态数据的感知、理解、生成和推理任务,提供通用解决方案。北京科技大学王耀祖教授则强调,多模态大模型应实现模态间的无缝交互与信息融合,构建一个统一的智能体系。
微软研究团队总结了多模态大模型的七大研究主题,包括视觉理解、视觉生成、统一视觉模型、LLM加持的多模态模型等。他们指出,统一视觉模型的研究方向从静态模型向可提示模型转变,并强调指令微调的重要性。智源研究院发布的Emu3模型展示了原生多模态大模型的能力,能够统一理解和生成视频、图像和文本,为未来多模态大模型的发展提供了技术前景。
具身智能的突破性进展:机器人技术获得广泛应用
我们将看到在2025年,具身智能的研究将取得显著成果,推动机器人技术在家庭、医疗和工业领域的广泛应用。例如在工业制造场景中,具身智能解决方案已应用于自动化装配、焊接和搬运等。此外,具身智能将在医疗护理机器人、城市管理等领域带来革命性变化,进一步提升人类生活的便利性和效率。
对于具身智能的发展,很多专家给予了足够的信心。中国科学院院士乔红指出,具身智能正从实验室走向实际应用,未来将在医疗护理机器人、智能制造、城市管理等领域带来革命性变化。北京工业大学张昌盛教授则认为,当前具身智能理论框架和算法仅能实现弱具身智能,需要从多学科交叉角度探索强具身智能。
斯坦福大学李飞飞教授认为,具身智能需要具备与真实物理世界交互的能力,以完成各种任务。她强调具身智能不仅仅是处理信息的能力,还包括对周围环境的整体需求。而伯克利大学的研究团队提出端到端架构作为具身智能的主要技术路线,并通过Sim2Real数据集实现了业内顶尖的灵巧手操作能力。
AI与自动驾驶技术的商业化运营:为智慧交通提供新动力
毫无疑问,自动驾驶是AI最能大显身手的领域。在2025年,自动驾驶汽车将在部分城市实现商业化运营,为智慧交通提供新动力。当前,文远知行在新加坡启动了首个商业化运营的自动驾驶环卫项目,标志着自动驾驶技术在特定场景下的商业化落地。此外,蘑菇车联通过“单车智能+车路协同”的技术路线,实现了大规模商业化落地,并通过智慧城市建设形成技术与商业的双闭环,这样的范例将在更多的城市得到复制与应用。
武汉理工大学邱志军教授认为,人工智能在资本市场得到了认可,但智能汽车的商业化落地仍需探索,尤其是需要构建数据、规则和反馈的闭环系统。据T3出行CEO崔大勇预测,2027年将是自动驾驶大规模商业化的拐点。他认为,随着AI大模型的普及和成本下降,自动驾驶技术将逐步走向规模化应用。
加州大学伯克利分校Dr. Allen Yang在伯克利机器人自动驾驶平台ROAR上分享了自动驾驶技术的最新进展,并提出了“AI赛车”这一前沿概念。他认为,自动驾驶技术在极限条件下的潜能无限。Waymo和Cruise在美国部分地区已经实现了L4级别的Robotaxi商业化运营,这些公司通过感知、预测和规划算法的优化,推动了自动驾驶技术的商业化。
AI与VR/AR技术的融合:提供更具创造性的沉浸式体验
在2025年,AI与VR/AR技术的结合将为用户提供更具有创造性的沉浸式体验,推动娱乐、教育和工业设计等领域的发展。在医疗领域,AI驱动的手术模拟器允许医生在虚拟环境中练习复杂手术,减少实际操作中的风险。在教育领域,VR/AR技术通过沉浸式学习环境提升了学生的学习体验,AI可以根据学生的行为和偏好调整教学内容,实现个性化教育。
对此,上海科技大学王蕴辉教授指出,AI将在VR/AR的渲染、制作和交互方面发挥重要作用。例如,深度学习技术可以用于图像渲染和内容生成,而感知交互技术则结合了生理信号与虚拟现实的反馈机制,从而提升用户体验。中国工程院院士赵沁平分析了中国VR/AR市场的现状,并预测全球市场将在未来几年内达到1450亿美元。
还有更多的研究者也聚焦于AI与VR/AR技术的融合。Absolut Solution创始人Andrey Boguslavskiy指出,AI与AR/VR的融合需要克服多种技术挑战,包括数据处理、实时性要求以及伦理问题。Mona M. Soli的研究聚焦于3D物体检测技术在MR和VR中的应用,并探讨了AI如何通过行为分析和用户偏好建模来提升用户体验。Huang et al.在IEEE国际人工智能与虚拟现实国际会议上展示了多种创新应用,包括基于轨迹预测的360度视频渲染、可穿戴VR游戏控制器设计、虚拟犯罪现场模拟等。
人工智能五大突破与变革,重塑未来科技版图
尽管对AI在2025年的发展,我们给不出一个详细且准确的路线图与时间表,但有些感觉是一定的,并且随着时间的推移会越来越显著而深切。
AI不再是工具,而是人类智慧的延伸。AI技术的发展正逐渐模糊人与机器之间的界限,未来AI将成为人类不可或缺的伙伴,共同探索未知领域。
AI将开启一个全新的智能纪元。2025年也许会被视为AI技术的一道分水岭,让人期待而又恐惧的通用人工智能时代或将到来,而这一突破将深刻改变人类的生活方式和社会结构。
无论如何,AI将像空气一样无处不在。
来源:飞象网CCTIME