DeepMind最新研究:逆向思维训练LLM可大幅提升AI推理能力
1822 年,电学之父法拉第在日记中写到“既然通电能够产生磁力,为什么不能用磁铁产生电流呢?我一定要反过来试试!”。于是在 1831 年,第一台发电机被发明,推动了人类进入电气化时代。
1822 年,电学之父法拉第在日记中写到“既然通电能够产生磁力,为什么不能用磁铁产生电流呢?我一定要反过来试试!”。于是在 1831 年,第一台发电机被发明,推动了人类进入电气化时代。
这十二天里,几大国际巨头疯狂地展开了AI军备竞赛,AI正以惊人的速度逼近人类的能力边界,他们在逻辑推理、问题解决、模仿人的抽象思维等方面正在迅速提升,甚至在某些方面已经超过了99%的人类。
导读本次分享题目为《大模型推理引擎国产化思考和实践》,主要聚焦于大模型推理引擎国产化的重要性与相关背景,文中对比了国产芯片与国际芯片的性能,强调硬件对软件优化的影响。还深入探讨了国产化实践中的挑战与机遇,包括架构比较、性能优化、框架兼容性及模型适配。强调自研推
Anthropic联创发文表示,谁要是说Scaling Law撞墙了,那他绝对错了!在25年,AI靠测试时计算还会继续加速。不过,随之而来的推理成本也是天价,o3的每个任务成本高达20美元,怎么办?
在GB200和B200发布6个月后,英伟达就宣布将推出全新的GPU GB300和B300。外界看来似乎是一个循序渐进的过程,但事实上,这是非常高效的迭代。全新GPU为大模型的推理和训练性能带来巨大的提升,对大模型公司和存储供应商来说,无疑是一份巨大的圣诞礼物。
国家知识产权局信息显示,广州壁仞集成电路有限公司申请一项名为“模型推理方法及装置”的专利,公开号CN 119180342 A,申请日期为2024年10月。
12月20日,美国开放人工智能研究中心(OpenAI)介绍了其最新的人工智能(AI)推理模型——o3及其轻量版o3-mini。该公司宣称,o3具备更先进、近似人类的推理能力,在代码编写、数学竞赛和掌握人类博士级别的科学知识等方面,均超越了其“前辈”o1。
人类拥有视觉空间智能,可以通过连续的视觉观察记忆空间。然而,在百万规模的视频数据集上训练的多模态大语言模型(MLLMs)也能从视频中进行“空间思维”吗?
随着2025年的脚步日益临近,各大社交平台纷纷推出年度回顾功能,而在人工智能领域,一场关于AI模型年度表现的评测也悄然落幕。近日,智源研究院公布了Flageval“百模”评测的详细结果,揭示了国产大模型与海外顶尖模型之间的激烈竞争态势。
此项研究成果已被 EMNLP 2024 录用。该论文的第一作者是中国人民大学高瓴人工智能学院硕士生程传奇,目前为蚂蚁技术研究院实习生,其主要研究领域为对话系统和多模态大模型。蚂蚁技术研究院副研究员关健为共同第一作者。
OpenAI 的研究人员提出了一种名为“深思熟虑的对齐”(Deliberative Alignment)的新方法,以提升 AI 模型安全性,并已在 o 系列模型中取得显著成效。
从11月中旬开始,OpenAI、微软、谷歌、字节跳动、百度和智谱等科技公司都召开了与大模型相关的发布会,推出了一系列新模型、新应用和新产品,其中OpenAI的12天连续直播更是开启了科技公司发布会的新流行。
·第一步,要明确可以肯定的纸箱有多少个,目测的是12个,上面第一行有一个是明确的,第二行有六个是明确的,第三行有四个是明确的,第四行是一个。所以非常肯定的是一定有12个纸箱,看得到的。
节目中,戚薇的记忆能力,李雪琴的逻辑思维能力,李一桐的变装能力,张雨绮竟然变得沉稳起来,每个人的表现都能和节目融为一体,从而产生的代入感让观众有一种身临其境的感觉。看一群智慧和美貌并存的美女在表演不要太爽了,对了在看节目的时候还有意外的收获。
哈佛大学、斯坦福大学、微软等顶尖学府和机构的多名医学、AI专家日前联合开展了一项研究,对OpenAI旗下o1-preview模型在医学推理任务的表现进行了综合评估。
一家零售巨头正在进行年终促销活动,数据分析团队接到了紧急任务:在两个小时内完成全国门店销量预测、库存分配优化,并生成一份针对重点区域的促销策略报告。面对突如其来的高强度数据处理需求,传统的数据平台让团队陷入困境:来自各地门店的销售数据分散在多个系统中,整合效率
对 AI 研究者来说,数学既是一类难题,也是一个标杆,能够成为衡量 AI 技术的发展重要尺度。近段时间,随着 AI 推理能力的提升,使用 AI 来证明数学问题已经成为一个重要的研究探索方向。著名数学家陶哲轩就是这一方向的推动者,他曾表示:未来数学家可以通过向类
AI 在医学领域也能发挥重要的作用。一项由哈佛大学、斯坦福大学等多所顶尖机构联合开展的研究显示,OpenAI 的 o1-preview 模型在多项医学推理任务中表现出惊人的能力,甚至超越了人类医生。为了进一步评估 o1-preview 的临床推理能力,研究人员
前不久,2024 re:Invent中国行北京站发布会上,亚马逊云科技围绕计算服务、存储服务、数据库服务、数据分析服务以及AI推理推出了通用自研芯片Amazon Graviton4、Amazon S3 Tables、Amazon S3 Metadata、Ama
在 OpenAI “十二连发”活动的最后一天,新一代推理模型 o3 终于压轴登场!OpenAI 首席执行官山姆-奥特曼(Sam Altman)透露了其下一代基础模型,也是最近发布的 o1 系列推理人工智能的后继者,被命名为 o3 和 03-mini。