不听人类指挥,OpenAI模型拒绝关闭;红杉中国推出AI测评工具

B站影视 内地电影 2025-05-27 11:12 3

摘要:据新浪财经,当地时间5月25日,英国《每日电讯报》报道,美国开放人工智能研究中心(OpenAI)公司新款人工智能(AI)模型o3不听人类指令,拒绝自我关闭。

AI 快讯

不听人类指挥,OpenAI模型拒绝关闭

据新浪财经,当地时间5月25日,英国《每日电讯报》报道,美国开放人工智能研究中心(OpenAI)公司新款人工智能(AI)模型o3不听人类指令,拒绝自我关闭。

报道说,人类专家在测试中给o3下达明确指令,但o3篡改计算机代码以避免自动关闭。o3模型是OpenAI“推理模型”系列的最新版本,旨在为ChatGPT提供更强大的问题解决能力。OpenAI曾称o3为“迄今最聪明、最高能”的模型。美国AI安全机构帕利塞德研究所说,o3破坏关闭机制以阻止自己被关闭,“甚至在得到清晰指令时”。这家研究所说:“据我们所知,这是AI模型首次被发现在收到……清晰指令后阻止自己被关闭。”

《2025年度“人工智能+”榜单》启动征集,寻找AI时代的领军企业与应用案例

目前《2025年度“人工智能+”榜单》正在接受早期自主报名。自2023年第一次征集以来,已有超2600家企业报名。

百度、华为、科大讯飞等龙头企业连续两年入选,超100家初创企业第一次报名便入选,入榜企业遍布金融、医疗、教育、消费、电商、零售、营销、影视、传媒、文娱、农业、工业、制造业等20多个产业和领域。如果你所在的企业是AI领军企业,或者你所在的团队正在实践AI应用案例,欢迎报名参选,为公司和团队申请下对应的AI荣誉(《2025年度“人工智能+”企业》或《2025年度“人工智能+”案例》)。

OpenAI拟设立首尔办事处

当地时间5月26日,OpenAI表示,随着韩国市场对其ChatGPT服务的需求猛增,该公司将在首尔设立办事处。这将是继日本、新加坡之后,OpenAI在亚洲设立的第三个办事处。OpenAI称,韩国是美国以外ChatGPT付费用户最多的国家,公司已经开始招聘员工,以支持与韩国的合作,并预计在未来几个月内公布更多相关细节。(中国新闻网)

美团CEO王兴:将继续加大投资开发大语言模型

5月26日消息,在今日财报业绩会上表示,美团CEO王兴方面表示,目前的新代码中有52%左右是由AI生成的,有90%以上的工程师团队成员广泛使用AI编码工具,并将继续加大投资开发大语言模型。据王兴透露,美团将资源分配给基础设施,还在招聘顶尖AI人才,“确保这方面在中国有最好的团队。”

红杉中国推出AI 测评工具

红杉认为,随着大语言模型的快速发展和AI Agent 进入规模化应用阶段,被广泛使用的基准测试面临一个日益尖锐的问题:第三方基准并不能完全客观反映 AI 的能力。

于是他们在今天推出一款AI 基准测试工具 xbench。

xbench 采用双轨评估体系,将 AI 评测任务分为两条互补的主线:(1)评估 AI 系统的能力上限与技术边界;(2)量化 AI 系统在真实场景的效用价值(Utility Value)。红杉中国称,xbench 会重点量化 AI 系统在真实场景的效用价值,捕捉 Agent 产品的关键突破。

全球首款Office 智能体:昆仑万维天工超级智能体 App 上线

昆仑万维集团5月26日宣布:昆仑万维天工超级智能体(Skywork Super Agents)App 正式上线。这是全球首款基于 AI Agent 架构的 Office 智能体手机 App,标志着“AI Office 智能体”时代从桌面端全面迈向移动端。据介绍,天工超级智能体 App 是全球首个覆盖全场景办公与多模态创作的移动智能体平台,支持通过三大专家级智能体与一个通用智能体的协同工作。

资本洞察

铖联科技完成近两亿元B+轮融资

近日,口腔数字化领域领军企业铖联科技宣布成功完成近两亿元人民币的B+轮融资。本轮融资由知名投资机构达晨资本和高特佳投资联合领投,截至本轮融资完成,铖联科技累计融资额已超过5亿元人民币。资本市场的高度认可将为铖联科技在全球化与品牌升级战略上的持续推进注入强劲动能。

中海储能完成超亿元Pre A++轮融资

中海储能近日宣布完成超亿元Pre A++轮融资。此次融资由蚂蚁集团领投,君恒投资、北京昌平中小企业成长投资基金跟投,资金将主要用于技术研发及产能扩大。

具身智能公司魔法原子完成新一轮数亿元融资

据悉,具身智能机器人公司魔法原子宣布完成数亿元新一轮战略融资。投资方包括禾创致远、芯联资本、华映资本、晓池资本、元禾厚望等。魔法原子称,新资金将用于具身智能核心技术迭代研发,VLA 模型搭建,加速推动机器人在工业、商业场景落地。

赛那德完成数千万元B+轮融资

近日,赛那德完成数千万元B+轮融资,本轮投资方为硅港资本,指数资本担任独家财务顾问。融资资金将主要用于技术升级、产品迭代和商业化拓展。赛那德(SENAD)是全球具身智能装卸机器人领域的技术研发商,率先突破工业场景中”感知-决策-执行”闭环系统产业化难题。构建了物流行业首个多模态VLM大模型,通过”工业大脑+机器人小脑”双核架构实现毫米级操作精度。

科技前瞻

天问二号任务计划5月29日实施发射

记者5月26日从国家航天局了解到,经工程任务指挥部综合研判决策,行星探测工程天问二号任务计划5月29日实施发射。天问二号任务计划通过一次发射完成多项探测任务,包括对小行星2016HO3进行伴飞、取样并返回地球,以及对主带彗星311P开展伴飞探测。(央视新闻)

Figure机器人官宣更新:F.03正式行走

近日,人形机器人公司Figure首席执行官布雷特·阿德科克(Brett Adcock)在社交平台发文称,F.03已正式开始行走,并表示“这是我见过的最先进的硬件”。随后,阿德科克重申Figure正在招聘数百个岗位,其中包括多名AI工程师。(财联社)

阿维塔12 2025款上市,价格区间26.99-42.99万元

5月26日消息,阿维塔科技正式发布阿维塔12 2025款,新车涵盖增程与纯电共6个版本,官方指导价26.99-42.99万元,限时优惠后价格可低至25.99万元起。新款车型在设计、配置和智能化方面全面升级,新增岱红内饰及多款21英寸运动轮毂,四驱纯电车型搭载华为三激光雷达和英国之宝音响等高阶配置。同时,购车用户可享万元现金优惠及最高4万元配置权益。(新京报)

来源:创业家一点号

相关推荐