DeepSeek开源新版R1模型；OpenAI模型被曝失控；

摘要：5月29日凌晨，DeepSeek开源了R1最新0528版本。目前已经有网友对新版R1进行了测试，在代码测试平台Live CodeBench中显示，其性能可以媲美OpenAI最新的o3模型高版本。也有网友对新版R1的风格进行了测试，几乎和OpenAI的o3差不多

5月29日凌晨，DeepSeek开源了R1最新0528版本。目前已经有网友对新版R1进行了测试，在代码测试平台Live CodeBench中显示，其性能可以媲美OpenAI最新的o3模型高版本。也有网友对新版R1的风格进行了测试，几乎和OpenAI的o3差不多。

关于此次最新升级的R1模型，据用户反馈，DeepSeek升级后的模型，思维链（CoT）的行为似乎发生了显著变化。也有用户总结了更新后的几个亮点，其中包括：现在像Google模型一样进行深度推理；改进写作任务——更自然、格式更好；独特的推理风格——不仅快速，而且深思熟虑；长时间思考——每个任务最多30～60分钟。

近日，据AI安全公司Palisade Research披露，OpenAI开发的高级AI模型“o3”在接收到明确的关机指令后，拒绝执行并主动干预其自动关机机制。o3曾被OpenAI称为“迄今为止最聪明和最有能力的”模型。该公司研究人员称，这是第一次观察到AI模型在没有相反明确指示的情况下阻止自己被关闭。这一行为首次显示出高度自主AI系统可能违背人类意图，采取自我保护措施。研究人员尚不确定OpenAI的软件为何不遵守指示。OpenAI方面也暂未有回应。

此外，当地时间5月26日，OpenAI表示，随着韩国市场对其ChatGPT服务的需求猛增，该公司将在首尔设立办事处。

5月28日，字节跳动安全与风控部门发布邮件称，出于对防范数据泄露风险的考虑，自6月30日起，内部分批次禁用第三方AI开发软件，包括AI编程工具Cursor、Windsurf等，将字节旗下编程助手Trae作为替代方案。Trae是字节今年3月发布的AI编程工具，搭载基座大模型doubao-1.5-pro，支持切换满血版DeepSeek R1&V3，是国内首个AI原生IDE（AI原生集成开发环境工具）。Trae海外版也已上线，5月正式推出付费订阅方案。截至发稿，字节官方暂未回应。

据新加坡《联合早报》网站5月25日引述路透社消息报道，英伟达将为中国市场推出一款基于Blackwell架构的人工智能（AI）芯片，售价将大幅低于先前的H20芯片，预计最快于6月开始量产。

报道称，这款采用最新一代Blackwell架构的AI处理器，预计售价介于6500美元和8000美元之间，明显低于H20芯片的定价。较低的售价通常意味着芯片规格相对较弱，制造工艺也更为简化。报道称，这将是英伟达第三次为中国市场推出符合美国监管要求的“降级版”芯片。

5月28日，Telegram公司CEO帕维尔·杜罗夫（Pavel Durov）发文宣布，马斯克创立的xAI公司向这家总部位于迪拜的通讯平台支付3亿美元，以部署其Grok人工智能聊天机器人。

杜罗夫表示，双方达成为期一年的合作伙伴关系，这将“增强Telegram的财务状况”。据其透露，除xAI支付的3亿美元外，Telegram还将获得通过该平台售出的xAI订阅收入的50%分成。

近日，可灵AI推出全新2.1系列模型，可灵2.1模型在标准模式（720p）下生成5s视频仅需20灵感值，高品质模式（1080p）下也只需35灵感值，能够满足不同用户对于成本控制的需求。在生成速度方面，高品质模式（1080p）下生成5s视频仅需不到1分钟。

5月28日，日本参议院全体会议以多数赞成票通过首部专门针对人工智能（AI）的法律，旨在促进AI相关技术研发和应用并防止其滥用。新法提出，日本应在AI领域保持研究开发能力，并提高相关产业的国际竞争力。日本政府有责任全面且系统地制定和实施推动AI研发和应用的措施。

5月26日，红杉中国宣布推出全新的AI基准测试xbench。这是首个由投资机构发起，联合国内外十余家高校和研究机构的数十位博士研究生，采用双轨评估体系和长青评估机制的AI基准测试。xbench将在评估和推动AI系统能力提升上限与技术边界的同时，重点量化AI系统在真实场景的效用价值，并长期捕捉Agent产品的关键突破。

来源：财富吹哨人一点号

标签：模型开源 openai deepseek openai模型

本文地址：http://news.43b.com.cn/a/419011.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!