DeepSeek开源新版R1模型;OpenAI模型被曝失控;

B站影视 内地电影 2025-05-31 12:23 1

摘要:5月29日凌晨,DeepSeek开源了R1最新0528版本。目前已经有网友对新版R1进行了测试,在代码测试平台Live CodeBench中显示,其性能可以媲美OpenAI最新的o3模型高版本。也有网友对新版R1的风格进行了测试,几乎和OpenAI的o3差不多

5月29日凌晨,DeepSeek开源了R1最新0528版本。目前已经有网友对新版R1进行了测试,在代码测试平台Live CodeBench中显示,其性能可以媲美OpenAI最新的o3模型高版本。也有网友对新版R1的风格进行了测试,几乎和OpenAI的o3差不多。

关于此次最新升级的R1模型,据用户反馈,DeepSeek升级后的模型,思维链(CoT)的行为似乎发生了显著变化。也有用户总结了更新后的几个亮点,其中包括:现在像Google模型一样进行深度推理;改进写作任务——更自然、格式更好;独特的推理风格——不仅快速,而且深思熟虑;长时间思考——每个任务最多30~60分钟。

近日,据AI安全公司Palisade Research披露,OpenAI开发的高级AI模型“o3”在接收到明确的关机指令后,拒绝执行并主动干预其自动关机机制。o3曾被OpenAI称为“迄今为止最聪明和最有能力的”模型。该公司研究人员称,这是第一次观察到AI模型在没有相反明确指示的情况下阻止自己被关闭。这一行为首次显示出高度自主AI系统可能违背人类意图,采取自我保护措施。研究人员尚不确定OpenAI的软件为何不遵守指示。OpenAI方面也暂未有回应。

此外,当地时间5月26日,OpenAI表示,随着韩国市场对其ChatGPT服务的需求猛增,该公司将在首尔设立办事处。

5月28日,字节跳动安全与风控部门发布邮件称,出于对防范数据泄露风险的考虑,自6月30日起,内部分批次禁用第三方AI开发软件,包括AI编程工具Cursor、Windsurf等,将字节旗下编程助手Trae作为替代方案。Trae是字节今年3月发布的AI编程工具,搭载基座大模型doubao-1.5-pro,支持切换满血版DeepSeek R1&V3,是国内首个AI原生IDE(AI原生集成开发环境工具)。Trae海外版也已上线,5月正式推出付费订阅方案。截至发稿,字节官方暂未回应。

据新加坡《联合早报》网站5月25日引述路透社消息报道,英伟达将为中国市场推出一款基于Blackwell架构的人工智能(AI)芯片,售价将大幅低于先前的H20芯片,预计最快于6月开始量产。

报道称,这款采用最新一代Blackwell架构的AI处理器,预计售价介于6500美元和8000美元之间,明显低于H20芯片的定价。较低的售价通常意味着芯片规格相对较弱,制造工艺也更为简化。报道称,这将是英伟达第三次为中国市场推出符合美国监管要求的“降级版”芯片。

5月28日,Telegram公司CEO帕维尔·杜罗夫(Pavel Durov)发文宣布,马斯克创立的xAI公司向这家总部位于迪拜的通讯平台支付3亿美元,以部署其Grok人工智能聊天机器人。

杜罗夫表示,双方达成为期一年的合作伙伴关系,这将“增强Telegram的财务状况”。据其透露,除xAI支付的3亿美元外,Telegram还将获得通过该平台售出的xAI订阅收入的50%分成。

近日,可灵AI推出全新2.1系列模型,可灵2.1模型在标准模式(720p)下生成5s视频仅需20灵感值,高品质模式(1080p)下也只需35灵感值,能够满足不同用户对于成本控制的需求。在生成速度方面,高品质模式(1080p)下生成5s视频仅需不到1分钟。

5月28日,日本参议院全体会议以多数赞成票通过首部专门针对人工智能(AI)的法律,旨在促进AI相关技术研发和应用并防止其滥用。新法提出,日本应在AI领域保持研究开发能力,并提高相关产业的国际竞争力。日本政府有责任全面且系统地制定和实施推动AI研发和应用的措施。

5月26日,红杉中国宣布推出全新的AI基准测试xbench。这是首个由投资机构发起,联合国内外十余家高校和研究机构的数十位博士研究生,采用双轨评估体系和长青评估机制的AI基准测试。xbench将在评估和推动AI系统能力提升上限与技术边界的同时,重点量化AI系统在真实场景的效用价值,并长期捕捉Agent产品的关键突破。

来源:财富吹哨人一点号

相关推荐