性能超GPT-4o Mini!24B参数大模型Mistral Small 3.1正式发布

B站影视 欧美电影 2025-03-19 00:50 1

摘要:今天,法国 AI 初创公司 Mistral AI 正式发布了一款新的开源模型——Mistral Small 3.1。官方称,这款模型号称同级别中最强的开源模型,不仅表现优于 Google、OpenAI 等类似竞品,还在仅使用 240 亿参数的情况下处理文本和图

整理 | 屠敏

在大模型时代,很多初创公司的技术实力并不逊色于大厂。

今天,法国 AI 初创公司 Mistral AI 正式发布了一款新的开源模型——Mistral Small 3.1。官方称,这款模型号称同级别中最强的开源模型,不仅表现优于 Google、OpenAI 等类似竞品,还在仅使用 240 亿参数的情况下处理文本和图像,并在多个任务上达到或超过这些大厂模型的表现。

相比前代 Mistral Small 3,新版本在文本处理、多模态理解等方面进一步提升,同时将上下文窗口扩展至 128K tokens。此外,Mistral Small 3.1 还能以每秒 150 tokens 的推理速度运行,超过了同类模型 Gemma 3 和 GPT-4o Mini。

Mistral 走了一条和大公司完全不同的路,选择用 Apache 2.0 开源协议发布模型。官方表示,如今的 AI 应用不仅要能处理文本,还要支持多模态输入、多语言,以及长文本,同时运行要快,性能要高。Mistral Small 3.1 在这些方面表现出色,甚至超过了很多封闭的商用小型模型。

众所周知,Mistral AI 由前 Google DeepMind 和 Meta 研究员于 2023 年创立,短短时间内就成为欧洲最受瞩目的 AI 创业公司。目前,公司估值约 60 亿美元,累计融资 10.4 亿美元。虽然这个估值在欧洲创业公司中已经相当亮眼,但相比 OpenAI 的 800 亿美元,或者 Google、Microsoft 这样的科技巨头,仍然只是个零头。

尽管如此,Mistral AI 在欧洲市场表现不俗。旗下的 AI 聊天助手 Le Chat 在 移动端上线两周内,下载量就突破 100 万次。

时下发布的 Mistral Small 3.1,能够处理各种任务,包括执行指令、对话辅助、理解图片、调用函数等。它适用于企业级和个人用户的 AI 应用,为智能助手、自动化流程等提供了坚实的基础。

主要特点和能力:

轻量化部署:Mistral Small 3.1 运行需求低,可在一张 RTX 4090 显卡或 32GB 内存的 Mac 上运行,适合本地设备部署。

对话流畅、响应迅速:特别适用于虚拟助手等需要快速、准确回复的应用场景。

低延迟函数调用:可在自动化流程或 AI 代理任务中快速执行函数,提高效率。

支持定制优化:可以针对特定领域进行微调,让模型更擅长法律咨询、医疗诊断、技术支持等专业任务。

强大的推理能力:Mistral 开源模型的社区生态活跃,许多优秀的推理模型基于 Mistral Small 3 发展而来,例如 Nous Research 开发的 DeepHermes 24B。为支持进一步优化,官方提供了**基础版本(Base)和指令优化版(Instruct)**的模型权重,方便用户自行定制。

在发布此模型之际,官方还提供了具体的性能对比数据,其中部分来自其他厂商的公开数据,未公开的部分则基于统一的测试框架进行评估。

文本基准测试:

多模态基准测试:

支持多种语言的能力:

长文本:

预训练性能

Mistral 还发布了 Mistral Small 3.1 的预训练基础模型。

全部预训练

适用场景

根据官方透露,Mistral Small 3.1 可广泛应用于企业级和消费级 AI 应用,特别是在涉及多模态理解的场景,例如:

🔹 文档审核:用于身份验证、合同解析等

🔹 医疗诊断:辅助医生进行影像分析

🔹 本地设备图像处理:在手机或电脑上进行图片识别

🔹 质量检测:制造业中的视觉检查

🔹 安防监控:目标检测,识别异常行为

🔹 客服支持:基于图片的智能客服系统

🔹 通用 AI 助手:日常任务辅助

当前 Mistral Small 3.1 的 Base(https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Base-2503)和 Instruct 版本(https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Instruct-2503)已上线 Hugging Face,用户可直接下载使用。

云端体验:

API 试用:开发者可以在 Mistral AI 的 La Plateforme 在线测试该模型(https://mistral.ai/news/la-plateforme)。

Google Cloud Vertex AI 已上线该模型,可供企业部署。

即将支持 NVIDIA NIM 和 Microsoft Azure AI Foundry,预计几周后上线。

来源:裴裴科技智慧

相关推荐