整理 | 屠敏摘要:今天,法国 AI 初创公司 Mistral AI 正式发布了一款新的开源模型——Mistral Small 3.1。官方称,这款模型号称同级别中最强的开源模型,不仅表现优于 Google、OpenAI 等类似竞品,还在仅使用 240 亿参数的情况下处理文本和图
在大模型时代,很多初创公司的技术实力并不逊色于大厂。
今天,法国 AI 初创公司 Mistral AI 正式发布了一款新的开源模型——Mistral Small 3.1。官方称,这款模型号称同级别中最强的开源模型,不仅表现优于 Google、OpenAI 等类似竞品,还在仅使用 240 亿参数的情况下处理文本和图像,并在多个任务上达到或超过这些大厂模型的表现。
相比前代 Mistral Small 3,新版本在文本处理、多模态理解等方面进一步提升,同时将上下文窗口扩展至 128K tokens。此外,Mistral Small 3.1 还能以每秒 150 tokens 的推理速度运行,超过了同类模型 Gemma 3 和 GPT-4o Mini。
Mistral 走了一条和大公司完全不同的路,选择用 Apache 2.0 开源协议发布模型。官方表示,如今的 AI 应用不仅要能处理文本,还要支持多模态输入、多语言,以及长文本,同时运行要快,性能要高。Mistral Small 3.1 在这些方面表现出色,甚至超过了很多封闭的商用小型模型。
众所周知,Mistral AI 由前 Google DeepMind 和 Meta 研究员于 2023 年创立,短短时间内就成为欧洲最受瞩目的 AI 创业公司。目前,公司估值约 60 亿美元,累计融资 10.4 亿美元。虽然这个估值在欧洲创业公司中已经相当亮眼,但相比 OpenAI 的 800 亿美元,或者 Google、Microsoft 这样的科技巨头,仍然只是个零头。
尽管如此,Mistral AI 在欧洲市场表现不俗。旗下的 AI 聊天助手 Le Chat 在 移动端上线两周内,下载量就突破 100 万次。
时下发布的 Mistral Small 3.1,能够处理各种任务,包括执行指令、对话辅助、理解图片、调用函数等。它适用于企业级和个人用户的 AI 应用,为智能助手、自动化流程等提供了坚实的基础。
主要特点和能力:
轻量化部署:Mistral Small 3.1 运行需求低,可在一张 RTX 4090 显卡或 32GB 内存的 Mac 上运行,适合本地设备部署。
对话流畅、响应迅速:特别适用于虚拟助手等需要快速、准确回复的应用场景。
低延迟函数调用:可在自动化流程或 AI 代理任务中快速执行函数,提高效率。
支持定制优化:可以针对特定领域进行微调,让模型更擅长法律咨询、医疗诊断、技术支持等专业任务。
强大的推理能力:Mistral 开源模型的社区生态活跃,许多优秀的推理模型基于 Mistral Small 3 发展而来,例如 Nous Research 开发的 DeepHermes 24B。为支持进一步优化,官方提供了**基础版本(Base)和指令优化版(Instruct)**的模型权重,方便用户自行定制。
在发布此模型之际,官方还提供了具体的性能对比数据,其中部分来自其他厂商的公开数据,未公开的部分则基于统一的测试框架进行评估。
文本基准测试:
多模态基准测试:
支持多种语言的能力:
长文本:
预训练性能
Mistral 还发布了 Mistral Small 3.1 的预训练基础模型。
全部预训练
适用场景
根据官方透露,Mistral Small 3.1 可广泛应用于企业级和消费级 AI 应用,特别是在涉及多模态理解的场景,例如:
🔹 文档审核:用于身份验证、合同解析等
🔹 医疗诊断:辅助医生进行影像分析
🔹 本地设备图像处理:在手机或电脑上进行图片识别
🔹 质量检测:制造业中的视觉检查
🔹 安防监控:目标检测,识别异常行为
🔹 客服支持:基于图片的智能客服系统
🔹 通用 AI 助手:日常任务辅助
当前 Mistral Small 3.1 的 Base(https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Base-2503)和 Instruct 版本(https://huggingface.co/mistralai/Mistral-Small-3.1-24B-Instruct-2503)已上线 Hugging Face,用户可直接下载使用。
云端体验:
API 试用:开发者可以在 Mistral AI 的 La Plateforme 在线测试该模型(https://mistral.ai/news/la-plateforme)。
Google Cloud Vertex AI 已上线该模型,可供企业部署。
即将支持 NVIDIA NIM 和 Microsoft Azure AI Foundry,预计几周后上线。
来源:裴裴科技智慧