modelscope v1.29.1版本详解：Python 3.12兼容性、VLLM下载修复与

摘要：ModelScope作为一站式开源AI模型即服务（MaaS）平台，持续优化其功能与性能，致力于为开发者提供更加流畅高效的使用体验。最新发布的v1.29.1版本虽为小版本更新，却包含了多项重要改进，主要集中在Python 3.12兼容性支持、特定模型下载问题的修

ModelScope作为一站式开源AI模型即服务（MaaS）平台，持续优化其功能与性能，致力于为开发者提供更加流畅高效的使用体验。最新发布的v1.29.1版本虽为小版本更新，却包含了多项重要改进，主要集中在Python 3.12兼容性支持、特定模型下载问题的修复以及平台安全性的进一步增强。这些更新不仅提升了框架的稳定性和适用范围，还确保了用户在处理大型语言模型时能够获得更加可靠的体验。本文将深入解析v1.29.1版本的主要更新内容、技术细节及其实际应用价值，帮助开发者全面掌握新版优势与应用场景。

ModelScope平台自推出以来，已汇聚了来自阿里云达摩院及全球AI社区的先进机器学习模型，覆盖自然语言处理（NLP）、计算机视觉（CV）、语音识别、多模态和科学计算等多个领域，提供从模型探索、推理、训练到部署的全流程服务。最新版本的发布再次体现了其持续迭代和快速响应开发者需求的能力。

背景与需求
随着Python语言的持续演进，Python 3.12版本带来了多项性能改进和新特性。然而，新版本也往往意味着与现有代码库可能存在兼容性问题。ModelScope v1.29.1版本及时响应这一变化，修复了在Python 3.12及以上版本中参数解析器（argument parser）的兼容性问题，确保开发者能够在新版Python环境中无缝使用ModelScope框架的所有功能。

技术实现分析
此次更新主要修复了cli_argument_parser.py中的intermixed参数缺失问题。参数解析器是命令行工具与用户交互的关键组件，负责解析用户输入的参数并传递给相应的处理函数。在Python 3.12中，argparse模块的内部实现发生了一些变化，导致原有的参数解析逻辑需要相应调整。

更新后的代码通过优化参数解析逻辑，确保在Python 3.12环境中能够正确解析各种参数组合，特别是处理混合位置参数和可选参数时更加稳定可靠。这使得ModelScope的命令行工具（如模型训练、推理和数据管理命令）在新版Python中能够正常工作，为开发者提供了版本选择的灵活性。

应用价值

• 未来兼容性保障：使开发者能够顺利过渡到Python新版本，利用其性能优势和新特性。

• 开发环境灵活性：团队可以在不同Python版本间自由选择，而无需担心框架兼容性问题。

问题背景
VLLM（Vectorized Large Language Model）是一个高性能推理引擎，专门用于大规模语言模型的部署和推理。在之前的ModelScope版本中，用户尝试从ModelScope Hub下载特定系列的大型语言模型（如deepseek、internvl和internlm模型）时遇到了困难。这些下载失败问题严重影响了用户的工作流程，特别是那些依赖这些模型进行研究和应用开发的团队。

修复内容
v1.29.1版本通过多项提交修复了这些模型的下载问题：

1. 扩展模型识别模式：在modelscope/utils/hf_util/patcher.py中增加了对'Intern.'和'Deepseek.'模式的识别，确保这些模型能够被正确解析和处理。

2. 文件模式匹配优化：扩大了允许下载的文件模式范围，现在包括*.txt文件，这对于包含额外配置或说明文档的模型尤为重要。

3. 信任远程代码逻辑调整：优化了模型加载时对远程代码的处理逻辑，在安全性和灵活性之间取得了更好平衡。

技术细节
该修复涉及ModelScope与HuggingFace Hub的交互逻辑。ModelScope通过智能补丁机制，确保即使模型原始设计针对HuggingFace生态系统，也能在ModelScope平台上顺利运行。具体来说，更新后的代码能够正确识别这些特殊架构的模型，并适配它们的配置文件结构和加载方式。

应用场景

• deepseek模型用户：能够无障碍地下载和使用deepseek系列大语言模型进行文本生成、代码补全等任务。

• 浦江实验室模型研究者：可以顺利获取internvl和internlm等视觉-语言多模态模型，用于跨模态理解与生成研究。

• 企业级应用部署：依赖这些大型语言模型构建商业应用的企业现在可以获得稳定的模型供应渠道。

安全增强背景
在机器学习领域，加载第三方模型时执行远程代码一直是一个潜在的安全风险。恶意模型可能包含有害代码，对用户系统造成威胁。为了提升平台安全性，ModelScope v1.29.1版本调整了trust_remote_code参数的默认行为。

具体变更

• 在modelscope/msdatasets/ms_dataset.py中，将trust_remote_code的默认值从True改为False。

• 在modelscope/msdatasets/utils/hf_datasets_util.py中同样进行了相应修改，确保数据集加载也遵循相同的安全原则。

安全与实践的平衡
这一变更体现了ModelScope对安全性的重视。虽然默认值改为False提高了安全性，但开发者仍然可以通过显式设置trust_remote_code=True来加载需要执行远程代码的模型，这在开发环境和可信源场景下仍然是必要的。框架同时提供了充分的警告信息，提醒用户只有在完全信任模型来源的情况下才启用此选项。

应用影响

• 增强生产环境安全性：降低了在生产服务器上意外执行恶意代码的风险。

• 开发者意识提升：促使开发者更加审慎地考虑是否真正需要信任远程代码。

• 合规性要求满足：帮助企业满足内部安全审计和合规性要求。

AIGC相关权重处理修复
修复了AIGC（AI生成内容）模型权重处理过程中的一个问题，确保了生成式模型在加载和推理时的正确性。这对于文生图、文生视频等热门AIGC应用至关重要。

文件存在性检查优化
在模型上传和仓库管理过程中，优化了对已存在文件（如.gitattributes、configuration.json和README.md）的检查逻辑，避免了不必要的重复操作和错误，提升了大规模模型管理的效率。

依赖项兼容性处理
针对vllm==0.5.3版本中一个缺失的pyAIrports依赖项进行了处理，确保了在高版本环境中的依赖兼容性。

在深入探讨v1.29.1版本的具体应用前，有必要简要回顾ModelScope框架的核心价值。ModelScope是一个"模型即服务"(MaaS)平台，旨在汇集来自AI社区的最先进的机器学习模型，并简化在实际应用中使用AI模型的流程。ModelScope库使开发人员能够通过丰富的API设计执行推理、训练和评估，从而促进跨不同AI领域的最先进模型的统一体验。

ModelScope Library为模型贡献者提供了必要的分层API，以便将来自CV、NLP、语音、多模态以及科学计算的模型集成到ModelScope生态系统中。所有这些不同模型的实现都以一种简单统一访问的方式进行封装，用户只需几行代码即可完成模型推理、微调和评估。

Python 3.12环境下的开发工作流
对于希望在新版Python环境中使用ModelScope的开发者，以下是一个完整的工作流示例：

# 创建Python 3.12虚拟环境python3.12 -m venv my_modelscope_envsource my_modelscope_env/bin/activate# 安装ModelScope v1.29.1及其依赖pip install modelscope==1.29.1# 对于特定领域需求，可选择安装领域依赖pip install modelscope[nlp] -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html# 使用修复后的参数解析功能进行模型训练# 此时在Python 3.12下各类参数解析问题已得到解决from modelscope.trainers import build_trainerfrom modelscope.msdatasets import MsDataset# 加载数据集和配置训练参数dataset = MsDataset.load('my_fine_tune_dataset')cfg_file = 'config.json'# 创建训练器并开始微调 - 在Python 3.12下参数传递更加稳定trainer = build_trainer(cfg_file)trainer.train

DeepSeek和Intern系列模型下载与使用
针对此次修复的DeepSeek和Intern模型，以下是正确下载和使用的示例代码：

from modelscope import snapshot_downloadfrom modelscope import AutoModel, AutoTokenizer# 现在可以成功下载deepseek模型model_dir = snapshot_download("deepseek-ai/deepseek-llm-7b")print(f"模型已下载到: {model_dir}")# 加载deepseek模型进行推理tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)model = AutoModel.from_pretrained(model_dir, trust_remote_code=True)# 使用模型进行文本生成inputs = tokenizer("人工智能的未来是", return_tensors="pt")outputs = model.generate(**inputs)print(tokenizer.decode(outputs[0]))

安全最佳实践
基于trust_remote_code默认值的变更，建议采用以下安全实践：

# 不推荐的做法：盲目信任所有远程代码# model = AutoModel.from_pretrained("some/model", trust_remote_code=True)# 推荐的安全做法：先验证后信任from modelscope.utils.hf_util import check_model_security# 检查模型安全性（假设函数）is_secure = check_model_security("some/model")if is_secure: model = AutoModel.from_pretrained("some/model", trust_remote_code=True)else: # 使用替代方案或本地验证 model = AutoModel.from_pretrained("some/model", trust_remote_code=False) # 或者仅信任来自已验证源的模型trusted_sources = ["modelscope", "huggingface", "university"]model_source = "some/model".split("/")[0]if model_source in trusted_sources: model = AutoModel.from_pretrained("some/model", trust_remote_code=True)else: model = AutoModel.from_pretrained("some/model", trust_remote_code=False)

结合ModelScope v1.29.1版本的更新，以下是一些性能优化和部署建议：

资源规格选择
对于大语言对话模型，建议选择高性能实例规格（如ml.gu7i.c16m60.1-gu30），以满足模型推理的高计算需求。确保所选资源规格的内存不低于8 GB，否则可能导致服务启动失败或运行不稳定。

模型格式转换与优化
通过DeepGPU-LLM工具，可以将ModelScope格式的模型转换为优化格式，提升推理效率。在运行模型时，选择适当的精度类型（如fp16、int8或int4），以平衡性能和资源消耗。

# 示例：使用fp16精度减少显存占用并加速推理qwen_cli -model_dir /home/user/Qwen-7B-Chat -tp_size 1 -precision fp16

多GPU并行推理
对于超大规模模型（如超过10B参数的模型），可以利用多GPU并行推理技术。通过设置-tp_size参数指定使用的GPU数量，有效分担单个GPU的计算压力。

# 使用两个GPU进行并行推理qwen_cli -model_dir /home/user/Qwen-7B-Chat -tp_size 2 -precision fp16

ModelScope v1.29.1版本虽是一个小版本更新，但解决了几个关键问题，体现了开发团队对用户体验和平台安全性的持续关注。Python 3.12的兼容性支持确保了框架能够跟上编程语言发展的步伐；VLLM模型下载修复解决了许多用户面临的实际问题；而安全默认值的调整则显示了团队对安全最佳实践的重视。

我们相信人工智能为普通人提供了一种“增强工具”，并致力于分享全方位的AI知识。在这里，您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。

来源：科学真理

标签：下载推理 python vllm modelscope

本文地址：http://news.43b.com.cn/a/914321.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!