摘要：近日，人工智能公司Thinking Machines发布了名为Tinker的创新API服务，该服务旨在彻底改变开发人员微调开放权重语言模型的方式。对于那些苦于基础设施管理复杂性的AI研究团队来说，这无疑是一个重大利好。

近日，人工智能公司Thinking Machines发布了名为Tinker的创新API服务，该服务旨在彻底改变开发人员微调开放权重语言模型的方式。对于那些苦于基础设施管理复杂性的AI研究团队来说，这无疑是一个重大利好。

告别基础设施烦恼，专注模型创新

Tinker的核心价值在于大幅降低开发人员的基础设施负担。通过提供托管调度、GPU自动分配和检查点处理等关键功能，它将开发人员从繁琐的集群管理中解放出来。现在，研究人员只需通过简单的Python调用就能完成模型微调，而不必担心底层基础设施的复杂性。

这一服务支持多种模型架构，从小型模型到庞大的专家混合系统（如Qwen-235B-A22B）都能胜任。最令人印象深刻的是，开发人员只需更改Python代码中的单个字符串，就能切换到不同的模型进行微调，这种简洁性在以往是不可想象的。

灵活构建块与内存优化

Tinker API设计了forward_backward和sample等基础原语，作为后训练方法的灵活构建块。这种低级别抽象为研究人员提供了极大的灵活性，使他们能够组合出全新的训练方法。

该平台还集成了LoRA（低秩适应）技术，这在并行微调运行中极大地优化了GPU内存使用。对于资源有限的研究小组和团队来说，这一特性使得微调大型模型变得切实可行。

Thinking Machines同时发布了Tinker Cookbook——一个开源代码库，展示了如何使用API实现常见的微调技术。这包括强化学习方法和偏好优化工作流程，为初学者提供了宝贵的学习资源。

来自普林斯顿大学、斯坦福大学、伯克利大学和红木研究院的早期用户已经将Tinker应用于多种前沿任务，包括定理证明、化学推理和多代理强化学习，证明了该工具在实际研究中的强大适用性。

Tinker进入的是一个已有多个玩家的市场，包括Hugging Face的Trainer API、OpenAI的微调端点和MosaicML的Composer。然而，Tinker的独特之处在于它既提供低级别控制又不要求基础设施管理的平衡点。

与其他框架提供更高级别抽象或专注于特定训练管道不同，Tinker强调暴露可以组合成新方法的低级原语，为开发人员提供更多控制权，同时免去了他们管理基础设施的负担。

AI专业人士Ignacio de Gregorio对Tinker的评价十分积极：“这绝对是惊人的。RLaaS（强化学习即服务）是企业所缺失的，这在外包最反企业的部分（分布式培训）的同时，提供了极大价值。”

Thinking Machines创始人Mira Murati表示：“Tinker为研究人员带来了前沿工具，在处理分布式训练复杂性的同时，为编写实验和训练管道提供干净的抽象。它实现了新颖的研究、定制模型和坚实的基线。”

目前，Tinker处于私人测试阶段，早期访问免费。预计未来将推出基于使用情况的定价模式。开发人员和研究小组可以直接从Thinking Machines请求访问。

对于中国的AI开发者和研究人员来说，Tinker的出现提供了一个极具吸引力的新选择，特别是对于那些希望专注于算法创新而非基础设施维护的团队。随着AI模型规模的不断扩大，这类简化复杂流程的工具将变得越来越重要。

来源：小码科普君

标签： llm 工作流 tinker llm微调微调工作流

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!