MagicQuill：4天获千颗 Star，登Huggingface趋势榜首的AI P图神器

摘要：最近，蚂蚁技术研究院开源了一个交互式的 AI 图像编辑工具：MagicQuill ，可以快速、简单的实现智能化、精细化的图像编辑。即便是 PS 小白，也能轻松上手。用画笔涂抹加一句提示词，瞬间完成复杂繁琐的图像编辑功能。该项目在 Github 上短短 4 天

还在为 P 图烦恼，懊恼自己这不争气的手怎么就 P 不出来好看的图片？

最近，蚂蚁技术研究院开源了一个交互式的 AI 图像编辑工具：MagicQuill ，可以快速、简单的实现智能化、精细化的图像编辑。即便是 PS 小白，也能轻松上手。用画笔涂抹加一句提示词，瞬间完成复杂繁琐的图像编辑功能。该项目在 Github 上短短 4 天就斩获千颗 Star！

更是霸榜 Hugging Face应用排行榜第一！

MagicQuill 是一个交互式的 AI 图片编辑工具，通过结合“编辑处理器” “绘画助手”和“创意收集器”三大功能，成功解决了图片的精准、高效编辑的难题。用户只需要用三种简单直观的魔法画笔就能轻松编辑图片：添加、删除和上色。系统通过多模态大语言模型 (MLLM) 动态预测用户的操作意图，并提供相关的编辑建议。

体验地址：

模型链接：

代码地址：

2、核心组成

编辑处理器（Editing Processor）：系统的核心处理模块，主要负责确保高质量、可控的编辑生成，从而准确反映用户的编辑意图。它实现了两种基于笔刷的引导机制：用于结构性修改的涂鸦引导和用于修改颜色属性的颜色引导。该模块的技术设计受到ControlNet和BrushNet的启发，通过特殊的控制架构确保能够精确遵循用户引导的同时保持未修改区域不变，从而实现精确的图像编辑效果。

绘画助手（Painting Assistor）：其设计目标是预测和解释用户的编辑意图，有效减少用户在编辑过程中需要重复输入文本提示的繁琐步骤。该模块运用多模态大语言模型（MLLM）来解释用户的笔刷操作，并能够基于图像上下文自动预测相应的提示。通过引入创新的"你画我猜"任务，并利用模拟真实编辑场景的数据集进行微调，绘画助手实现了连续的编辑工作流，让用户无需手动输入提示即可进行持续的编辑操作。

创意收集器（Idea Collector）：专注于提供直观且易用的操作界面，它的设计兼容多个平台，包括Gradio和ComfyUI等。用户可以通过这个界面使用不同的笔刷进行绘制，操作各种笔画，并实现连续的编辑过程。创意收集器的设计理念是让用户能够轻松自如地实现各种编辑操作，为整个系统提供一个用户友好的交互入口，显著提升图像编辑的效率和用户体验。

3、本地安装使用

下载代码库

git clone --recursive https://github.com/magic-quill/MagicQuill.gitcd MagicQuill

下载需要用到的模型权重文件

modelscope download --model=ant-research/MagicQuill-models --local_dir ./MagicQuill-models

创建运行环境

conda create -n MagicQuill python=3.10 -yconda activate MagicQuill

安装交互界面文件

pip install gradio_magicquill-0.0.1-py3-none-any.wh

安装 LLAVA 环境

cp -f pyproject.toml MagicQuill/LLaVA/pip install -e MagicQuill/LLaVA/

安装环境依赖