扫一扫分享
AutoFigure-edit 是 AutoFigure 的新一代版本。它能将论文的方法部分自动转化为完全可编辑的 SVG 插图,并支持在嵌入式 SVG 编辑器中进行微调。
它的核心工作流程是这样的:先用 LLM 根据文字生成一个草图,然后用 SAM3 做图像分割识别出各个图标区域,再通过 RMBG-2.0 去背景,最后组装成完整的矢量图。最牛的是它支持风格迁移,你可以丢一张参考图进去,它会模仿那个风格来画你的图。这对于想要统一论文配图风格的人来说,简直是救星。项目还内置了一个 Web 界面,生成的图可以直接在浏览器里编辑,拖拖拽拽就能调整,非常方便。
| 特性 | 描述 |
|---|---|
| 文本转插图 | 直接从方法文本生成插图草稿。 |
| SAM3 图标检测 | 通过多提示词检测图标区域并合并重叠部分。 |
| 带标签占位符 | 插入一致的 AF 风格占位符,实现可靠的 SVG 映射。 |
| SVG 生成 | 生成与插图对齐的可编辑 SVG 模板。 |
| 嵌入式编辑器 | 使用内置的 svg-edit 在浏览器中直接编辑 SVG。 |
| 产物输出 | 每次运行保存 PNG/SVG 输出及裁剪后的图标。 |
AutoFigure-edit 的处理流程通过四个阶段将原始生成的位图转化为可编辑的 SVG:(1) 原始生成 → (2) SAM3 分割 → (3) SVG 布局模板 → (4) 最终矢量合成
生成 (figure.png): LLM 根据方法文本生成初始的光栅化草图。
分割 (sam.png): 集成 SAM3 检测并分割出独立的图标与文本区域。
模板 (template.svg): 系统构建包含占位符的 SVG 结构骨架(线框图)。
合成 (final.svg): 将高质量的抠图图标和矢量化文本注入模板,完成组装。
# 1) 安装依赖
pip install -r requirements.txt
# 2) 单独安装 SAM3 (本项目未包含)
git clone https://github.com/facebookresearch/sam3.git
cd sam3
pip install -e .运行:
python autofigure2.py \
--method_file paper.txt \
--output_dir outputs/demo \
--provider bianxie \
--api_key YOUR_KEYpython server.py然后在浏览器打开 http://localhost:8000。
仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!
手机扫一扫预览