Web前端开发网

fly63.com

首页 资源 工具 文章 教程 栏目
  • 在线搜索
  • 文章标签
  • 广告合作
  • 赞助一下
  • 关于我们
资源推荐
蜂小推
不扣量的项目推广平台
免费资源下载中心
一站式解决工作学习需求的宝藏网站
Trae
字节跳动推出的 AI原生编程工具
奇绘馆AI视频
新一代AI视频创作平台
阿里云优惠券
卓越的云计算技术和服务提供商
周易国学网
基于周易、八字、紫微斗数等传统国学文化
SpeedAI
一键去重、降AIGC率、数据可视化、论文写作
Seedance 2.0
字节跳动新一代AI视频生成模型全面解析
趣网商城
私密生活好物,隐私配送,无痕购物
扣子Coze
职场AI,就用扣子

资源分类

AI智能 酷站推荐 招聘/兼职 框架/库 模块/管理 移动端UI框架 Web-UI框架 Js插件 Jquery插件 CSS相关 IDE环境 在线工具 图形动效 游戏框架 node相关 调试/测试 在线学习 社区/论坛 博客/团队 前端素材 图标/图库 建站资源 设计/灵感 IT资讯
网站收录 / 问题反馈

Qwen-Image-Layered

分享
复制链接
新浪微博
QQ 好友

扫一扫分享

GitHub:https://github.com/QwenLM/Qwen-Image-Layered
描述信息:阿里推出的AI图像编辑模型
GitHub
wen-Image-Layered 是阿里 QwenLM 团队推出的一款开源 AI 图像编辑模型,核心能力就是把一张普通图片 “拆解开” 成多个带透明通道的 RGBA 图层。就像用 Photoshop 做设计时,设计师会把背景、人物、文字等元素放在不同图层上一样,这个模型能自动完成分层工作,让每个语义或结构组件都单独存在一个图层里。
这样一来,后续编辑就不用 “牵一发而动全身” 了 —— 可以只改某个图层的内容,其他部分完全不受影响。它支持在 Huggingface Spaces 和 Modelscope Studio 上直接试用,也能下载权重本地部署,不管是设计师日常修图,还是开发者二次开发,都能轻松上手,目前采用 Apache-2.0 开源许可证,完全免费可用。


核心功能特色

  1. 智能分层,语义独立:不用手动抠图、分层,模型能自动识别图片中的不同元素,拆解成多个 RGBA 图层。比如一张包含文字、人物、背景的图片,会被拆成 “背景层”“人物层”“文字层”,每个图层都有独立的透明通道,边界处理自然,不会出现模糊或残留。
  2. 自由编辑,操作无干扰:拆分后的图层支持各种独立操作,而且都是高保真效果:
  • 基础操作:给某个图层换颜色、调整大小(不会变形)、移动位置,比如把广告图里的产品移到画面中间,单独给文字改成红色;
  • 进阶操作:干净删除不需要的元素(比如去掉图片里的杂物)、修改图层内容(比如把图层里的女孩换成男孩、把文字改成其他内容),全程不影响其他图层的完整性。
  1. 灵活分解,满足多样需求
  • 可变图层数量:不用固定拆成多少层,根据需求自由设置,比如简单图片拆 3 层就够,复杂图片可以拆到 8 层甚至更多;
  • 递归无限分解:不仅能拆原图,任何一个已经拆分出来的图层,还能再继续往下拆,比如把 “人物层” 再拆成 “头部层”“身体层”,实现无限拆分,精细度拉满。
  1. 便捷部署,支持多格式导出:上手简单:只要满足 transformers 版本≥4.51.3,安装好 diffusers、psd-tools 等依赖,复制示例代码就能本地运行;
  • 可视化操作:运行脚本就能启动 Gradio 网页界面,不用写代码也能上传图片、拆分图层,还能把分层结果导出成 PPTX、ZIP、PSD 格式,直接导入 Photoshop 等工具继续编辑;
  • 支持二次组合:编辑完单个图层后,用专门的脚本就能按 “从下到上” 的顺序把图层重新组合成一张新图片,流程完整。
  1. 文本辅助,适配不同场景:输入文本提示时,不用指定单个图层的内容,只要描述图片整体内容(包括被遮挡的元素,比如 “被前景挡住的文字”),模型就能更精准地识别分层逻辑。不过要注意,它的核心是 “图片拆分层”,文本生成多层图像的能力目前还比较有限。


应用场景

  1. 广告设计与电商修图:广告图里的产品、背景、宣传语可以快速分层,设计师能随时更换背景、调整产品位置、修改文字内容,不用重新制作整张图;电商商品图也能拆分后单独优化产品细节,比如调整商品颜色、去除背景杂物,提高修图效率。
  2. 创意设计与海报制作:设计师可以把参考图拆解成多个图层,提取喜欢的元素进行重组、修改,比如把不同图片的文字层、图形层拆分后,重新组合成新的海报;也能通过递归拆分,对细节元素做精细化调整,激发更多创意。
  3. 影视后期与短视频制作:对影视画面或短视频素材进行分层,比如把角色、道具、背景分开,方便单独添加特效、调整颜色、替换背景,不用对整个画面做后期处理,节省时间还能保证画面质量。
  4. 图像修复与优化:老照片修复时,把破损的部分(比如划痕、污渍)单独拆成一个图层,针对性修复,不会影响照片其他完好的部分;也能拆分图片后,单独优化某个元素的清晰度、亮度,让整体画面更协调。
  5. 教育演示与教学场景:教学中可以把复杂图像(比如生物结构图、机械原理示意图)拆成简单图层,一步步展示图像的构成,帮助学生理解各个部分的关系;也能让学生自己动手拆分、编辑图层,直观学习图像编辑的基本原理。
  6. 开发者二次开发:开发者可以基于这个模型的分层能力,搭建自己的图像编辑工具,比如集成到在线修图平台、设计类 App 中,为用户提供自动分层、便捷编辑的功能,降低开发难度。


快速上手

  1. 环境准备:确保 Python 环境中 transformers 版本≥4.51.3(支持 Qwen2.5-VL),然后安装依赖:
    pip install git+https://github.com/huggingface/diffusers
    pip install python-pptx
    pip install psd-tools
    
  2. 基础使用:复制示例代码,替换输入图片路径,设置分层数量(比如 layers=4)、分辨率(推荐 640)等参数,运行后就能得到拆分后的各个图层,自动保存为图片文件。
  3. 可视化部署:
    • 运行 python src/app.py,启动分层与导出界面,可上传图片拆分后导出为 PPTX、ZIP、PSD 格式;
    • 运行 python src/tool/edit_rgba_image.py,启动图层编辑界面,能对拆分后的 RGBA 图层进行透明编辑;
    • 编辑完图层后,运行 python src/tool/combine_layers.py,按从下到上的顺序上传图层,即可组合成新图片。
  4. 扩展使用:vLLM-Omni 已支持该模型,可查看相关教程实现更高效的部署和推理。


仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!

链接: https://fly63.com/nav/4879

更多»
热门资源
豆包AI
字节跳动旗下 AI 智能助手
官网
扣子Coze
职场AI,就用扣子
官网
DeepSeek
幻方量化公司旗下的开源大模型平台
官网
GitHub
码上飞(CodeFlying)
用一句话自动生成小程序、APP、H5网页应用
官网
01Agent
AI内容创作智能体,选题+创作+排版+多平台分发
官网
AiPPT
全智能AI一键生成 PPT
官网
堆友AI
零门槛,多风格AI绘画免费生成,电商海报设计神器
官网
Trae
字节跳动推出的 AI原生编程工具
官网
美图设计室
AI智能一键生成海报,免费平面设计
官网
爱派AiPy
一款可本地部署的AI智能体,帮你操作电脑、手机、服务器设备
官网
SpeedAI
一键去重、降AIGC率、数据可视化、论文写作
官网
Seedance 2.0
字节跳动新一代AI视频生成模型全面解析
官网
类似于Qwen-Image-Layered的资源
Wonder Studio
真人一键自动转换为CG
官网
Easy Dataset
专为创建大型语言模型数据集而设计的应用程序
官网
GitHub
Bolt.new
AI自动化编程工具
官网
Genspark
基于AI智能体的搜索引擎,定位为下一代搜索引擎解决方案
官网
在问
让知识无界,智能触手可及
官网
poe AI
快捷实用的AI聊天
官网
Phygital+
让创作者在没有代码的情况下使用神经网络
官网
Second-Me
由Mindverse推出的开源AI身份模型
官网
GitHub
目录

手机扫一扫预览

》
分享组件加载中...
首页 技术导航 在线工具 技术文章 教程资源 前端标签 AI工具集 前端库/框架 实用工具箱 广告合作 关于我们

Copyright © 2018 Web前端开发网 All Rights Reserved. 提供免费在线工具、编程学习资源(教程/框架/库),内容以学习参考为主,助您解决各类实际问题,快速提升专业能力。