You need to enable JavaScript to run this app.
导航
通用2.0L-指令编辑(SeedEdit)
最近更新时间:2024.11.20 23:20:09首次发布时间:2024.11.19 16:20:07

接口简介:

指令编辑(SeedEdit)是一种能够使用任何文本提示修改给定图像的扩散模型,也是专为图像编辑任务设计的模型。在通用性、可控性、高质量等方面取得了新的突破,凭借创新、多尺度且多规则的数据获取和过滤方案,输入任意指令,即可实现精准编辑。

核心优势:

1)高精度指令理解,能理解中英文、专有名词:依托豆包文生图大模型,具备出色的指令理解能力。无论是中文还是英文输入,都能精准响应,对于成语、专有名词等复杂词汇也毫不逊色。
2)高质量编辑效果,聚焦目标,不“误伤”原图:它能够更加灵活、精准且快速地选择目标,在编辑过程中最大限度地保持原图的完整性。
3)高效率创新模型,可实现多元风格,美观自然:用户只需通过简单的指令调优,即可轻松完成诸如换背景、变换风格、物体增删、替换等丰富多样的编辑任务,极大地提高了编辑效率。

限制条件

名称

内容

输入图要求

  1. 图片格式:JPG(JPEG), PNG, BMP 等常见格式, 建议使用JPG格式.
  2. 图片要求:小于4.7 MB,小于4096*4096
  3. 长边与短边比例在3以内,超出此比例或比例相对极端,效果不佳,

输出图说明

  1. 输出图分辨率与输入图宽高比有关,与原始分辨率大小无关。
  2. 最终出图宽高比与原图接近,单边长度:[512, 1536]
  3. 需要详细了解宽高规则,可再联系相关火山引擎同学

请求说明

名称

内容

接口地址

https://visual.volcengineapi.com

请求方式

POST

Content-Type

application/json

Header参数

完整公共参数列表见 公共参数
本服务Region为cn-north-1; Service为cv

Query参数

拼接到url后的参数,示例:https://visual.volcengineapi.com?Action=CVProcess&Version=2022-08-31

参数

可选/必选

类型

说明

Action

必选

String

接口名,取固定值:CVProcess

Version

必选

String

版本号,取固定值:2022-08-31

Body参数

业务请求参数,放到request.body中,MIME-Type为application/json

参数

可选/必选

类型

说明

备注

req_key

必选

String

算法名称,取固定值为byteedit_v2.0

binary_data_base64

必选(二选一)

array of string

图片文件,base64编码。此算法需输入1张图片

image_urls

必选(二选一)

array of string

图片文件URL。此算法需输入1张图片

prompt

必选

String

用于编辑图像的提示词 。建议:

  • 编辑指令使用自然语言即可
  • 每次编辑使用单指令会更好
  • 局部编辑时指令描述尽量精准,尤其是画面有多个实体的时候,描述清楚对谁做什么,能获取更精准的编辑效果
  • 发现编辑效果不明显的时候,可以调整一下编辑强度scale,数值越大越贴近指令执行
  • 尽量使用清晰的,分辨率高的底图,动漫及豆包模型生成的图片编辑效果会更好。

参考示例
添加/删除实体:添加/删除xxx(删除图上的女孩/添加一道彩虹)
修改实体:把xxx改成xxx(把手里的鸡腿变成汉堡)
修改风格:改成xxx风格(改成漫画风格)
修改色彩:把xxx改成xx颜色(把衣服改成粉色的)
修改动作:修改表情动作(让他哭/笑/生气)
修改环境背景:背景换成xxx,在xxx(背景换成海边/在星空下)

seed

可选

int

随机种子,作为确定扩散初始状态的基础,默认-1(随机)。若随机种子为相同正整数且其他参数均一致,则生成图片极大概率效果一致

scale

可选

float

影响文本描述的程度,该值越大代表文本描述影响程度越大,且输入图片影响程度越小
默认值:0.5
取值范围:[0, 1]

return_url

可选

bool

输出是否返回图片链接

logo_info

可选

LogoInfo

水印信息

LogoInfo
水印相关参数

名称

类型

必选

描述

备注

add_logo

Boolean

是否添加水印。True为添加,False不添加。默认不添加

position

Int

水印的位置,取值如下:
0-右下角
1-左下角
2-左上角
3-右上角
默认0

language

Int

水印的语言,取值如下:
0-中文(AI生成)
1-英文(Generated by AI)
默认0

logo_text_content

String

明水印自定义内容

输出说明

通用输出参数

请参考通用返回字段及错误码

业务输出参数

重点关注data 字段,其他字段为公共返回

字段

类型

说明

binary_data_base64

array of string

返回图片的base64数组。

image_urls

array of string

输出处理过的图片url
数组(单张图)

请求&返回完整示例

请求示例

{
    "req_key": "byteedit_v2.0",
    // "binary_data_base64": [],
    "image_urls": [
        "https://xxx"
    ],
    "prompt": "让他生气",
    "negative_prompt": "",
    "seed": -1,
    "scale": 0.5,
    "return_url": true,
    "logo_info": {
        "add_logo": false,
        "position": 0,
        "language": 0,
        "logo_text_content": "这里是明水印内容"
    }
}

输出示例

{
    "code": 10000,
    "data": {
        "algorithm_base_resp": {
            "status_code": 0,
            "status_message": "Success"
        },
        "binary_data_base64": [],
        "image_urls": [
            "https://xxx"
        ],
        "pe_result": "",
        "predict_tags_result": "",
        "rephraser_result": "",
        "request_id": "21e069c9c5448af8a05f9ac8f473fc51cdf3ab07ad5656e39825448851646cc8",
        "vlm_result": "一个穿着带有粉色条纹的浅粉色衬衫的男人,看起来很生气。背景是单一的灰色。"
    },
    "message": "Success",
    "request_id": "20241119114718783B9ECBF37C13C29CB2",
    "status": 10000,
    "time_elapsed": "8.49180031s"
}

错误码

(1)通用错误码
请参考通用返回字段及错误码
(2)业务错误码

HttpCode

错误码

错误消息

描述

200

10000

请求成功

400

50411

Pre Img Risk Not Pass

输入图片前审核未通过

400

50511

Post Img Risk Not Pass

输出图片后审核未通过

400

50412

Text Risk Not Pass

输入文本前审核未通过

400

50512

Post Text Risk Not Pass

输出文本后审核未通过

400

50413

Post Text Risk Not Pass

输入文本NER、IP、Blocklist等拦截

SDK使用说明

请参考SDK使用说明