指令编辑(SeedEdit)是一种能够使用任何文本提示修改给定图像的扩散模型,也是专为图像编辑任务设计的模型。在通用性、可控性、高质量等方面取得了新的突破,凭借创新、多尺度且多规则的数据获取和过滤方案,输入任意指令,即可实现精准编辑。
1)高精度指令理解,能理解中英文、专有名词:依托豆包文生图大模型,具备出色的指令理解能力。无论是中文还是英文输入,都能精准响应,对于成语、专有名词等复杂词汇也毫不逊色。
2)高质量编辑效果,聚焦目标,不“误伤”原图:它能够更加灵活、精准且快速地选择目标,在编辑过程中最大限度地保持原图的完整性。
3)高效率创新模型,可实现多元风格,美观自然:用户只需通过简单的指令调优,即可轻松完成诸如换背景、变换风格、物体增删、替换等丰富多样的编辑任务,极大地提高了编辑效率。
名称 | 内容 |
---|---|
输入图要求 |
|
输出图说明 |
|
名称 | 内容 |
---|---|
接口地址 | |
请求方式 | POST |
Content-Type | application/json |
完整公共参数列表见 公共参数
本服务Region为cn-north-1; Service为cv
拼接到url后的参数,示例:https://visual.volcengineapi.com?Action=CVProcess&Version=2022-08-31
参数 | 可选/必选 | 类型 | 说明 |
---|---|---|---|
Action | 必选 | String | 接口名,取固定值:CVProcess |
Version | 必选 | String | 版本号,取固定值:2022-08-31 |
业务请求参数,放到request.body中,MIME-Type为application/json
参数 | 可选/必选 | 类型 | 说明 | 备注 |
---|---|---|---|---|
req_key | 必选 | String | 算法名称,取固定值为byteedit_v2.0 | |
binary_data_base64 | 必选(二选一) | array of string | 图片文件,base64编码。此算法需输入1张图片 | |
image_urls | 必选(二选一) | array of string | 图片文件URL。此算法需输入1张图片 | |
prompt | 必选 | String | 用于编辑图像的提示词 。建议:
| 参考示例 |
seed | 可选 | int | 随机种子,作为确定扩散初始状态的基础,默认-1(随机)。若随机种子为相同正整数且其他参数均一致,则生成图片极大概率效果一致 | |
scale | 可选 | float | 影响文本描述的程度,该值越大代表文本描述影响程度越大,且输入图片影响程度越小 | |
return_url | 可选 | bool | 输出是否返回图片链接 | |
logo_info | 可选 | LogoInfo | 水印信息 |
LogoInfo
水印相关参数
名称 | 类型 | 必选 | 描述 | 备注 |
---|---|---|---|---|
add_logo | Boolean | 否 | 是否添加水印。True为添加,False不添加。默认不添加 | |
position | Int | 否 | 水印的位置,取值如下: | |
language | Int | 否 | 水印的语言,取值如下: | |
logo_text_content | String | 否 | 明水印自定义内容 |
请参考通用返回字段及错误码
重点关注data 字段,其他字段为公共返回
字段 | 类型 | 说明 |
---|---|---|
binary_data_base64 | array of string | 返回图片的base64数组。 |
image_urls | array of string | 输出处理过的图片url |
{ "req_key": "byteedit_v2.0", // "binary_data_base64": [], "image_urls": [ "https://xxx" ], "prompt": "让他生气", "negative_prompt": "", "seed": -1, "scale": 0.5, "return_url": true, "logo_info": { "add_logo": false, "position": 0, "language": 0, "logo_text_content": "这里是明水印内容" } }
{ "code": 10000, "data": { "algorithm_base_resp": { "status_code": 0, "status_message": "Success" }, "binary_data_base64": [], "image_urls": [ "https://xxx" ], "pe_result": "", "predict_tags_result": "", "rephraser_result": "", "request_id": "21e069c9c5448af8a05f9ac8f473fc51cdf3ab07ad5656e39825448851646cc8", "vlm_result": "一个穿着带有粉色条纹的浅粉色衬衫的男人,看起来很生气。背景是单一的灰色。" }, "message": "Success", "request_id": "20241119114718783B9ECBF37C13C29CB2", "status": 10000, "time_elapsed": "8.49180031s" }
(1)通用错误码
请参考通用返回字段及错误码
(2)业务错误码
HttpCode | 错误码 | 错误消息 | 描述 |
---|---|---|---|
200 | 10000 | 无 | 请求成功 |
400 | 50411 | Pre Img Risk Not Pass | 输入图片前审核未通过 |
400 | 50511 | Post Img Risk Not Pass | 输出图片后审核未通过 |
400 | 50412 | Text Risk Not Pass | 输入文本前审核未通过 |
400 | 50512 | Post Text Risk Not Pass | 输出文本后审核未通过 |
400 | 50413 | Post Text Risk Not Pass | 输入文本NER、IP、Blocklist等拦截 |
请参考SDK使用说明