更可控的图生图模型,可参考输入图片的轮廓边缘、景深、人物姿态及风格进行出图,出图效果更为精细。
名称 | 内容 |
---|---|
图片要求 |
|
名称 | 内容 |
---|---|
接口地址 | |
请求方式 | POST |
Content-Type | application/json |
完整公共参数列表见 公共参数
本服务Region为cn-north-1; Service为cv
拼接到url后的参数,示例:https://visual.volcengineapi.com?Action=CVProcess&Version=2022-08-31
参数 | 可选/必选 | 类型 | 说明 |
---|---|---|---|
Action | 必选 | String | 接口名,取值:Img2ImgXLSft |
Version | 必选 | String | 版本号,取值:2022-08-31 |
业务请求参数,放到request.body中,MIME-Type为application/json
参数 | 可选/必选 | 类型 | 说明 | |
---|---|---|---|---|
req_key | 必选 | String | 算法名称,取固定值为i2i_xl_sft | |
binary_data_base64 | 可选 | Array of String | 输入图的base64数组与image_urls二选一 | |
image_urls | 可选 | Array of String | 输入图的url数组与binary_data_base64二选一 | |
prompt | 可选 | string | 用于生成图像的提示词,支持中英文输入,建议内容简洁准确,控制在100中文字/英文单词以内,超出部分对生成效果影响较小 | |
seed | 可选 | int | 随机种子,-1为不随机种子;其他为指定随机种子 | |
ddim_steps | 可选 | int | 生成图像的步数 | |
scale | 可选 | float | 影响文本描述的程度 | |
controlnet_args | 可选 | list[ControlnetArgs] | 类似controlnet配置 | |
style_reference_args | 可选 | StyleReferenceArgs | 风格配置 | |
return_url | 可选 | bool | 输出是否返回图片链接 | |
logo_info | 可选 | LogoInfo | 水印信息 |
ControlnetArgs
名称 | 类型 | 必选/可选 | 描述 |
---|---|---|---|
type | string | 必选 | 类似ControlNet 保持构图的方案 |
strength | float | 必选 | ControlNet强度 |
binary_data_index | int | 必选 | binary_data图片的下标 |
StyleReferenceArgs
名称 | 类型 | 必选/可选 | 说明 | 备注 |
---|---|---|---|---|
id_weight | float | 可选 | ID 保持的强度 | ID保持的作用是人脸保持,人脸数据来源于binary_data[0] |
style_weight | float | 可选 | 风格迁移的强度 | 风格迁移的作用是控制输入图和风格参考图的相似性,风格参考图从binary_data[binary_data_index] 读取 |
binary_data_index | int | 必选 | binary_data图片的下标 |
LogoInfo
水印相关信息。
名称 | 类型 | 必选 | 描述 | 备注 |
---|---|---|---|---|
add_logo | Boolean | 否 | 是否添加水印。True为添加,False不添加。默认不添加 | |
position | Int | 否 | 水印的位置,取值如下: | |
language | Int | 否 | 水印的语言,取值如下: | |
logo_text_content | String | 否 | 明水印自定义内容 |
请参考通用返回字段及错误码
重点关注data 字段,其他字段为公共返回
字段 | 类型 | 说明 | 备注 |
---|---|---|---|
binary_data_base64 | array of string | 返回图片的base64数组。 | 如果指定了构图参数则返回第一张图为结果输出图,第二张图为构图。 |
image_urls | array of string | 输出处理过的图片url数组 |
{ "req_key": "i2i_xl_sft", "image_urls": [ "https://xxx" ], "prompt": "美女", "seed": -1, "ddim_steps": 20, "scale": 7.0, "controlnet_args": [ { "type": "canny", "strength": 0.4, "binary_data_index": 0 } ], "style_reference_args": { "id_weight": 0.2, "style_weight": 0.0, "binary_data_index": 0 }, "etta_args": { "binary_data_index": 0 }, "return_url": true, "logo_info": { "add_logo": true, "position": 2, "language": 0, "logo_text_content": "这里是明水印内容" } }
{ "code": 10000, "data": { "algorithm_base_resp": { "status_code": 0, "status_message": "Success" }, "binary_data_base64": [], "comfyui_cost": 11, "controlnet_args": [ { "binary_data_index": 0, "strength": 0.4, "type": "canny" } ], "controlnet_args.canny.binary_data_index": 0, "controlnet_args.canny.strength": 0.4, "controlnet_args.depth.binary_data_index": 0, "controlnet_args.depth.strength": 0, "controlnet_args.pose.binary_data_index": 0, "controlnet_args.pose.strength": 0, "custom_prompt": "美女", "ddim_step": 20, "etta_args": { "binary_data_index": 0 }, "etta_args.binary_data_index": 0, "height": 1024, "image_urls": [ "https://xxx", "https://xxx" ], "logo_info": { "add_logo": true, "language": 0, "opacity": 1, "position": 2 }, "multi_pipeline_select_key": "t2i", "prompt": "beautiful woman", "prompt_translated": "beautiful woman", "request_id": "8bcd844f913c89717d474d0af05f6bb96e0f4f2d409a379f84349a8952a92121", "return_url": true, "scale": 7, "seed": -1, "style_reference_args": { "binary_data_index": 0, "id_weight": 0.2, "style_weight": 0 }, "style_reference_args.binary_data_index": 0, "style_reference_args.id_weight": 0.2, "style_reference_args.style_weight": 0, "width": 1024 }, "message": "Success", "request_id": "20240809145732F1B86B6E94464D05716A", "status": 10000, "time_elapsed": "12.696326169s" }
(1)通用错误码
请参考通用返回字段及错误码
(2)业务错误码
HttpCode | 错误码 | 错误消息 | 描述 |
---|---|---|---|
200 | 10000 | 无 | 请求成功 |
400 | 50411 | Pre Img Risk Not Pass | 输入图片前审核未通过 |
400 | 50511 | Post Img Risk Not Pass | 输出图片后审核未通过 |
400 | 50412 | Text Risk Not Pass | 输入文本前审核未通过 |
400 | 50512 | Post Text Risk Not Pass | 输出文本后审核未通过 |
400 | 50413 | Post Text Risk Not Pass | 输入文本NER、IP、Blocklist等拦截 |
请参考SDK使用说明