基于字节跳动高美感2.0模型的可控图生图模型,可参考输入图片的轮廓边缘、景深、人物姿态特征进行出图,出图效果更精美。
名称 | 内容 |
---|---|
输入图要求 |
|
名称 | 内容 |
---|---|
接口地址 | |
请求方式 | POST |
Content-Type | application/json |
完整公共参数列表见 公共参数
本服务Region为cn-north-1; Service为cv
拼接到url后的参数,示例:https://visual.volcengineapi.com?Action=CVProcess&Version=2022-08-31
参数 | 可选/必选 | 类型 | 说明 |
---|---|---|---|
Action | 必选 | String | 接口名,取固定值:CVProcess |
Version | 必选 | String | 版本号,取固定值:2022-08-31 |
业务请求参数,放到request.body中,MIME-Type为application/json
参数 | 可选/必选 | 类型 | 说明 | 备注 |
---|---|---|---|---|
req_key | 必选 | String | 算法名称,取固定值为high_aes_scheduler_svr_controlnet_v2.0 | |
binary_data_base64 | 必选(二选一) | array of string | 图片文件,base64编码。此算法至少需输入1张图片 | |
image_urls | 必选(二选一) | array of string | 图片文件URL。此算法至少需输入1张图片 | |
prompt | 必选 | String | 用于生成图像的提示词 ,中英文均可输入 | |
model_version | 可选 | String | 模型版本名称 | |
seed | 可选 | int | 随机种子,-1为不随机种子;其他为指定随机种子 | |
scale | 可选 | float | 影响文本描述的程度 | |
ddim_steps | 可选 | int | 生成图像的步数 | 建议使用默认值,过高容易导致超时 |
use_rephraser | 可选 | bool | 开启中文prompt扩写 | |
use_sr | 可选 | bool | true:文生图+AIGC超分 | 建议开启超分参数 |
sr_seed | 可选 | int | 超分模型随机种子,-1为不随机种子;其他为指定随机种子,当use_sr开启时有效 | |
sr_strength | 可选 | float | 只在超分模型生效 | |
sr_scale | 可选 | float | 在超分模型上,影响文本描述的程度 | |
sr_steps | 可选 | int | 超分模型生成图像的步数 | |
controlnet_args | 必选 | list[ControlnetArgs] | 类似controlnet配置 | |
return_url | 可选 | bool | 输出是否返回图片链接 (链接有效期为24小时) | |
logo_info | 可选 | LogoInfo | 水印信息 |
ControlnetArgs
名称 | 类型 | 必选/可选 | 描述 |
---|---|---|---|
type | String | 必选 | 类似ControlNet 保持构图的方案 |
strength | float | 必选 | ControlNet强度 |
binary_data_index | int | 必选 | Controlnet要处理的图片,取值为binary_data图片的下标 |
LogoInfo
水印相关参数
名称 | 类型 | 必选 | 描述 | 备注 |
---|---|---|---|---|
add_logo | Boolean | 否 | 是否添加水印。True为添加,False不添加。默认不添加 | |
position | Int | 否 | 水印的位置,取值如下: | |
language | Int | 否 | 水印的语言,取值如下: | |
logo_text_content | String | 否 | 明水印自定义内容 |
请参考通用返回字段及错误码
重点关注data 字段,其他字段为公共返回
字段 | 类型 | 说明 |
---|---|---|
binary_data_base64 | array of string | 返回图片的base64数组。 |
image_urls | array of string | 输出处理过的图片url |
{ "req_key": "high_aes_scheduler_svr_controlnet_v2.0", // "binary_data_base64": [], "image_urls": [ "https://xxx" ], "prompt": "一只狗", "model_version": "general_controlnet_v2.0", "seed": -1, "scale": 3, "ddim_steps": 16, "use_rephraser": true, "use_sr": true, "sr_seed": -1, "sr_strength": 0.4, "sr_scale": 3.5, "sr_steps": 10, "controlnet_args": [ { "type": "depth", "binary_data_index": 0, "strength": 0.8 } ], "return_url": true, "logo_info": { "add_logo": false, "position": 0, "language": 0, "logo_text_content": "这里是明水印内容" } }
{ "code": 10000, "data": { "algorithm_base_resp": { "status_code": 0, "status_message": "Success" }, "binary_data_base64": [], "image_urls": [ "https://xxxx" ], "predict_tags_result": "", "rephraser_result": "一只毛色鲜艳的狗,它有着饱满的毛发和锐利的眼神,看起来非常健康活泼。", "request_id": "0444b94371cef27e5e193dde55372f37745d887dee580898367a717d0f92f83c" }, "message": "Success", "request_id": "202501132006376AA642D2FBD42465DF60", "status": 10000, "time_elapsed": "5.861744206s" }
(1)通用错误码
请参考通用返回字段及错误码
(2)业务错误码
HttpCode | 错误码 | 错误消息 | 描述 |
---|---|---|---|
200 | 10000 | 无 | 请求成功 |
400 | 50411 | Pre Img Risk Not Pass | 输入图片前审核未通过 |
400 | 50511 | Post Img Risk Not Pass | 输出图片后审核未通过 |
400 | 50412 | Text Risk Not Pass | 输入文本前审核未通过 |
400 | 50512 | Post Text Risk Not Pass | 输出文本后审核未通过 |
400 | 50413 | Post Text Risk Not Pass | 输入文本NER、IP、Blocklist等拦截 |
请参考SDK使用说明