You need to enable JavaScript to run this app.
导航
通用XL pro-图生图
最近更新时间:2024.09.11 11:01:46首次发布时间:2024.08.12 16:08:19

接口简介

更可控的图生图模型,可参考输入图片的轮廓边缘、景深、人物姿态及风格进行出图,出图效果更为精细。

限制条件

名称

内容

图片要求

  1. 图片格式:JPG(JPEG), PNG, BMP 等常见格式, 建议使用JPG格式.
  2. 图片要求:小于5 MB,小于4096*4096 ,宽高均尽可能在1024附近,宽高比例不建议过于极端,否则出图效果不佳、延迟过长概率显著增加。输出图片宽高与输入图一致

请求说明

名称

内容

接口地址

https://visual.volcengineapi.com

请求方式

POST

Content-Type

application/json

请求参数
(1)header请求参数
公共请求参数
以下请求参数列表仅列出了接口请求参数和必要公共参数,完整公共参数列表见 公共参数

名称

类型

是否必填

描述

X-Date

String

使用UTC时间,精确到秒。请使用格式:YYYYMMDD'T'HHMMSS'Z' ,例如:20201103T104027Z

Authorization

String

HMAC-SHA256:签名方法
-Credential为签名凭证,其中:
-AccessKeyId为访问密钥ID,可在 访问密钥(Access Key) 获取;
-ShortDate为请求的短时间,使用UTC时间,精确到日。请使用格式:YYYYMMDD,例如:20180201
-Region为请求地区,国内一般为为cn-north-1
-Service为请求的服务,一般为cv
-SignedHeaders为参与签名计算的头部信息,content-typehost 为必选头部;
-Signature为签名,可在 签名方法 获取。
注:我们提供了SDK及签名示例供您实现服务快速接入,具体可参考 快速接入
例如:HMAC-SHA256 Credential={AccessKeyId}/{ShortDate}/{Region}/{Service}/request, SignedHeaders={SignedHeaders}, Signature={Signature}

X-Security-Token

String

指安全令牌服务(Security Token Service,STS) 颁发的临时安全凭证中的SessionToken,使用长期密钥时无需填写该参数。

(2)Query参数
业务请求参数

参数

可选/必选

类型

说明

Action

必选

String

接口名,取值:Img2ImgXLSft

Version

必选

String

版本号,取值:2022-08-31

(3)Body参数
业务请求参数

参数

可选/必选

类型

说明

req_key

必选

String

算法名称,取固定值为i2i_xl_sft

binary_data_base64

可选

Array of String

输入图的base64数组与image_urls二选一

image_urls

可选

Array of String

输入图的url数组与binary_data_base64二选一

prompt

可选

string

用于生成图像的提示词,支持中英文输入,建议内容简洁准确,控制在100中文字/英文单词以内,超出部分对生成效果影响较小

seed

可选

int

随机种子,-1为不随机种子;其他为指定随机种子
默认值:-1

ddim_step

可选

int

生成图像的步数
默认值:20 取值范围[1-50]

scale

可选

float

影响文本描述的程度
默认值:7.0 取值范围[1, 30]

controlnet_args

可选

list[ControlnetArgs]

类似controlnet配置
可参考输入图的canny(轮廓边缘)、depth(景深)、pose(人物姿态)进行出图

style_reference_args

可选

StyleReferenceArgs

风格配置
可参考输入图的风格进行出图

return_url

可选

bool

输出是否返回图片链接

logo_info

可选

LogoInfo

水印信息

ControlnetArgs

名称

类型

必选/可选

描述

type

string

必选

类似ControlNet 保持构图的方案
canny(轮廓边缘)、depth(景深)、pose(人物姿态)三选一

strength

float

必选

ControlNet强度
取值范围:[0.0, 1.0]
0的时候效果上不生效,但会存在潜在的额外开销,这时候建议整个结构体不传
单Control能力建议默认strength值为0.4

binary_data_index

int

必选

binary_data图片的下标
取值范围:[0, len(binary_data) - 1]

StyleReferenceArgs

名称

类型

必选/可选

说明

备注

id_weight

float

可选

ID 保持的强度
取值范围:[0.0, 1.0]
默认值0.2

ID保持的作用是人脸保持,人脸数据来源于binary_data[0]

style_weight

float

可选

风格迁移的强度
取值范围:[0.0, 1.0]
默认值0.0

风格迁移的作用是控制输入图和风格参考图的相似性,风格参考图从binary_data[binary_data_index] 读取

binary_data_index

int

必选

binary_data图片的下标
取值范围:[0, len(binary_data) - 1]

LogoInfo
水印相关信息。

名称

类型

必选

描述

备注

add_logo

Boolean

是否添加水印。True为添加,False不添加。默认不添加

position

Int

水印的位置,取值如下:
0-右下角
1-左下角
2-左上角
3-右上角
默认0

language

Int

水印的语言,取值如下:
0-中文(AI生成)
1-英文(Generated by AI)
默认0

opacity

Float

水印的不透明度,取值范围0-1,1表示完全不透明,默认0.3

(4)请求示例

{
    "req_key": "i2i_xl_sft",
    "image_urls": [
        "https://xxx"
    ],
    "prompt": "美女",
    "seed": -1,
    "ddim_step": 20,
    "scale": 7.0,
    "controlnet_args": [
        {
            "type": "canny",
            "strength": 0.4,
            "binary_data_index": 0
        }
    ],
    "style_reference_args": {
        "id_weight": 0.2,
        "style_weight": 0.0,
        "binary_data_index": 0
    },
    "etta_args": {
        "binary_data_index": 0
    },
    "return_url": true,
    "logo_info": {
        "add_logo": true,
        "position": 2,
        "language": 0,
        "opacity": 1
    }
}

输出说明

(1)通用输出参数
请参考通用返回字段及错误码
(2)业务输出参数
data 字段说明

字段

类型

说明

binary_data_base64

array of string

返回图片的base64数组。

image_urls

array of string

输出处理过的图片url
数组(单张图)

(3)输出示例

{
    "code": 10000,
    "data": {
        "algorithm_base_resp": {
            "status_code": 0,
            "status_message": "Success"
        },
        "binary_data_base64": [],
        "comfyui_cost": 11,
        "controlnet_args": [
            {
                "binary_data_index": 0,
                "strength": 0.4,
                "type": "canny"
            }
        ],
        "controlnet_args.canny.binary_data_index": 0,
        "controlnet_args.canny.strength": 0.4,
        "controlnet_args.depth.binary_data_index": 0,
        "controlnet_args.depth.strength": 0,
        "controlnet_args.pose.binary_data_index": 0,
        "controlnet_args.pose.strength": 0,
        "custom_prompt": "美女",
        "ddim_step": 20,
        "etta_args": {
            "binary_data_index": 0
        },
        "etta_args.binary_data_index": 0,
        "height": 1024,
        "image_urls": [
            "https://xxx",
            "https://xxx"
        ],
        "logo_info": {
            "add_logo": true,
            "language": 0,
            "opacity": 1,
            "position": 2
        },
        "multi_pipeline_select_key": "t2i",
        "prompt": "beautiful woman",
        "prompt_translated": "beautiful woman",
        "request_id": "8bcd844f913c89717d474d0af05f6bb96e0f4f2d409a379f84349a8952a92121",
        "return_url": true,
        "scale": 7,
        "seed": -1,
        "style_reference_args": {
            "binary_data_index": 0,
            "id_weight": 0.2,
            "style_weight": 0
        },
        "style_reference_args.binary_data_index": 0,
        "style_reference_args.id_weight": 0.2,
        "style_reference_args.style_weight": 0,
        "width": 1024
    },
    "message": "Success",
    "request_id": "20240809145732F1B86B6E94464D05716A",
    "status": 10000,
    "time_elapsed": "12.696326169s"
}

错误码

(1)通用错误码
请参考通用返回字段及错误码
(2)业务错误码

HttpCode

错误码

错误消息

描述

200

10000

请求成功

400

50411

Pre Img Risk Not Pass

输入图片前审核未通过

400

50511

Post Img Risk Not Pass

输出图片后审核未通过

400

50412

Text Risk Not Pass

输入文本前审核未通过

400

50512

Post Text Risk Not Pass

输出文本后审核未通过

400

50413

Post Text Risk Not Pass

输入文本NER、IP、Blocklist等拦截