You need to enable JavaScript to run this app.
导航
人像保持(动漫版)
最近更新时间:2024.12.19 17:00:19首次发布时间:2024.10.25 16:54:52

接口简介

聚焦动漫场景纤细风格的图生图能力,可以保持输出图片的人脸特征与输入「形象图」一致,输出图片风格支持通过「输入图」的风格、「风格图」的风格或文本prompt进行调节。

请求说明

名称

内容

接口地址

https://visual.volcengineapi.com

请求方式

POST

Content-Type

application/json

限制条件

名称

内容

图片要求

  1. 图片格式:JPG(JPEG), PNG, BMP 等常见格式, 建议使用JPG格式.
    最小 128 x 128 像素,最大 4096 x 4096 像素;
  2. base64格式下单张图片最大4.7Mb,2张图最大不超过8Mb.

Header参数

完整公共参数列表见 公共参数
本服务Region为cn-north-1; Service为cv

Query参数

拼接到url后的参数,示例:https://visual.volcengineapi.com?Action=CVProcess&Version=2022-08-31

参数

可选/必选

类型

说明

Action

必选

String

接口名,取固定值:CVProcess

Version

必选

String

版本号,取固定值:2022-08-31

Body参数

业务请求参数,放到request.body中,MIME-Type为application/json

参数

可选/必选

类型

说明

备注

req_key

必选

String

算法名称,取固定值为img2img_stable_accelerated_maintain_id_usage

binary_data_base64

必选
(与image_urls二选一)

array of String

输入图片base64数组

image_urls

必选
(与binary_data_base64二选一)

array of String

输入图片url数组

return_url

可选

bool

输出是否返回图片链接 (链接有效期为24小时)

logo_info

可选

LogoInfo

水印信息

基础参数

positive_prompt

可选

String

正向提示词,支持中英文输入,建议相对精简,过长内容不易生效
示例:"best_quality,anime_style,"

  • 纤细风格可考虑增加风格:anheiyinv, 或 houtu,
  • 更加暗黑风格、猩红,可添加:vampire,
  • 苍白皮肤可添加(pale skin:1.3),不要超过1.5,效果偏弱

negative_prompt

可选

String

负向提示词,支持中英文输入,建议相对精简,过长内容不易生效
示例:"full_body,low quality,worst quality,noise,(frame:1.1),burry,paper,border,profile,"

width

可选

int

分辨率-宽,不建议超过1280过多
默认值:1000

height

可选

int

分辨率-高,不建议超过1280过多
默认值:1000

seed

可选

int

随机种子
默认值:-1

step

可选

int

step
默认值:18

cfg

可选

float

cfg
默认值:6.0

形象图学习(需开启)

face_image

可选

String

指定输入形象图
示例:"uri://binary_data?index=0" (index对应输入图数组的下标)

未传时需要关闭facestyle_switch

face_v2_switch

可选

bool

开启形象图人脸特征v2,搭配face_image生效
默认值:false

特征学习

face_tagger_switch

可选

bool

开启v2反推提示词,反推性别和部分衣服、头发特征,如果prompt不含相关信息,可打开
默认值:false

face_weight

可选

float

形象特征权重,越高样貌偏接近形象图
默认值:0.6
取值范围:[0, 1]

facestyle_switch

可选

bool

开启形象图风格学习,学习face_image风格和着装、发色
默认值:false

风格学习

facestyle_weight

可选

float

形象风格权重,越高风格/服饰越接近形象图(注意:提示词影响力会变小)
默认值:0.6
取值范围:[0, 1]

额外风格图学习(需开启)

style_switch

可选

bool

开启额外风格图学习

style_image

可选

String

指定输入风格图
格式:"uri://binary_data?index=0" (index对应输入图数组的下标)

姿势保持

pose_switch

可选

bool

强制控制姿势开关,开启后,姿势固定面朝观众(注意:必定会生成人)
默认值:false

Image

pose_y

可选

float

姿势高度(百分比)
默认值:85

pose_scale

可选

float

人物占比大小(倍率)
默认值:1.8

高清化

upscale_quick_switch

可选

bool

开启超采开关,超采样将画面变得更干净扎实清晰,耗时增加1.0秒
默认值:false

分辨率不变

clarity_switch

可选

bool

锐化开关,使图片线条更锐利,推荐与upscale_quick_switch一同开启,耗时增加约0.4秒
默认值:false

clarity

可选

float

开启锐化程度,与clarity_switch搭配使用
默认值:0.6
取值范围:[0, 1]

其他功能

lora_a_weight

可选

float

觉得ID保持人脸不够成熟、或希望成熟画风时,可以开启该Lora
默认值:0.0
取值范围:[0, 1]
启用推荐值:0.4 / 0.6 / 0.8

facefix_switch

可选

bool

开启脸部修复,画面中每个人耗时+2~3秒
默认值:false

LogoInfo
水印相关参数

名称

类型

必选

描述

备注

add_logo

Boolean

是否添加水印。True为添加,False不添加。默认不添加

position

Int

水印的位置,取值如下:
0-右下角
1-左下角
2-左上角
3-右上角
默认0

language

Int

水印的语言,取值如下:
0-中文(AI生成)
1-英文(Generated by AI)
默认0

opacity

Float

水印的不透明度,取值范围0-1,1表示完全不透明,默认0.3

logo_text_content

String

明水印自定义内容

输出说明

通用输出参数

请参考通用返回字段及错误码

业务输出参数

重点关注data 字段,其他字段为公共返回

字段

类型

说明

binary_data_base64

array of string

返回图片的base64数组。

image_urls

array of string

输出处理过的图片url
数组(单张图)

请求&返回完整示例

请求示例

{
    "req_key": "img2img_stable_accelerated_maintain_id_usage",
    // "binary_data_base64": [],
    "image_urls": [
        "https://xxx"
    ],
    "face_image": "uri://binary_data?index=0",
    "style_image": "uri://binary_data?index=1",
    "positive_prompt": "best_quality,anime_style,",
    "negative_prompt": "full_body,low quality,worst quality,noise,(frame:1.1),burry,paper,border,profile,",
    "width": 1000,
    "height": 1000,
    "step": 18,
    "cfg": 4.5,
    "face_v2_switch": false,
    "face_tagger_switch": false,
    "upscale_quick_switch": false,
    "clarity_switch": false,
    "clarity": 0.6,
    "face_detection_switch": true,
    "pose_switch": false,
    "pose_y": 85,
    "pose_scale": 1.8,
    "automl_switch": false,
    "automl_step": 12,
    "automl_cfg": 1,
    "facefix_switch": false,
    "face_weight": 0.6,
    "facestyle_weight": 0.6,
    "return_url": true,
    "logo_info": {
        "add_logo": false,
        "position": 0,
        "language": 0,
        "opacity": 0.3,
        "logo_text_content": "这里是明水印内容"
    }
}

输出示例

{
    "code": 10000,
    "data": {
        "algorithm_base_resp": {
            "status_code": 0,
            "status_message": "Success"
        },
        "binary_data_base64": [],
        "comfyui_cost": 2,
        "image_urls": [
            "https://xxx"
        ],
        "output_image": [
            "uri://binary_data?index=0"
        ]
    },
    "message": "Success",
    "request_id": "202410251640259DBF6851EEEA56A43XXX",
    "status": 10000,
    "time_elapsed": "3.99524385s"
}

错误码

(1)通用错误码
请参考通用返回字段及错误码
(2)业务错误码

HttpCode

错误码

错误消息

描述

200

10000

请求成功

400

50411

Pre Img Risk Not Pass

输入图片前审核未通过

400

50511

Post Img Risk Not Pass

输出图片后审核未通过

400

50412

Text Risk Not Pass

输入文本前审核未通过

400

50512

Post Text Risk Not Pass

输出文本后审核未通过

400

50413

Post Text Risk Not Pass

输入文本NER、IP、Blocklist等拦截

SDK使用说明

请参考SDK使用说明