支持对同一张图片中出现的多张不同种类的票据的字段解析,包含增值税发票、增值税卷票、出租车票、定额发票、火车票、行程单、高速公路过路费发票、客运发票以及其他发票混贴业务场景,满足财会报销场景的多样化信息提取需求。
名称 | 内容 |
---|---|
输入要求 | 1. 文件格式:支持JPG、JPEG、PNG、BMP、PDF、OFD等常见格式,建议使用JPG格式。 2. 文件大小: a.要求Base64编码和urlencode之后不超过 8 MB。 b.如果传图片及PDF完整URL,URL对应文件大小建议不要超过8MB。 3. 输入文件过大时,返回的HttpCode如下:400/413/502。 4. 输入多页PDF时,默认只识别第一页。 |
名称 | 内容 |
---|---|
接口地址 | https://visual.volcengineapi.com |
请求方式 | POST |
Content-Type | application/x-www-form-urlencoded |
是否需要鉴权 | 是 |
以下请求参数列表仅列出了接口请求参数和必要公共参数,完整公共参数列表见 公共参数。
名称 | 类型 | 是否必填 | 描述 |
---|---|---|---|
X-Date | String | 是 | 使用UTC时间,精确到秒。请使用格式:YYYYMMDD'T'HHMMSS'Z' ,例如:20201103T104027Z |
Authorization | String | 是 | HMAC-SHA256:签名方法 |
X-Security-Token | String | 否 | 指安全令牌服务(Security Token Service,STS) 颁发的临时安全凭证中的SessionToken,使用长期密钥时无需填写该参数。 |
参数 | 可选/必选 | 类型 | 说明 |
---|---|---|---|
Action | 必选 | String | 接口名,取值:OcrFinance |
Version | 必选 | String | 版本号,取值:2021-08-23 |
参数 | 可选/必选 | 类型 | 说明 |
---|---|---|---|
image_base64 | 与image_url二选一 | String | 图片/PDF文件,base64编码 注意: 只需要传图片/PDF的base64值,类似data:image/png;base64的图片头不要传入 |
image_url | 与image_base64二选一 | String | 图片/PDF文件的URL链接 注意: 要求image_base64与image_url二选一,如果2个字段都有,优先解析image_base64。 |
请参考通用返回字段及错误码 |
字段 | 类型 | 说明 | 备注 |
---|---|---|---|
invoice_main | []item | 主页面信息 | 字段说明见下方 |
字段 | 类型 | 说明 | 备注 |
---|---|---|---|
image_name | String | 图片名称 | 主页信息 |
corners | corner | 票据位置坐标(以文字正向为参考,左上角为第0个点,顺时针依次为剩余3个点) | 主页信息 |
invoice_type | String | 票据类型 | 主页信息 |
invoice_prob | float64 | 票据种类预测概率 | 主页信息 |
item_infos | []item_info | 票据字段信息 | 主页信息 |
current_page | int | 票据当前页码 | 主页信息 |
total_page_number | int | 票据总页码 | 主页信息 |
字段 | 类型 | 说明 | 备注 |
---|---|---|---|
x0 | int | x0坐标 | 主页信息 |
y0 | int | y0坐标 | 主页信息 |
x1 | int | x1坐标 | 主页信息 |
y1 | int | y1坐标 | 主页信息 |
x2 | int | x2坐标 | 主页信息 |
y2 | int | y2坐标 | 主页信息 |
x3 | int | x3坐标 | 主页信息 |
y3 | int | y3坐标 | 主页信息 |
票据类型 | 说明 | 备注 |
---|---|---|
taxi | 出租车票 | 支持票据分类和识别,具体识别字段信息与「出租车发票识别」接口文档一致,详见:接口文档 |
vat | 增值税发票 | 支持票据分类和识别,具体识别字段信息与「增值税发票识别」接来源于出租车发票识别接口文档一致,详见:接口文档 |
roll | 增值税卷票 | 支持票据分类和识别,具体识别字段信息与「增值税卷票识别」接口文档一致,详见:接口文档 |
ticket | 火车票 | 支持票据分类和识别,具体识别字段信息与「火车票识别」接口文档一致,详见:接口文档 |
quota | 定额发票 | 支持票据分类和识别,具体识别字段信息与「定额发票识别」接口文档一致,详见:接口文档 |
pass_invoice | 高速公路过路费发票 | 支持票据分类和识别,具体识别字段信息与「高速公路过路费发票识别」接口文档一致,详见:接口文档 |
flight | 行程单 | 支持票据分类和识别,具体识别字段信息与「行程单识别」接口文档一致,详见:接口文档 |
vehicle_invoice | 客运发票 | 仅支持票据分类 |
medical_bill | 医疗发票 | 仅支持票据分类 |
other_ele | 其他发票类型 | 不属于以上分类的发票类别,仅支持票据分类 |
others | 其他 | 不能识别的发票 |
字段 | 类型 | 说明 | 备注 |
---|---|---|---|
item_key | String | 字段名称 | 主页信息 |
item_value | String | 字段值 | 主页信息 |
{ "code":10000, "data":{ "invoice_main":{ "items":[ { "image_name":"11", "conners":{ "x0":679, "y0":424, "x1":693, "y1":820, "x2":470, "y2":839, "x3":446, "y3":433 }, "invoice_type":"ticket", "invoice_prob":0.9991505146026611 }, { "image_name":"11", "conners":{ "x0":442, "y0":438, "x1":450, "y1":832, "x2":202, "y2":845, "x3":191, "y3":436 }, "invoice_type":"ticket", "invoice_prob":0.9999958276748657 }, { "image_name":"11", "conners":{ "x0":670, "y0":241, "x1":678, "y1":431, "x2":163, "y2":436, "x3":144, "y3":222 }, "invoice_type":"taxi", "invoice_prob":0.9999946355819702 } ] } }, "message":"Success", "request_id":"68989479063430123651606286484", "status":10000, "time_elapsed":"2.81548946s" }
请参考通用返回字段及错误码
HttpCode | 错误码 | 错误消息 | 描述 |
---|---|---|---|
200 | 10000 | 无 | 请求成功 |
400 | 50205 | "Image Size Exceeds Maximum Limit: please compress the image" | 输入文件过大 |
400 | 50206 | "Invalid Input Image: image is empty" | 输入图片为空 |
400 | 50207 | "Image Decode Error: image format unsupported" | 图片解码错误 |
400 | 50217 | "Process PDF File Error." | 处理PDF文件错误 |
400 | 60103 | "Missing Input Parameters: empty input image" | 输入图片为空 |
400 | 60301 | "Invalid Input Image: get input image error" | 获取图片错误 |
400 | 61301 | "Invalid Input Parameters: Input image can not be decoded" | 输入图片错误 |