多语种OCR服务,除了可以提供中英文字识别能力以外,还支持日语、法语、德语、俄语等50+语言的文字识别,可通过参数设置识别模式。
名称 | 内容 |
---|---|
输入要求 | 1. 文件格式:支持JPG、JPEG、PNG、BMP、PDF等常见格式,建议使用JPG格式。 2. 图片像素尺寸:最小 256 x 256 像素,最大 2048 x 2048 像素。为了保证文字识别效果,推荐图片最短边长不低于256像素。 3. 文件大小: a.要求Base64编码和urlencode之后不超过 8 MB。文字主体尽量占据图片主要区域,不支持黑白图片。 b.如果传图片及PDF完整URL,URL对应文件大小建议不要超过8MB。 4. 输入文件过大时,返回的HttpCode如下:400/413/502。 5. 注意图片质量:保证图片足够清晰,不应该有因为压缩导致的噪声。 6. 图片需要有版权,有肖像权,没有法律或者政策风险的。相关风险请注意评估。 7. 输入多页PDF时,默认只识别第一页。 |
名称 | 内容 |
---|---|
接口地址 | https://visual.volcengineapi.com |
请求方式 | POST |
Content-Type | application/x-www-form-urlencoded |
是否需要鉴权 | 是 |
以下请求参数列表仅列出了接口请求参数和必要公共参数,完整公共参数列表见 公共参数。
名称 | 类型 | 是否必填 | 描述 |
---|---|---|---|
X-Date | String | 是 | 使用UTC时间,精确到秒。请使用格式:YYYYMMDD'T'HHMMSS'Z' ,例如:20201103T104027Z |
Authorization | String | 是 | HMAC-SHA256:签名方法 |
X-Security-Token | String | 否 | 指安全令牌服务(Security Token Service,STS) 颁发的临时安全凭证中的SessionToken,使用长期密钥时无需填写该参数。 |
参数 | 可选/必选 | 类型 | 说明 |
---|---|---|---|
Action | 必选 | String | 接口名,取值:MultiLanguageOCR |
Version | 必选 | String | 版本号,取值:2022-08-31 |
参数 | 可选/必选 | 类型 | 说明 |
---|---|---|---|
image_base64 | 与image_url二选一 | String | 图片文件,base64编码 注意: 只需要传图片的base64值,类似data:image/png;base64的图片头不要传入 |
image_url | 与image_base64二选一 | String | 图片/PDF文件的URL链接 注意: 要求image_base64与image_url二选一,如果2个字段都有,优先解析image_base64。 |
approximate_pixel | 可选 | String | 文本行高度差距为approximate_pixel时近似为同一行,未选时默认为"0" |
mode | 可选 | String | 文字识别模式:"default"-默认模式、"text_block"-文本块模式 |
filter_thresh | 可选 | String | 置信分数低于filter_thresh的文本行将被过滤掉, 默认为"80", 最大为"100" |
请参考通用返回字段及错误码 |
data 字段说明
字段 | 类型 | 说明 | 备注 |
---|---|---|---|
ocr_infos | MultilangTextResult | 主页面信息 | 字段说明见下方 |
MultilangTextResult 字段说明
字段 | 类型 | 说明 | 备注 |
---|---|---|---|
lang | Lang | 语种 | 字段说明见下方 |
text | String | 每行文字的识别结果 | 主页信息 |
rect | Point | 每行文字的位置, 4组(x,y)坐标, 分别为(左上,右上,右下,左下) | 主页信息 |
prob | Float | 每行文字的识别概率 | 主页信息 |
Lang 字段说明
缩写 | 语种 | 缩写 | 语种 | 缩写 | 语种 | 缩写 | 语种 |
---|---|---|---|---|---|---|---|
zh | 中文 | de | 德语 | pa | 旁遮普语 | kk | 哈萨克语 |
en | 英文 | it | 意大利语 | mr | 马拉地语 | el | 希腊语 |
ja | 日文 | es | 西班牙语 | az | 阿塞拜疆语 | ga | 爱尔兰语 |
ko | 韩语 | fr | 法语 | id | 印尼语 | be | 白俄罗斯语 |
vi | 越南语 | pl | 波兰语 | ms | 马来语 | km | 高棉语 |
th | 泰语 | pt | 葡萄牙语 | not_lang | 非语言-如纯数字等 | tl | 他加禄语 |
ar | 阿拉伯语 | ca | 加泰罗尼亚语 | hu | 匈牙利语 | ps | 普什图语 |
bn | 印度-孟加拉语 | ru | 俄语 | lb | 卢森堡语 | fa | 波斯语 |
gu | 印度-古吉拉特语 | bs | 波斯尼亚语 | lt | 立陶宛语 | tg | 塔吉克斯坦语 |
hi | 印度-印地语 | cs | 捷克语 | lv | 拉脱维亚语 | ||
kn | 印度-卡纳达语 | da | 丹麦语 | mt | 马耳他语 | ||
ml | 印度-马拉亚拉姆语 | et | 爱沙尼亚语 | nl | 荷兰语 | ||
ta | 印度-泰米尔语 | fi | 芬兰语 | no | 挪威语 | ||
te | 印度-泰卢固语 | hr | 克罗地亚语 | sk | 斯洛伐克语 | ||
sl | 斯洛文尼亚语 | sv | 瑞典语 | tr | 土耳其语 |
{ "code":10000, "data":{ "ocr_infos":[ { "lang": "en", "prob": "0.9840925931930542", "rect": [[186, 3], [290, 2], [290, 14], [187, 15]], "text": "Untitled 4 - Edited", }, { "lang": "ja", "prob": "0.9873754382133484", "rect": [[22, 23], [450, 23], [450, 53], [22, 53]], "text": "で使われている膨大な用語から辞", }, { "lang": "ja", "prob": 0.9925921559333801, "rect": [[3, 63], [460, 63], [460, 93], [3, 93]], "text": "書を作成しました。珍しい人名や地", }, { "lang": "ja", "prob": 0.9882089495658875, "rect": [[1, 102], [462, 102], [462, 134], [1, 134]], "text": "名、難しい専門用語から、流行の顔", }, { "lang": "ja", "prob": 0.9895573258399963, "rect": [[2, 143], [459, 143], [459, 173], [2, 173]], "text": "文字やお店の名前まで。辞書は定期", }, { "lang": "ja", "prob": 0.9945052266120911, "rect": [[2, 182], [460, 182], [460, 212], [2, 212]], "text": "的に自動更新され、常に最新の語彙", }, { "lang": "ja", "prob": 0.9901278614997864, "rect": [[5, 222], [216, 222], [216, 251], [5, 251]], "text": "を利用できます。", }, ] }, "message":"Success", "request_id":"68893249940530155591604045972", "status":10000, "time_elapsed":"193.547357ms" }
请参考通用返回字段及错误码
HttpCode | 错误码 | 错误消息 | 描述 |
---|---|---|---|
200 | 10000 | "Success" | 请求成功 |
400 | 50204 | "Parse Request Parameters Error" | 请求参数缺失或错误 |
400 | 50205 | "Image Size Exceeds Maximum Limit: please compress the image" | 输入文件过大 |
400 | 50207 | "Image Decode Error: image format unsupported" | 图片解码错误 |
400 | 50217 | "Process PDF File Error." | 处理PDF文件错误 |
400 | 63001 | "Call OCR Server Failed." | OCR服务处理该输入时出现错误, 建议先确认请求的图片数据是否正常,如图片数据无问题请联系工作人员并提交对应的request_id |