使用时主要包含以下步骤:
步骤1:服务开通,在火山引擎控制台开通本产品的正式服务,方便计量计费;
步骤2:文件上传,与火山引擎工作人员线下沟通,将待处理PDF文件数据提交至火山引擎提供的指定tos存储地址;
步骤3:结果获取,最后再通过tos获取处理完成后结果;
使用火山引擎视觉智能控制台,开通本产品,请参考:新手指南
与火山引擎工作人员线下沟通,获取tos存储地址以及相关密钥;
1、在指定tos存储地址下新建当次解析的文件夹,例如20240614;
2、在该文件夹下面创建一个input文件夹,并上传PDF文件至该文件夹下,例如20240614/inputs;
文件夹新建、文件上传可参考:
1、方式一:利用火山引擎对象存储 SDK进行操作,参考如下指引,结合火山引擎侧提供的相关密钥,选择合适SDK使用;
2、方式二:利用火山引擎对象存储TOS Browser 图形化管理工具进行操作,参考如下指引,结合火山引擎侧提供的相关密钥,选择合适TOS Browser使用;
解析结果将在同级目录下的outputs文件夹,例如20240614/outputs;
1、markdown结果在outputs下的output_md,例如20240614/outputs/output_md,文件名为PDF文件名加".md"后缀;
2、详细信息存储在outputs下的output_json,例如20240614/outputs/output_json,文件名同理为PDF文件名加".json"后缀;
3、PDF文件中的插图图像保存在outputs下的element文件中,例如20240614/outputs/element;
解析结果获取可参考:
1、方式一:利用火山引擎对象存储 SDK进行操作,参考如下指引,结合火山引擎侧提供的相关密钥,选择合适SDK使用;
2、方式二:利用火山引擎对象存储TOS Browser 图形化管理工具进行操作,参考如下指引,结合火山引擎侧提供的相关密钥,选择合适TOS Browser使用;