如何解决Computer Vision 2.0 PDF到文本无法正常工作
我正在尝试使用Computer Vision 2.0从PDF文件解析文本。我正在关注example,并将MediaTypeHeaderValue更改为“ application / pdf”。我收到一个错误,指出不支持内容类型。我将其更改为“ multipart / form-data”,并在处理中出现错误。如何使用Computer-Vision处理PDF文件?
解决方法
Kevin, 您正在使用不支持PDF输入的旧版“ OCR” API。请使用"Read" API - see overview可用的新OCR技术处理PDF文档。自5月份起,GA中便已发布3.0版。 Read支持大图像以及长达2000页的多页和混合语言文档。 请参阅Read REST API QuickStart in C#。
请注意,如果您不仅要提取文本,还希望从表单中提取表格见解(例如表格,复选框和键值对),使用预先构建的模型并构建自定义模型来处理文档,则Form Recognizer非常有用。 。现在在GA中。
,看看用于从PDF提取数据的Form Recognizer服务。 https://azure.microsoft.com/en-us/services/cognitive-services/form-recognizer/
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。