如何解决有没有一种方法可以自动标记具有特定页面布局的页面或获得正确的阅读顺序?
很抱歉,如果有人在其他地方问过这个问题,我看了一下,但是找不到答案。我每天都在工作中每天处理美国专利PDF。 PDF是从TIFF图像创建的,开头没有识别文本,没有有用的标签等。我遇到的问题是,自动添加标签功能会使识别页面元素的错误太多。有时,它将一列文本标记为表格。有时,它会将两个并排的列标记为一个大表,等等。
由于这些页面元素在成千上万的文档中保持不变,有没有办法让我告诉Acrobat我希望标签的内容如何?例如,总有一列文本,其高度为9.25英寸乘3英寸宽,其上角距页面顶部1 1/6英寸,距页面1 1/12英寸。我希望能够自动将页面的此区域识别为单个文本列,而不必每次自行修复。这可能吗?非常感谢您的帮助。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。