如何解决无法从PDF
我有一个包含以下示例文本的PDF文档(屏幕截图)-
但是当我将其复制并粘贴到单词或其他文本编辑器中时,我看到的只是奇怪的字符:
我不太确定为什么会给我怪异的方形框,而不是粘贴清晰易读的字母(就像屏幕截图一样)。有人可以帮我摆脱这个问题吗?或者至少我应该怎么确定这个奇怪问题的根本原因?
解决方法
===================解决方法=================
- 我尝试将文档损坏的unicode转换为标准ANSCI unicode格式。但是大多数在线服务都无法识别这些垃圾/怪异字符。
- 可以通过一些编程来解决此问题,但我不想花时间在编程方法上,而是优先采用动态方法。
- 最后,根据用户'mkl'的建议,使用问题解决的OCR服务(如“ Sedja” /“ Adobe OCR”)转换此文档。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。