如何解决从pdf文件读取到文本不会产生任何结果
所以我正在尝试一些非常简单的方法:我只想将pdf文件中的文本读入一个变量-就是这样。这就是我得到的:
有人知道可靠的方法来将pdf读入文本文件吗?
解决方法
尝试以下库-pdfplumber:
import pdfplumber
pdf_file = pdfplumber.open('anyfile.pdf')
page = pdf_file.pages[0]
text = page.extract_text()
print(text)
pdf_file.close()
我以前没有使用过PyPDF2,但是pdfplumber似乎对我来说很好。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。