如何解决PyPDF2 Python 库的 .getNumPages() 方法将 pdf 中的总页数返回为 0
我想从 pdf 文件中检索文本,但使用此代码,我得到的总页数为 0。我应该如何改进才能在 pdf 中获得正确的总页数? 提前致谢。
[1]:https://i.stack.imgur.com/us7q5.pngstrong 文本
解决方法
(免责声明:我是本答案中使用的库 pText
的作者。)
作为 pypdf2
的替代方案,您也可以尝试 pText
。
1.加载Document
with open("input.pdf","rb") as pdf_file_handle:
doc = PDF.loads(pdf_file_handle)
2.获取DocumentInfo
doc_info = doc.get_document_info()
number_of_pages = doc_info.get_number_of_pages()
您可以在 GitHub 上或使用 PyPi 获得 pText。还有很多 examples,请查看它们以了解有关处理图像的更多信息。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。