我现在没有足够的声誉分数来回答我发现的一个问题 - 如何使用 python 将 pdf 页面分成两半并重新组合以
有没有办法在 PDF 中添加超链接?
例如:
<pre><code>url = "https://www.google.com/"
# This cell should
尝试裁剪几个 PDF 页面并将它们合并为一个角色样式页面。
我需要去掉每页的石南花和页脚并创建一个
这里我从第一个函数返回 pdf 文件,
<pre><code>def file_pdf_to_merge(id):
pdf=SimpleDocTemplate(file_name(id))
考虑以下文章
<pre><code>https://arxiv.org/pdf/2101.05907.pdf
</code></pre>
这是一篇典型格式的学术论文,pdf文
我的代码可以读取 PDF 文件,但我无法使用 PyPDF2 提取文本。它以前与其他PDF文件一起使用。为什么文本
尝试将图像写入特定位置的 pdf 文件。在此代码中,“Reporting.pdf”文件包含一个模板,我必须在其中粘
我试图附加一个包含名称和页码的书签,但我无法使用书签保存文件。
这是代码:
<pre><code>import PyPDF
在 Python 中执行脚本时,我们收到错误“ghostscript._gsprint.GhostscriptError: Fatal”
这里有详细说明:
我正在编写一个使用文本转语音阅读 PDF 的脚本,但 PyPDF2 无法阅读阿拉伯语 PDF。
<pre><code> import pyttsx
我一直在学习 Python PyPDF2,这是 geeksforgeeks.org/ 上的代码
<pre><code>// calc.c
// a program reads math function names
我正在尝试使用 python PyPDF2 包获取 pdf 文件中的内容。但是得到这个错误。
TypeError: 'IndirectObject' 类
我从 python 开始,但有一个小问题。我正在尝试编写一个应用程序来重命名文件夹中的文件。
运行
我正在尝试使用 Python 构建文本朗读应用程序。这是我的代码:
<pre><code>import pyttsx3
import PyPDF2
book=open
因此,我花了一些时间尝试使用 <code>PyPDF2</code> 提取数据,但即使 pdf 看起来(从眼睛看来)它们具有相
我正在使用 <a href="https://pypi.org/project/PyPDF2/" rel="nofollow noreferrer">PyPDF2</a> 将多个 PDF 文件合并为一个输出
我正在尝试使用以下代码将多个 PDF 转换为 HTML:
<pre><code>import os
for x in range(100) :
pathName = "/Users/su
我能够从 PDF 中提取基本元数据,例如作者、格式、标题、关键字、制作人等。但是我无法通过转到以下
我有 5000 多个 pdf 文件,每个文件至少 15 页,最多 20 页。我使用 pypdf2 找出 5000 个 pdf 文件中哪些有我要
我想使用 Python 3 从列出以下格式信息的 PDF 中提取文本:
<h2>CA</h2>
<h2>洛杉矶</h2>
史密斯、乔 C.