如何解决从R中有两列的PDF中很好地提取文本
我正在尝试提取公司年度报告的文本。它的设计主要集中在两列中。所以我不知道如何正确提取它,因为在RI中,使用pdftools软件包时,我提取的是第一列的第一行,而不是第二列的第二行。 / p>
这是我的代码:
library(pdftools)
readpdf<- pdf_text("https://www.telefonica.com/documents/153952/13347920/2019-Telefonica-Consolidated-Management-Report.pdf/0a9c8382-c9ff-ba52-1d5b-e431a7efab3f")
如何正确执行此操作?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。