使用RSelenium下载pdf

发布时间:2019-12-09 发布网站:脚本之家
脚本之家收集整理的这篇文章主要介绍了使用RSelenium下载pdf脚本之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我想用RSelenium包做的是,

步骤:1访问网站 – 我自己的电力公用事业提供商

步骤:2通过明确提供我的用户名和密码来访问我的帐户(这就是我无法共享代码的原因)

步骤3我点击“查看我的账单”.
该法案以pdf格式显示.

有没有办法下载该文件并保存到特定文件夹?
当我使用download.file()命令时,它不保存文档,而是我得到一个3KB的pdf文件,我无法打开. Adobe Reader说读取文档时出错.

我试过的可能方法:
1.右键单击,按下箭头四次,然后转到“SAVE PAGE AS”,单击Enter.

但随后会弹出一个询问文件名和位置的对话框,我无法通过RSelenium输入这些详细信息并保存文件.

示例代码:在线发现一些随机PDF.

url<- "http://www.immigrationpolicy.org/sites/default/files/docs/how_us_immig_system_works.pdf"

setwd("C:/Users/king/Desktop/bill")
library(RSelenium)
library(downloader)
checkForServer()
startServer()
remDr <- remoteDriver()
remDr$open()
remDr$navigate(url)

解决方法

我找到了持续研究的答案.

首先检查是否Rtools is installed(使用此链接找到答案)

然后更新了我的程序

`cprof<-makeFirefoxProfile(list(
  "pdfjs.disabled"=TRUE,"plugin.scan.plid.all" = FALSE,"plugin.scan.Acrobat" = "99.0","browser.helperApps.neverAsk.saveToDisk"='application/pdf',))
remDr <- remoteDriver(extraCapabilities=cprof)`

尝试仍然更改我无法找到的下载文件夹.我从THIS link找到答案

总结

以上是脚本之家为你收集整理的使用RSelenium下载pdf全部内容,希望文章能够帮你解决使用RSelenium下载pdf所遇到的程序开发问题。

如果觉得脚本之家网站内容还不错,欢迎将脚本之家网站推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:76874919,请注明来意。

脚本之家官方公众号

微信公众号搜索 “ 程序精选 ” ,选择关注!

微信公众号搜索 “ 程序精选 ” ,选择关注!
精选程序员所需精品干货内容!

标签: