如何解决用perl和www :: mechanize在HTML页面上打开文件夹
|| 我正在尝试使用perl从网页下载所有文件。问题是,下载文件被“隐藏”在单击“加号”小符号时打开的文件夹后面。我可以一个接一个地打开每个文件,下载内容,返回,打开下一个文件,依此类推。我想知道是否有一种优雅的方式可以使用WWW::Mechanize
或LWP::UserAgent
来打开一个文件夹。一口气然后收集所有下载链接?
我感兴趣的HTML如下所示:
<td width=\'0\' nowrap><a href=\"...link\" onmouseover=\"window.status=\'Close the folder Homework #2.\'; return true;\" ONMOUSEOUT=\"window.status=\'\';return true;\">
如果我在查看源代码时单击该链接,则会打开一个新页面,显示所有打开了该文件夹的文件夹。现在我可以查看源代码了,用mirror()
拔出文件,很好。
但是必须有一种比每一种方式都更优雅的方式了吗?并全部打开?
我可以预见的类似问题是,如何从HTML标记中知道这是单击以打开文件夹的按钮? (有些相关性,特别是如果事实证明我必须循环浏览每个页面,并考虑页面上还有其他链接)
提前致歉,因为我仍在学习perl,并且我有0 HTML经验。让我知道您是否需要更多的HTML或一些屏幕截图,以使我的问题更加清楚。
感谢所有抽出宝贵时间看的人!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。