如何解决如何使用Pentaho Data Integration-SpoonKettle从HTTPS URL将CSV下载到文件?
谷歌搜索这个问题时,似乎有人问了它,并且部分(而且效果很差)回答了很多次,主要是旧版本。
问题:在以下约束下,如何将CSV下载到本地文件?我正在Spoon中进行设计。
URL :将始终相同。 How to apply CSS to iframe?。网站准备了csv,并在大约4-5秒后将其作为文件下载提供给Web客户端。在浏览器中,这意味着它以.csv格式下载,而不显示。
身份验证:该网站不需要身份验证即可访问。数据不敏感。
本地文件路径:下载的CSV文件将覆盖现有的csv。例如:d:\ data \ my.csv。即,我可以将其设置为计时器,并使其每小时大约下载最新的csv。
代理:我很可能需要遍历网络代理。例如badproxy.mynetwork.internal:8080,该代理需要用户名和密码。如果我可以在一个位置设置此密码,这样更好,以后创建的任何东西都可以引用它。也不十分确定该如何处理。
我的其余过程集中于解决csv的内容,并且已经可以正常工作了。
我在google上找到的过程使用Http Client组件显示,尽管并不是特别简单,它如何转换为将文件本地保存到已知位置的文件。
感谢任何指针。
PDI v9.0.0.0-423
解决方法
需要触发 HTTP 客户端步骤。使用行生成器步骤生成例如1 个空行并将其与一个跃点链接到 HTTP 客户端步骤。 对于您的解决方案,试试这个: 数据网格-->HTTP 客户端-->CSV 文件输入->文本文件输出(用 csv 扩展)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。