如何解决使用puppeteer下载时是否可以请求图像的jpg版本
我是这里的菜鸟,请对我温柔:)
我正在使用puppeteer从供应商网站中提取数据(他们已允许我执行此操作)并将其导入WordPress / WooCommerce中。我可以毫无问题地获取产品数据,但是我却碰壁了图像。
我可以很好地提取图像。我面临的问题是该网站正在以webp格式提供某些图像。据我了解,服务器将/应该同时具有.jpg和.webp图像,如果浏览器支持,它将提供webp图像。
因此,我从中获取图像的URL类似于“ https://example.com/images/myimage.jpg”,但实际上是给了我webp图像。我需要从网站上获取图像时要知道是否获得了jpg或webp版本,以便我可以适当地保存它,然后弄清楚该怎么做。
我计划在知道我实际拥有的扩展名时使用Sharp转换这些图像
所以我想有几个问题;
- 是否有可能迫使伪娘不向我提供webp格式而只给我jpg? 或
- 在提取图像时是否可以在保存之前查看其实际类型,以便知道将其另存为什么扩展名?
- Sharp是否可以在尝试转换之前识别图像类型?
谢谢,丹
解决方法
像puppeteer一样,您可以设置用户代理。如果将其设置为不支持webp图像的浏览器,则默认情况下会为我提供jpg图像
page.setUserAgent('Mozilla/5.0 CK={} (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko')
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。