scrapy下载图片

网友投稿 260 2022-11-24

scrapy下载图片

items.py: fishPicId = scrapy.Field() #图片url地址。要是个列表 image_path = scrapy.Field() #->>保存img绝对路径。 spider.py: item['fishPicId'] = [img_src] # ImagesPipeline用到的是图片的url列表 settings.py: ITEM_PIPELINES = { 'LXSpider.pipelines.LxspiderPipeline': 300, 'LXSpider.pipelines.DownloadImagesPipeline': 100 } import os IMAGES_URLS_FIELD ="fishPicId" #fishPicId:在items.py中配置的爬取得图片地址 project_dir = os.path.abspath(os.path.dirname(__file__)) #获取当前爬虫项目的绝对路径 IMAGES_STORE = os.path.join(project_dir,'images') #组装新的图片路径,设置图片存储目录 # IMAGES_MIN_HEIGHT = 1 #设定下载图片的最小高度 # IMAGES_MIN_WIDTH = 1 #设定下载图片的最小宽度 pipelines.py: '''保存图片绝对路径''' from LXSpider.images.full import img_abspath from scrapy.pipelines.images import ImagesPipeline class DownloadImagesPipeline(ImagesPipeline): def item_completed(self, results, item, info): for ok, value in results: # 通过断点可以看到图片路径存在results内 image_file_path = img_abspath+str(value['path']).replace('/','\\') # 将路径保存在item中返回 item['image_path']=image_file_path return item

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Java反射概念与使用实例代码
下一篇:是德科技DAQ970A/DAQ973A数据采集仪的功能
相关文章

 发表评论

暂时没有评论,来抢沙发吧~