XMLFeedSpider例子

还是用xml的模板爬xml 来的直接。

TestItem in items.py:

class TestItem(scrapy.Item): id = scrapy.Field() name = scrapy.Field() description = scrapy.Field()

main:

from scrapy import log
from scrapy.contrib.spiders import XMLFeedSpider
from myproject.items import TestItem

class MySpider(XMLFeedSpider):
    name = 'example'
    start_urls = ['portfolio xii xml']
    iterator = 'xml' # This is actually unnecessary,since it's the default value
    itertag = 'PortfolioStatistics'  #Name of Parent Node

    def parse_node(self,response,node):
        item = TestItem()
        item['id'] = node.xpath('@_SalePosition').extract()  #Get Parent Node Attribute
        item['name'] = node.xpath('EquityStyle/EquityStyleCoreValue/StyleBox/text()').extract()  #Get son of grandson
        item['description'] = node.xpath('BondStatistics/EffectiveDuration/text()').extract() #Get Grandson
        return item

Output: [ {“description”: [“0.53”],“name”: [“6”],“id”: [“L”]} ]

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


php输出xml格式字符串
J2ME Mobile 3D入门教程系列文章之一
XML轻松学习手册
XML入门的常见问题(一)
XML入门的常见问题(三)
XML轻松学习手册(2)XML概念
xml文件介绍及使用
xml编程(一)-xml语法
XML文件结构和基本语法
第2章 包装类
XML入门的常见问题(二)
Java对象的强、软、弱和虚引用
JS解析XML文件和XML字符串详解
java中枚举的详细使用介绍
了解Xml格式
XML入门的常见问题(四)
深入SQLite多线程的使用总结详解
PlayFramework完整实现一个APP(一)
XML和YAML的使用方法
XML轻松学习总节篇