xpath提取元素

# firefox
/html/body/div[2]/div[2]/div[4]/div[1]/div[2]/h2/a
#chrome
//*[@id="entry_662093"]/div[2]/h2/a

urls = response.xpath('//*[@id="news_list"]//h2[@class="news_entry"]/a/@href').extract()
url = response.xpath('//*[@id="news_list"]//h2[@class="news_entry"]/a/@href').extract_first("")

推荐xpath，用c语言写的，功能很强大，还有css选择器没有的内置函数

#css 选择器
url = response.css('div#news_list h2 a::attr(href)').extract()

xpath提取元素

xpath提取元素

results matching ""

No results matching ""