xpath提取元素
# firefox
/html/body/div[2]/div[2]/div[4]/div[1]/div[2]/h2/a
#chrome
//*[@id="entry_662093"]/div[2]/h2/a
urls = response.xpath('//*[@id="news_list"]//h2[@class="news_entry"]/a/@href').extract()
url = response.xpath('//*[@id="news_list"]//h2[@class="news_entry"]/a/@href').extract_first("")
推荐xpath,用c语言写的,功能很强大,还有css选择器没有的内置函数
#css 选择器
url = response.css('div#news_list h2 a::attr(href)').extract()