小心XPath和CSS选择器中的tbody

很多HTML的基础知识都忘了,耽误不少时间。

Scrapy使用CSS或XPath选择器时可能无法匹配到table中的正确内容,如图在Chrome审查元素中看到的代码:

如果使用response.css('table#ip_list > tbody)会直接返回空, 右键查看网页源代码发现没有tbody标签,而是浏览器自己给加上去的, 使用response.css('table#list > tr')即可。

为什么会这样?

参考: https://stackoverflow.com/questions/34024136/tbody-tag-displays-in-chrome-but-not-source

» 链接地址:https://wbt5.com/tbody.html »英雄不问来路,转载请注明出处。

发表评论

电子邮件地址不会被公开。 必填项已用*标注