XPath Helper丨chrome爬虫网页解析工具

每一个写爬虫、或者是做网页分析的人,相信都会因为在定位、获取xpath路径上花费大量的时间,甚至有时候当爬虫框架成熟之后,基本上主要的时间都花费在了页面的解析上。在没有这些辅助工具的日子里,我们只能通过搜索html源代码,定位一些id去找到对应的位置,非常的麻烦,而且经常出错。而这款XPath Helper可以很好的帮助大家解决这个难题。

xpath helper插件是一款免费的chrome爬虫网页解析工具。可以帮助用户解决在获取xpath路径时无法正常定位等问题。该插件主要能帮助你在各类网站上通过按shift键选择想要查看的页面元素来提取查询其代码,同时你还能对查询出来的代码进行编辑,而编辑出的结果将立即显示在旁边的结果框中。

XPath Helper图片

使用方法

1.用chrome打开一个网页

2.按Ctrl-Shift键-X或者点击浏览器右上角”X”图标以打开XPath辅助控制台。点击 Ctrl + Shift + X 激活 XPath Helper的控制台,然后您可以在 Query 文本框中输入相应 XPath 进行调试了,提取的结果将被显示在旁边的 Result 文本框中,如下图所示:

3.按住Shift键鼠标在页面上的元素。查询框会不断更新,以显示鼠标指针下面的元素充分XPath查询。结果框其右侧将显示评价结果的查询。

4.如果需要的话,可以直接在控制台编辑XPath查询。在结果框中将立即反映任何变化。

5.再次按Ctrl-Shift键-X关闭控制台

注意事项

虽然XPath Helper插件使用非常方便,但它也不是万能的,有两个问题:

1.XPath Helper 自动提取的 XPath 都是从根路径开始的,这几乎必然导致 XPath 过长,不利于维护.

2.当提取循环的列表数据时,XPath Helper 是使用的下标来分别提取的列表中的每一条数据,这样并不适合程序批量处理,还是需要人为修改一些类似于*标记等。不过,合理的使用Xpath,还是能帮我们省下很多时间的!

 

快来下载这个宝藏插件吧!

插件下载地址

此处内容已经被作者无情的隐藏,请输入验证码查看内容:
验证码:
请关注本站公众号回复“验证码”,获取验证码。 【注】”在微信里搜索“不会笑青年”或者“laughyouth”或者微信扫描右侧二维码都可以关注微信公众号。
不会笑青年

小白学堂 » XPath Helper丨chrome爬虫网页解析工具

就聊挣钱,一个带着你做副业的社群。

立即查看 了解详情