phantomjs是一个没有界面的浏览器,支持各种web标准,提供DOM 处理, CSS 选择器, JSON, Canvas, 和 SVG,对于爬取一些经过js渲染的页面非常有用。
但是phantomjs默认的user-agent一般都被那些防采集的网站屏蔽了,鬼都知道用这个浏览器,都是来爬取网页的,不是正常的用户。
phantomjs相当于一个真实的浏览器,一个浏览器该加载的该渲染的它都加载都渲染,只是没有界面而已。所以爬取网页的速度很慢。如果可以不加载图片,网页加载速度就会快不少。

下面的这段完整代码,提供了上述的两个功能,具体的请看注释

phantomjs禁止加载图片 方法一:

selenium设置phantomjs-图片不加载:

selenium 修改phantomjs  user-Agent请求头和禁止加载图片的方法-新乡seo|网站优化,网站建设_微信公众号:zeropython—昊天博客

设置selenium Chrome 头部

返回结果是:

selenium 修改phantomjs  user-Agent请求头和禁止加载图片的方法-新乡seo|网站优化,网站建设_微信公众号:zeropython—昊天博客

更多 selenium爬虫 操作浏览器 请点击↓方链接

https://www.168seo.cn/tag/selenium