在linux 服务器上执行:

获得:

lynx获取百度知道列表页的链接-新乡seo|网站优化,网站建设_微信公众号:zeropython—昊天博客

lynx获得链接

然后利用grep命令过滤百度知道的链接

获得结果

lynx获取百度知道列表页的链接-新乡seo|网站优化,网站建设_微信公众号:zeropython—昊天博客

然后利用awk 获得链接

结果如下:

lynx获取百度知道列表页的链接-新乡seo|网站优化,网站建设_微信公众号:zeropython—昊天博客

百度知道链接

 

  1. get the text from a Web page with the list of links:
    lynx -dump “http://www.site-url.com/”
  2. get the source code from a page:
    lynx -source “http://www.site-url.com/”
  3. get the response headers:
    lynx -dump -head “http://www.site-url.com/”