昊天SEO

selenium 获取链接以及链接的文本

iamg9

for i in open('links.txt','r'):
 url = i.strip('\n')
 # urls = re.findall('class="title" href="(.*?)" title',dd.get(url).page_source,re.S)
 # for i in urls:
 # print i
 dd.get(url)
 # print dd.find_elements_by_xpath("//*[@href]")
 for i,y in zip(dd.find_elements_by_xpath('//*[@id="articles"]/ul/li/div/a'),dd.find_elements_by_xpath('//*[@id="articles"]/ul/li/div/p/span[1]')):
 print i.text,y.text.split('阅读')[0],i.get_attribute('href')
 open('tt.txt','a+').write(i.text+","+y.text.split('阅读')[0]+','+i.get_attribute('href')+'\n')
print u"全部采集完成"
open('tt.txt','a+').write("全部采集完成")

未经允许不得转载:新乡seo|网站优化,网站建设—昊天博客 » selenium 获取链接以及链接的文本

网站的维护离不开大家的支持鼓励,捐赠让我更有动力走的更远&& 也可以关注我的微信公众号,发布更多的干货
本文网址:https://www.168seo.cn/selenium/2476.html

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址