昊天SEO

selenium 获取链接以及链接的文本

iamg9

for i in open('links.txt','r'):
 url = i.strip('\n')
 # urls = re.findall('class="title" href="(.*?)" title',dd.get(url).page_source,re.S)
 # for i in urls:
 # print i
 dd.get(url)
 # print dd.find_elements_by_xpath("//*[@href]")
 for i,y in zip(dd.find_elements_by_xpath('//*[@id="articles"]/ul/li/div/a'),dd.find_elements_by_xpath('//*[@id="articles"]/ul/li/div/p/span[1]')):
 print i.text,y.text.split('阅读')[0],i.get_attribute('href')
 open('tt.txt','a+').write(i.text+","+y.text.split('阅读')[0]+','+i.get_attribute('href')+'\n')
print u"全部采集完成"
open('tt.txt','a+').write("全部采集完成")

本文地址官网    新乡网站建设,seo

分享到:更多 ()
a