小建筑公司简介模板,天津关键词优化效果,跨境电商全托管有哪些平台,母婴推广网站#xpath
#第一种方法 可在开发者工具中找到标签#xff0c;右键copy xpath#xff0c;有时需去掉tbody标签
#第二种方法 简单学习xpath#xff0c;自己书写#xff0c;掌握基本语法即可#xff0c;简单的层级关系#先将csv文件以记事本打开#xff0c;更改编码为ASNI右键copy xpath有时需去掉tbody标签
#第二种方法 简单学习xpath自己书写掌握基本语法即可简单的层级关系#先将csv文件以记事本打开更改编码为ASNI保存再用excel打开即可import urllib.request
import urllib.parse
import csv
from lxml import etree
#需要cmd pip install lxmlheaders [电影名字, 评论, 评分, 名句]
with open(C:\\Users\\lenovo\\Desktop\\mmm.csv,a,newline, encodingutf-8) as f:writer csv.writer(f)writer.writerow(headers)#先将表头插入
for i in range(10):url https://movie.douban.com/top250?start{}filter.format(i*25)#发现规律网址的变化用format更便捷
response urllib.request.urlopen(url).read().decode()#源代码html etree.HTML(response)#建议学习Xpath非常有用web自动化中也会用到 name html.xpath(//*[idcontent]/div/div[1]/ol/li/div/div[2]/div[1]/a/span[1]/text())#电影名字comments html.xpath(//*[idcontent]/div/div[1]/ol/li/div/div[2]/div[2]/div/span[4]/text())#电影评价数star html.xpath(//*[idcontent]/div/div[1]/ol/li/div/div[2]/div[2]/div/span[2]/text())#评分quote html.xpath(//*[idcontent]/div/div[1]/ol/li/div/div[2]/div[2]/p[2]/span/text())#名句
with open(C:\\Users\\lenovo\\Desktop\\mmm.csv,a,newline, encodingutf-8) as f:#将数据写入csv文件a代表继续写入writer csv.writer(f)#将文件对象转化成csv对象listw []for i in range(25):listw [name[i], comments[i], star[i], quote[i]]writer.writerow(listw)#csv按行写入写一个列表 转载于:https://www.cnblogs.com/persistence-ok/p/10924199.html