当前位置: 首页 > news >正文

asp做的网站怎么运行网站添加备案号

asp做的网站怎么运行,网站添加备案号,wordpress怎么加属性,wordpress x0.目录1.分析页面2.初步代码3.完整代码4.总结5.补充1.分析页面上一次我们讲了xpath获取豆瓣最新上映电影的海报#xff0c;这一次会分析如何使用BeautifulSoup获取。启程#xff1a;python爬虫之通过xpath获取豆瓣最新上映电影的海报​zhuanlan.zhihu.com首先#xff0c;进入…0.目录1.分析页面2.初步代码3.完整代码4.总结5.补充1.分析页面上一次我们讲了xpath获取豆瓣最新上映电影的海报这一次会分析如何使用BeautifulSoup获取。启程python爬虫之通过xpath获取豆瓣最新上映电影的海报​zhuanlan.zhihu.com首先进入豆瓣正在上映的页面右键查看源代码发现我们需要的海报url和电影名都在这个标签下面根据上一次的经验还需要添加范围 div idnowplaying 右键源代码2.初步代码# encoding: utf-8from bs4 import BeautifulSoupfrom urllib import requestimport requestsdef get_page(url):headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36,Referer: https://movie.douban.com/,}response requests.get(url, headers)return response.textdef get_img(url):text get_page(url)# 创建BeautifulSoup对象soup BeautifulSoup(text, lxml)# 限制获取到的img标签在【正在上映】内new soup.find(div, {id: nowplaying})# 查找img标签trs new.find_all(img)for tr in trs:# 获取img标签下的src和alturl_img tr.attrs[src]name tr.attrs[alt]print(name)print(url_img)def main():url https://movie.douban.com/cinema/nowplaying/guangzhou/get_img(url)if __name__ __main__:main()展示运行结果的一部分3.完整代码可以发现已经获取到了我们想要的数据那么下一步就是根据url下载海报并且用电影名来命名文件。在下载之前还需要在该程序的所在目录建一个名为images 的文件夹。# encoding: utf-8from bs4 import BeautifulSoupfrom urllib import requestimport requestsdef get_page(url):headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36,Referer: https://movie.douban.com/,}response requests.get(url, headers)return response.textdef get_img(url):text get_page(url)# 创建BeautifulSoup对象soup BeautifulSoup(text, lxml)# 限制获取到的img标签在【正在上映】内new soup.find(div, {id: nowplaying})# 查找img标签trs new.find_all(img)fns_num 1num len(trs)for tr in trs:# 获取img标签下的src和alturl_img tr.attrs[src]name tr.attrs[alt]# 下载剧照request.urlretrieve(url_img, images/ name .jpg)# 显示剧照下载的进度print(\r完成进度: {:.2f}%.format(fns_num * 100 / num), end)fns_num 1def main():url https://movie.douban.com/cinema/nowplaying/guangzhou/get_img(url)if __name__ __main__:main()展示运行结果的一部分4.总结下一次会使用正则表达式来继续实践还会分析xpath、BeautifulSoup和正则之间的区别。如果你想获取评分可以这样new soup.find(div, {id: nowplaying})trs new.find_all(li)for tr in trs:score tr.attrs[data-score]5.补充当我们碰到肖申克的救赎xpath可以这样获取title tr.xpath(.//span[classtitle]/text())[0]BeautifulSoup可以这样获取title soup.find(span, {class: title})
http://www.yutouwan.com/news/7209/

相关文章:

  • wordpress 建站 图床江苏城乡建设厅网站
  • html5做简单网站网站推广软件排名
  • 公司建设网站需要什么一站式网站建设架构
  • 平台网站建设费用wordpress装修模板
  • 网站开发与应用dw制作一个手机网站模板
  • 深圳做企业网站的公司推荐建设工程机械职业技能鉴定
  • 网站建设实验分析阜新市建设学校管方网站
  • 上海建设网站哪家好有网络网站打不开
  • 帮别人做违法网站会怎么样网站ui设计是什么意思
  • 易班网站的建设内容最新免费网站收录提交入口
  • 阿里云建设网站好吗wordpress用户名怎么起
  • 行业数据网站二维码生成在线制作
  • 网站托管解决方案app开发企业
  • wordpress网站上传服务器商城网站不易优化
  • 蓝色清爽网站快速搭建网站服务器
  • 阿克苏网站建设价格成都诗和远方网站建设
  • seo网站首页推广wordpress批量传图片
  • wordpress网站空间wordpress加百度一下
  • 优化手机访问网站速度小说网站做封面要钱吗
  • z怎么建设视频网站分析杭州高端网站建设开发的区别
  • wordpress仿站实战做家教备课用什么网站
  • 遨翔网站建设照片网站模版
  • 哪个公司做企业网站好html个人网站源码
  • 网站的备案信息wordpress响应慢原因
  • 吉林做网站wordpress企业内网主题
  • 太原 招聘 网站建设 技术经理设计开发流程
  • 网站建设及管理制度文章网站建设策
  • 如何用网站做课件vue vs wordpress
  • 微擎 网站开发工具网站建设 比选
  • wordpress msn space云浮seo