当前位置: 首页 > news >正文

实训课建设网站步骤wordpress手机端粘性菜单

实训课建设网站步骤,wordpress手机端粘性菜单,北京知名大公司有哪些,国内效果图公司排名0.目录1.分析页面2.初步代码3.完整代码4.总结5.补充1.分析页面上一次我们讲了xpath获取豆瓣最新上映电影的海报#xff0c;这一次会分析如何使用BeautifulSoup获取。启程#xff1a;python爬虫之通过xpath获取豆瓣最新上映电影的海报​zhuanlan.zhihu.com首先#xff0c;进入…0.目录1.分析页面2.初步代码3.完整代码4.总结5.补充1.分析页面上一次我们讲了xpath获取豆瓣最新上映电影的海报这一次会分析如何使用BeautifulSoup获取。启程python爬虫之通过xpath获取豆瓣最新上映电影的海报​zhuanlan.zhihu.com首先进入豆瓣正在上映的页面右键查看源代码发现我们需要的海报url和电影名都在这个标签下面根据上一次的经验还需要添加范围 div idnowplaying 右键源代码2.初步代码# encoding: utf-8from bs4 import BeautifulSoupfrom urllib import requestimport requestsdef get_page(url):headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36,Referer: https://movie.douban.com/,}response requests.get(url, headers)return response.textdef get_img(url):text get_page(url)# 创建BeautifulSoup对象soup BeautifulSoup(text, lxml)# 限制获取到的img标签在【正在上映】内new soup.find(div, {id: nowplaying})# 查找img标签trs new.find_all(img)for tr in trs:# 获取img标签下的src和alturl_img tr.attrs[src]name tr.attrs[alt]print(name)print(url_img)def main():url https://movie.douban.com/cinema/nowplaying/guangzhou/get_img(url)if __name__ __main__:main()展示运行结果的一部分3.完整代码可以发现已经获取到了我们想要的数据那么下一步就是根据url下载海报并且用电影名来命名文件。在下载之前还需要在该程序的所在目录建一个名为images 的文件夹。# encoding: utf-8from bs4 import BeautifulSoupfrom urllib import requestimport requestsdef get_page(url):headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36,Referer: https://movie.douban.com/,}response requests.get(url, headers)return response.textdef get_img(url):text get_page(url)# 创建BeautifulSoup对象soup BeautifulSoup(text, lxml)# 限制获取到的img标签在【正在上映】内new soup.find(div, {id: nowplaying})# 查找img标签trs new.find_all(img)fns_num 1num len(trs)for tr in trs:# 获取img标签下的src和alturl_img tr.attrs[src]name tr.attrs[alt]# 下载剧照request.urlretrieve(url_img, images/ name .jpg)# 显示剧照下载的进度print(\r完成进度: {:.2f}%.format(fns_num * 100 / num), end)fns_num 1def main():url https://movie.douban.com/cinema/nowplaying/guangzhou/get_img(url)if __name__ __main__:main()展示运行结果的一部分4.总结下一次会使用正则表达式来继续实践还会分析xpath、BeautifulSoup和正则之间的区别。如果你想获取评分可以这样new soup.find(div, {id: nowplaying})trs new.find_all(li)for tr in trs:score tr.attrs[data-score]5.补充当我们碰到肖申克的救赎xpath可以这样获取title tr.xpath(.//span[classtitle]/text())[0]BeautifulSoup可以这样获取title soup.find(span, {class: title})
http://www.yutouwan.com/news/95000/

相关文章:

  • 现代网站开发设计报告php网站开发专业背景
  • 知名的网站设计公司南通购物网站建设
  • 网站开发框架文档小的外贸公司值得去吗
  • wordpress 我爱水煮鱼做搜狗手机网站优化点
  • asp网站开发参考文献成都住建局官网平台查询
  • 专业网站排名优化公司聊城开发区人才网
  • 主要网站域名织梦网站必须下载地址
  • 西安专业网站建设沈阳男科医院在哪里
  • 学校网站报价方案济南做门户网站开发公司
  • vs2008网站消息弹窗怎么做网站设计最好的公司
  • 网站建设与管理报告书粉丝社区网站怎么做
  • 岳阳网站界面设计企业网络规划和设计方案
  • wordpress网站监测中国数据统计网站
  • 前端做项目的网站芜湖公司做网站
  • 秦皇岛做网站优化响应式网站算几个页面
  • 郑州市建设安全管理协会网站洛阳做网站公司地址
  • 生产企业做网站有用吗公司网站域名到期了去哪里缴费
  • 中国化工建设网站珠海网站建设珠海
  • 网页无法访问如何解决h5优化公司哪家好
  • 东莞企业网站制作怎么做最新军事新闻头条
  • 营销型网站是什么意思域名空间做网站
  • php企业网站模板技术支持东莞网站建设机械
  • 网站设计需要哪些技能襄阳网站建设的公司
  • 营口品牌网站建设wordpress漫画
  • 旅游类网站设计柳城网站设计
  • 哔哩哔哩免费网站观看设计公司名字logo
  • 网站的原型怎么做网页友情链接
  • 内蒙古建设住房与城乡厅官方网站网站服务器免费吗
  • 明光网站建设用phpcms v9搭建手机网站后您没有访问该信息的权限!
  • 做外汇需要了解的网站部门规划书 网站建设