当前位置: 首页 > news >正文

烟台建设局网站网摘网站推广法

烟台建设局网站,网摘网站推广法,大学网站建设与管理职责,三亚哪里做网站在爬学校安全教育题库的时候发现题库分页实际上执行了一段js代码#xff0c;如下图所示 点击下一页时是执行了函数doPostBack#xff0c;查看页面源码如下 点击下一页后这段js提交了一个表单#xff0c;随后后端返回对应数据#xff0c;一开始尝试分析获取对应两个参数如下图所示 点击下一页时是执行了函数doPostBack查看页面源码如下 点击下一页后这段js提交了一个表单随后后端返回对应数据一开始尝试分析获取对应两个参数封装在data中通过POST请求获得新的一页后面尝试了很久始终不成功…肯定是因为太菜 没办法只能使用神器selenium缺点是要调用浏览器肯定是比较慢的但是python直接给你模拟浏览器的各种操作而且不用抓包分析比较方便。所以还是偷偷懒注意除了python要安装selenium之外还需要安装对应浏览器的web驱动这里我用的是谷歌浏览器驱动下载地址 镜像https://registry.npmmirror.com/binary.html?pathchromedriver/ 如果你谷歌版本新镜像上可能没有对应版本。 官网https://sites.google.com/chromium.org/driver/downloads117以上在这里找这里~ 下载好后就是正常的爬虫步骤直接看代码吧 import docx from selenium import webdriver import html2text import timeidx [4, 5, 9, 10, 11, 13, 14, 15, 16] srcsel xxxx/Web/userSingle.aspx?ID # 选择题 srcjg xxxx/Web/userIs.aspx?ID # 判断题def remove_tags(text):h html2text.HTML2Text()h.ignore_links Truereturn h.handle(text)def process(url):driver webdriver.Chrome()driver.get(url)res driver.find_element(id, GridViewx).get_attribute(innerHTML)res remove_tags(res)doc.add_paragraph().add_run(res)pages int(driver.find_element(id, GridViewx_ctl13_lblPageCount).text)# pages 2for i in range(pages - 1):time.sleep(1.5)driver.find_element(id, GridViewx_ctl13_btnNext).click()res driver.find_element(id, GridViewx).get_attribute(innerHTML)res remove_tags(res)doc.add_paragraph().add_run(res)driver.quit()doc docx.Document(res.docx) for pid in idx:process(srcsel str(pid))time.sleep(3)process(srcjg str(pid)) doc.save(res.docx) 为什么多此一举用html2text呢因为发现这样写又能比较好看和丑的比起来还不用自己一条数据一条数据取出来排版。然后代码里我直接写进word文档里了这里有个小坑你的word文档docx中必须得有东西不能是空的要不然会报错… 懒得排版凑合看看
http://www.yutouwan.com/news/250325/

相关文章:

  • 如何做网站上抓视频国内做网站大公司
  • 首码项目推广网站网站建设对旅游意义
  • 做网站国外网站商丘雷光网络科技有限公司
  • 邢台市网站制作宁波房产交易信息网
  • 企业开源建站系统团购网站如何优化
  • 自己建网站 怎么做后台帮企业做网站的公司
  • 湘潭找工作网站vi品牌设计公司
  • 建设一个网络交友的网站的论文动漫设计与制作属于什么类别
  • 宜昌永东建设网站网站首页广告图片伸缩代码又关闭
  • 网站demo制作工具长链接生成短链接网址
  • 深圳优化网站公司有赞微商城登录入口
  • 完全网络营销网站株洲seo优化
  • dede网站乱码网科创想网站管理
  • 淮安建设机械网站制作网络营销推广合同
  • 普通网站 多大空间南充市企业网站建设
  • 网站开发交什么税做响应式网站需要学哪些知识
  • 桂林设计单位资质升级网站wordpress韩影网主题
  • 有没有做链接的网站吗页面上影响网站排名的因素
  • 如何向谷歌提交网站兼职网站平台有哪些
  • 网站打开慢是什么原因电商网站建设技术交流问题
  • 如何做视频网站网站建设工作台账
  • 网站建设发布ps科技感网站建设刷赞和vip
  • 黄石网站设计公司简历模板手机版填写免费
  • 单位有公网ip怎么做网站什么是网站推广
  • 蓝鸟E4A做网站程序社交媒体营销
  • 外贸网站做推广要建一个优惠卷网站怎么做
  • 网站域名备案查询官网建筑项目查询平台
  • 网站开发要什么软件有哪些唐山seo网络推广
  • 手机有些网站打不开怎么解决asp.net 建立网站吗
  • 网站后台管理怎么进怎么做网站建设的ppt