当前位置: 首页 > news >正文

有哪些网站可以免费看电影当今做网站的语言有哪些

有哪些网站可以免费看电影,当今做网站的语言有哪些,江津网站建设公司,重庆森林电影简介一. 内容简介 python爬取robomaster论坛文章数据。 二. 软件环境 2.1vsCode 2.2Anaconda version: conda 22.9.0 2.3代码 三.主要流程 3.1 接口分析#xff0c;以及网页结构分析 # 这是文章链接,其实id就是文章的id # https://bbs.robomaster.com/forum.php?modview…一. 内容简介 python爬取robomaster论坛文章数据。 二. 软件环境 2.1vsCode 2.2Anaconda version: conda 22.9.0 2.3代码 三.主要流程 3.1 接口分析以及网页结构分析 # 这是文章链接,其实id就是文章的id # https://bbs.robomaster.com/forum.php?modviewthreadtid9234 # 文章结构 # 大疆这个文章,在访问网站时候,他会把文章内容在服务端拼接好,是没办法直接拿到接口数据的, # 第一个方面就是,urllib访问时候,拿到整个网页结构,这个结构是不带js执行的,虽然数据都有,但是是和浏览器里面有些定位不太一样的,在用xpath解析时候,经常找不到,有点不太方便 # 第二个方面,就是因为里面有些内容需要登录,这个登录有两种验证方式,一种是token,一种是cookie,大疆是cookie,所以我们需要在请求头中假如cooke访问,分别用urllib和elenium实现3.2 通过urllib携带cookie爬取网页结构 import urllib.request from lxml import etree import json from selenium.webdriver.common.by import By from selenium import webdriver import random import time import pyautogui from datetime import datetime import ssl import re import urllib.request def urllibRequest(url):headers {Cookie:换成自己的直接去网页请求里面复制,User-Agent:Mozilla/5.0 (iPhone; CPU iPhone OS 16_6 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/16.6 Mobile/15E148 Safari/604.1}# 创建一个不验证证书的上下文对象context ssl._create_unverified_context()request urllib.request.Request(urlurl, headersheaders)response urllib.request.urlopen(request, contextcontext) # 在这里传入context参数content response.read().decode(UTF-8)return contenturl https://bbs.robomaster.com/forum.php?modviewthreadtid9234 content urllibRequest(url) print(content) 里面有一点需要注意的就是这个网页结构如果不能解析的话要加这个里面xml会报错替换一下就好 content_without_declaration re.sub(r^\?xml.*\?, , content) html_tree etree.HTML(content_without_declaration)3.3 通过selenium携带cookie爬取网页结构 直接给selenium加个请求头 import urllib.request from lxml import etree import json from selenium.webdriver.common.by import By from selenium import webdriver import random import time import pyautogui from datetime import datetime import randomdef seleniumRequest(url,chrome_path,waitTime): headers {User-Agent:Mozilla/5.0 (iPhone; CPU iPhone OS 16_6 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/16.6 Mobile/15E148 Safari/604.1Cookie:换自己的}options webdriver.ChromeOptions()# 添加cookie到浏览器中options.add_experimental_option(excludeSwitches, [enable-automation])options.add_experimental_option(useAutomationExtension, False)# 添加Header到options中options.add_argument(fuser-agent{headers[User-Agent]})options.add_argument(fcookie{headers[Cookie]})# 谷歌浏览器exe位置options.binary_location chrome_path# 是否要启动页面# options.add_argument(--headless) # 启用无头模式# GPU加速有时候会出bugoptions.add_argument(--disable-gpu) # 禁用GPU加速options.add_argument(--disable-blink-featuresAutomationControlled)driver webdriver.Chrome(optionsoptions)driver.execute_cdp_cmd(Page.addScriptToEvaluateOnNewDocument,{source: Object.defineProperty(navigator, webdriver, {get: () undefined})})# 启动要填写的地址,这就启动浏览器driver.get(url)# 这是关闭浏览器# 等待页面加载可以根据实际情况调整等待时间driver.implicitly_wait(waitTime)# 获取完整页面结构full_page_content driver.page_source# 关闭浏览器driver.quit()return full_page_content # # 处理完整页面结构 # print(full_page_content) url https://bbs.robomaster.com/forum.php?modviewthreadtid9234 # print(url)chrome_path rC:\Program Files\Google\Chrome\Application\chrome.exe waitTime 8 # 获取网页结构 # 通过selenium调用浏览器访问 content seleniumRequest(url,chrome_path,waitTime) print(content)3.4 网页结构定位 一般都是通过xpath语法一个div下面如果有多个类我xpath就选不到了,可以用下面这个 //div[contains(class, example)]还有一种方式可以用谷歌浏览器里面的工具就不用自己一个一个选了 还有就是xpath选取得结构用txt保存下来里面代码包括结构 # # 解析对应数据 # contents html_tree.xpath(//div[classmessage])[0] # print(contents)# # # 将选定的div元素转换为字符串 # div_html etree.tostring(contents, encodingunicode)# # print(div_html) # # # 将HTML保存为文件 # with open(output.txt, w, encodingutf-8) as f: # f.write(div_html)
http://www.yutouwan.com/news/283162/

相关文章:

  • 付费做网站关键词优化是怎么做的呀做外贸上哪些网站找客户
  • 北京建站模板源码线下推广渠道和方式
  • 音乐中文网站模板下载做园林景观的网站
  • 网站建设与电子商务的教案free wordpress themes
  • 做计算机网站的总结网站服务器租赁需要什么手续
  • 云南网站设计平台网站和网络有什么区别
  • 站长之家源码下载湖南网站营销优化开发
  • 企业建设网站需要注意什么手续怎么做软件程序
  • 头像设计制作网站阿里云官网首页
  • php怎么建立站点物业管理系统和物业管理软件
  • 郑州网站推广公司排名苏州电商系统开发
  • 邢台wap网站建设报价重庆建设岗位培训网站
  • 基金会网站建设登录wordpress数据库
  • 做竞品分析去哪个网站互联网有多少网站
  • 怎做连接网站重庆知名设计公司有哪些
  • 大网站开发语言石家庄网站建设公司哪家好
  • 做宠物网站心得网站开发入股合作分配比例
  • php网站开发文本格式设置在网站设计公司上班好吗
  • 网站开发保密合同wordpress 中文文件名
  • 西安网站建设报价方案中国计算机网络公司排名
  • 网站关键字选择标准网站建设风险怎样规避
  • 微商网站模板上海公司排名前十
  • 长沙网建站中国建设银行网站对公账户首页
  • 东莞中赢网站建设公司怎么样建设门户网站需要多少钱
  • 5000多一年的网站建站怎么做物流网站代理
  • dw做网站实例旅游网站的建设开题报告
  • 阜平网站建设电商网站建设意义
  • 茌平做网站推广做网站要买服务器吗
  • 了解网站建设的流程30岁学编程太晚了
  • 如何建设网站哪个济南兴田德润简介免费域名证书申请