当前位置: 首页 > news >正文

网站播放大视频如何做网站建设优化服务行情

网站播放大视频如何做,网站建设优化服务行情,微网站哪家好,网站设计的经费预算目录 一、 ajax的get请求豆瓣电影第一页 二、ajax的get请求豆瓣电影前十页 三、ajax的post请求肯德基官网 一、 ajax的get请求豆瓣电影第一页 目标#xff1a;获取豆瓣电影第一页的数据#xff0c;并保存为json文件 设置url#xff0c;检查 -- 网络 -- 全部 -…目录 一、 ajax的get请求豆瓣电影第一页 二、ajax的get请求豆瓣电影前十页 三、ajax的post请求肯德基官网 一、 ajax的get请求豆瓣电影第一页 目标获取豆瓣电影第一页的数据并保存为json文件 设置url检查 --  网络 --  全部  -- top_list -- 标头  -- 请求URL 完整代码 import urllib.request # get请求 # 获取豆瓣电影第一页的数据并保存为json文件url https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actionstart0limit20 headers {User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36 Edg/118.0.2088.76 }# 请求对象的定制 request urllib.request.Request(url, headersheaders)# 获取响应的数据 response urllib.request.urlopen(request) content response.read().decode(utf-8) print(content)# 数据下载到本地 with open(douban.json,w, encodingutf-8) as file:file.write(content)# import json # with open(douban.json,w, encodingutf-8) as file: # json.dump(content, file, ensure_asciiFalse)通常是因为默认情况下json.dump() 使用的编码是 ASCII不支持包含非ASCII字符如中文的文本。为了在 JSON 文件中包含中文字符你可以指定 ensure_asciiFalse 参数以确保不将中文字符转换为 Unicode 转义序列。二、ajax的get请求豆瓣电影前十页 目标下载豆瓣电影前十页的数据 知识点问题的关键在于观察url的规律然后迭代获取数据 1.设置url 找规律 点击top_list获取第一页的request url复制url点击清空下拉滚动条再次出现top_list时复制第二页的request url重复操作我们可以找到规律。 观察链接可以看到page和start之间的关系 # url 规律 https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actionstart0limit20 https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actionstart20limit20 https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actionstart40limit20 https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actionstart60limit20# page 1 2 3 4 # start 0 20 40 60 2.定义请求对象定制的函数 def create_request(page):base_url https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actiondata{start:(page-1)*20,limit:20}data urllib.parse.urlencode(data)url base_urldataheaders {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36 Edg/118.0.2088.76}# 请求对象的定制request urllib.request.Request(url, headersheaders)return request 3.定义获取响应的数据的函数 def get_content(request):# 获取响应的数据response urllib.request.urlopen(request)content response.read().decode(utf-8)return content 4.定义下载函数 def down_load(content,page):with open(daouban_str(page).json,w,encodingutf-8) as file:file.write(content) 5.调用这些函数完成数据抓取 start_page int(input(请输入起始页码)) end_page int(input(请输入结束的代码))for page in range(start_page, end_page1):# 请求对象的定制request create_request(page)# 获取响应的数据content get_content(request)# 下载down_load(content,page)print(fdone_{page}) 完整代码 import urllib.request import urllib.parse # url 规律 https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actionstart0limit20 https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actionstart20limit20 https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actionstart40limit20 https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actionstart60limit20# page 1 2 3 4 # start 0 20 40 60# 全部工作下载豆瓣电影前十页的数据 # 请求对象的定制 # 获取响应的数据 # 下载数据def create_request(page):base_url https://movie.douban.com/j/chart/top_list?type17interval_id100%3A90actiondata{start:(page-1)*20,limit:20}data urllib.parse.urlencode(data)url base_urldataheaders {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36 Edg/118.0.2088.76}# 请求对象的定制request urllib.request.Request(url, headersheaders)return requestdef get_content(request):# 获取响应的数据response urllib.request.urlopen(request)content response.read().decode(utf-8)return contentdef down_load(content,page):with open(daouban_str(page).json,w,encodingutf-8) as file:file.write(content)start_page int(input(请输入起始页码)) end_page int(input(请输入结束的代码))for page in range(start_page, end_page1):# 请求对象的定制request create_request(page)# 获取响应的数据content get_content(request)# 下载down_load(content,page)print(fdone_{page})三、ajax的post请求肯德基官网 目标查询肯德基某地区餐厅前十页的信息 1.设置url 进入肯德基官网点击餐厅查询右键检查 网络 -- 名称 -- 标头 -- 请求URL 然后点击清空左上角的 ∅点击第二页再次获取链接信息及负载中的表单数据找规律 可以找到如下规律 pageIndex就是页码 # 第1页 # cname: 深圳 # pid: # pageIndex: 1 # pageSize: 10# 第2页 # http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?opcname # cname: 深圳 # pid: # pageIndex: 2 # pageSize: 10 2.定义请求对象地址的函数 def create_request(page):base_url http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?opcnamedata{cname: 深圳,pid: ,pageIndex: page,pageSize: 10}data urllib.parse.urlencode(data).encode(utf-8)headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36 Edg/118.0.2088.76}request urllib.request.Request(base_url, data, headers)return request 3.获取网页源码 def get_content(request):response urllib.request.urlopen(request)content response.read().decode(utf-8)return content 4.下载 def download(content, page):with open (kfc_str(page).json,w,encodingutf-8) as file:file.write(content) 5.调用函数 start_page int(input(请输入起始页码)) end_page int(input(请输入结束页码)) for page in range(start_page, end_page1):# 请求对象定制response create_request(page)# 获取网页源码content get_content(response)# 下载1download(content, page) 完整代码 import urllib.request import urllib.parse# 第1页 # cname: 深圳 # pid: # pageIndex: 1 # pageSize: 10# 第2页 # http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?opcname # cname: 深圳 # pid: # pageIndex: 2 # pageSize: 10def create_request(page):base_url http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?opcnamedata{cname: 深圳,pid: ,pageIndex: page,pageSize: 10}data urllib.parse.urlencode(data).encode(utf-8)headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36 Edg/118.0.2088.76}request urllib.request.Request(base_url, data, headers)return requestdef get_content(request):response urllib.request.urlopen(request)content response.read().decode(utf-8)return contentdef download(content, page):with open (kfc_str(page).json,w,encodingutf-8) as file:file.write(content)start_page int(input(请输入起始页码)) end_page int(input(请输入结束页码)) for page in range(start_page, end_page1):# 请求对象定制response create_request(page)# 获取网页源码content get_content(response)# 下载1download(content, page) 参考 尚硅谷Python爬虫教程小白零基础速通含python基础爬虫案例
http://www.yutouwan.com/news/109847/

相关文章:

  • 广告公司收费价格表十堰seo优化哪家公司好
  • pc做网站网站后台怎么修改密码
  • 站长工具综合查询站长工具wordpress 左侧导航
  • 北京信息网站建设1号店网站模板下载
  • 可以加外链的网站软件项目外包网
  • 改图网站企业网站推广的线上渠道有哪些
  • 建一个私人彩票网站做一个app上架需要多少费用
  • 百度最怕哪个投诉电话太原企业网站seo
  • 长春营销型网站制作开源oa系统
  • 能用网站做微信小程序郑州seo技术顾问
  • 网站建设推广注册公司wordpress参考文件
  • 网站 做 app开发wordpress 插件下载站
  • 营销网站建设哪里好薇电子商务课程视频
  • 网站设计 西安wordpress账号图片尺寸
  • 网站建设长尾关键词iis部署网站 asp 物理路径
  • 黄冈便宜的网站推广怎么做做网站用什么编程软件
  • 免版权费自建网站Wordpress转jekyll
  • 做租凭网站是经营性吗系统开发外包
  • 邯郸网站制如何自己做公司网页
  • jsp网站开发可行性分析c 做网站后端
  • 手机创建自己网站瀑布流响应式网站模板
  • 网站排名忽然不见了菜鸟制作个人网站网页实例
  • 博罗建设银行网站king wordpress theme
  • 福州闽侯网站建设用例图在线制作网站
  • 工作室网站免费建设快三网站建设
  • 北京未来科技城开发建设有限公司 网站wordpress大负载
  • 建设学校网站的意义市场营销策划案的范文
  • 各大网站的404文山知名网站建设哪家好
  • 个人建网站怎么赚钱wordpress无法创建
  • 怎样设计自己网站域名网站建设银行