当前位置: 首页 > news >正文

个人网站备案模板怎么建立自己的小程序

个人网站备案模板,怎么建立自己的小程序,自己做链接的网站,网站浏览器兼容性问题本文来自网易云社区作者#xff1a;王涛此处我们给出几个常用的代码例子#xff0c;包括get,post(json,表单),带证书访问#xff1a;Get 请求gen.coroutinedef fetch_url():try:c CurlAsyncHTTPClient() # 定义一个httpclientmyheaders {Host: weixin.…本文来自网易云社区作者王涛此处我们给出几个常用的代码例子包括get,post(json,表单),带证书访问Get 请求gen.coroutinedef fetch_url():try:c  CurlAsyncHTTPClient()  # 定义一个httpclientmyheaders  {Host: weixin.sogou.com,Connection: keep-alive,Cache-Control: max-age0,Upgrade-Insecure-Requests: 1,User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/532.5 (KHTML, like Gecko) Chrome/4.0.249.0 Safari/532.5 ,Accept: text/html,application/xhtmlxml,application/xml;q0.9,image/webp,image/apng,*/*;q0.8,Accept-Encoding: gzip, deflate,Accept-Language: zh-CN,zh;q0.9,en;q0.8}url  http://weixin.sogou.com/weixin?type1s_frominputquery%E4%BA%BA%E6%B0%91%E6%97%A5%E6%8A%A5ieutf8_sug_n_sug_type_req  HTTPRequest(urlurl, methodGET, headersmyheaders, follow_redirectsTrue, request_timeout20, connect_timeout10,proxy_host127.0.0.1,proxy_port8888)response  yield c.fetch(req)  # 发起请求print response.codeprint response.bodyIOLoop.current().stop()  # 停止ioloop线程except:print traceback.format_exc()Fiddler 抓到的报文请求头POST  JSON数据请求gen.coroutinedef fetch_url():抓取urltry:c  CurlAsyncHTTPClient()  # 定义一个httpclientmyheaders  {Host: weixin.sogou.com,Connection: keep-alive,Cache-Control: max-age0,Upgrade-Insecure-Requests: 1,User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/532.5 (KHTML, like Gecko) Chrome/4.0.249.0 Safari/532.5 ,Accept: text/html,application/xhtmlxml,application/xml;q0.9,image/webp,image/apng,*/*;q0.8,Accept-Encoding: gzip, deflate,Content-Type: Application/json,Accept-Language: zh-CN,zh;q0.9,en;q0.8}url  http://127.0.0.1?type1s_frominputquery%E4%BA%BA%E6%B0%91%E6%97%A5%E6%8A%A5ieutf8_sug_n_sug_type_body json.dumps({key1: value1, key2: value2})  # Json格式数据req  HTTPRequest(urlurl, methodPOST, headersmyheaders, follow_redirectsTrue, request_timeout20, connect_timeout10,proxy_host127.0.0.1,proxy_port8888,bodybody)response  yield c.fetch(req)  # 发起请求print response.codeprint response.bodyIOLoop.current().stop()  # 停止ioloop线程except:print traceback.format_exc()Fiddler 抓到的报文请求头POST  Form表单数据请求gen.coroutinedef fetch_url():抓取urltry:c  CurlAsyncHTTPClient()  # 定义一个httpclientmyheaders  {Host: weixin.sogou.com,Connection: keep-alive,Cache-Control: max-age0,Upgrade-Insecure-Requests: 1,User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/532.5 (KHTML, like Gecko) Chrome/4.0.249.0 Safari/532.5 ,Accept: text/html,application/xhtmlxml,application/xml;q0.9,image/webp,image/apng,*/*;q0.8,Accept-Encoding: gzip, deflate,# Content-Type: Application/json,Accept-Language: zh-CN,zh;q0.9,en;q0.8}import urlliburl  http://127.0.0.1?type1s_frominputquery%E4%BA%BA%E6%B0%91%E6%97%A5%E6%8A%A5ieutf8_sug_n_sug_type_body urllib.urlencode({key1: value1, key2: value2})  # 封装form表单req  HTTPRequest(urlurl, methodPOST, headersmyheaders, follow_redirectsTrue, request_timeout20, connect_timeout10,proxy_host127.0.0.1,proxy_port8888,bodybody)response  yield c.fetch(req)  # 发起请求print response.codeprint response.bodyIOLoop.current().stop()  # 停止ioloop线程except:print traceback.format_exc()Fiddler 抓到的报文请求头添加证书访问def fetch_url():抓取urltry:c  CurlAsyncHTTPClient()  # 定义一个httpclientmyheaders  {Host: www.amazon.com,Connection: keep-alive,Cache-Control: max-age0,Upgrade-Insecure-Requests: 1,User-Agent: (Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36),Accept: (text/html,application/xhtmlxml,application/xml;q0.9,image/webp,image/apng,*/*;q0.8),Accept-Encoding: gzip, deflate, br,Accept-Language: zh-CN,zh;q0.9,en;q0.8}import urlliburl  https://www.amazon.com/req  HTTPRequest(urlurl, methodGET, headersmyheaders, follow_redirectsTrue, request_timeout20, connect_timeout10,proxy_host127.0.0.1,proxy_port8888,ca_certsFiddlerRoot.pem)  # 绑定证书response  yield c.fetch(req)  # 发起请求print response.codeprint response.bodyIOLoop.current().stop()  # 停止ioloop线程except:print traceback.format_exc()Fiddler抓到的报文(说明可以正常访问)四、总结抓取量少的时候建议使用requests,简单易用。并发量大的时候建议使用tornado单线程高并发高效易编程。以上给出了requests和Fiddler中常用的接口和参数说明能解决爬虫面对的大部分问题包括并发抓取、日常的反爬应对https网站的抓取。附上一段我自己的常用抓取代码逻辑import randomfrom tornado.ioloop import IOLoopfrom tornado import genfrom tornado.queues import Queueimport randomfrom tornado.ioloop import IOLoopfrom tornado import genfrom tornado.queues import QueueTASK_QUE  Queue(maxsize1000)def response_handler(res): 处理应答一般会把解析的新的url添加到任务队列中并且解析出目标数据 passgen.coroutinedef url_fetcher_without_param():passgen.coroutinedef url_fetcher(*args,**kwargs):global TASK_QUEc  CurlAsyncHTTPClient()while 1:#console_show_log(Lets spider)try:param  TASK_QUE.get(time.time()  300) # 5 分钟超时except tornado.util.TimeoutError::yield gen.sleep(random.randint(10,100))continuetry:req  HTTPRequest(url,method,headers,....) # 按需配置参数response  yield c.fetch(req)if response.coe200:response_handler(response.body)except Exception:yield gen.sleep(10)continuefinally:print I am a slow spideryield gen.sleep(random.randint(10,100))gen.coroutinedef period_callback():passdef main():io_loop  IOLoop.current()# 添加并发逻辑1io_loop.spawn_callback(url_fetcher, 1)io_loop.spawn_callback(url_fetcher, 2)io_loop.spawn_callback(url_fetcher_without_param) # 参数是可选的# 如果需要周期调用调用PeriodicCallbackPERIOD_CALLBACK_MILSEC  10  # 10, 单位msio_loop.PeriodicCallback(period_callback,).start()io_loop.start()if __name__  __main__:main()以上欢迎讨论交流五、参考网易云免费体验馆0成本体验20款云产品更多网易研发、产品、运营经验分享请访问网易云社区。
http://www.yutouwan.com/news/303212/

相关文章:

  • 爱站网排名网站建设成本预测表
  • 网站建设特效大全网站开发专业培训
  • 网站申请支付宝支付高港做网站
  • 怎么才能登网站做外贸广州seo报价
  • 专业群建设网站个人网站域名起名
  • 申请网站就是做网站吗设计开发流程
  • 临淄网站制作首选公司海外房产网
  • 佛山免费建站公司潍坊seo推广
  • 青岛济南网站建设优化电商网站建设与运营方向就业前景
  • 品牌网站建设咨询建筑企业资质查询网站
  • 网站建设捌金手指下拉二五python 做网站 套件
  • 手机网站自助深圳公司排行榜
  • 网站建设华企云商企业域名查询
  • 离石网站建设公司上海外贸服装
  • 专业电容层析成像代做网站电子商务网站的优点有那些
  • 丽江建设局网站上海机械设备有限公司网站建设
  • 企业建设营销网站有哪些步骤程序开发过程有哪四个步骤
  • 邢台兼职网站有哪些?小游戏免费入口
  • 济宁亿峰科技做网站一年多少费用网站建设销售销售流程
  • 业余做衣服的网站织梦网站tag怎么做
  • 做网站公司怎么选外包公司设计完网站谁负责运营
  • 赫山区住房和城乡建设局网站重庆刮刮卡制作
  • 我的世界怎么做赞助网站建立网站坐等访问者发现
  • 重庆做网站熊掌号山东手机版建站系统信息
  • 中山做公司网站科技公司网站欣赏
  • 深圳做网站排名公司推荐彩票网站开发搭建
  • 莱阳 网站建设兼职网站建设推广人才
  • iis7 部署静态网站百度站长工具如何使用
  • 广州网站优化系统企业网怎么拉
  • 企业网站必须备案自学做网站需要多久