当前位置: 首页 > news >正文

网站建设入什么会计科目上海建设工程检测网

网站建设入什么会计科目,上海建设工程检测网,做网站设计的,广州个人网站建设前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇#xff08;理论篇#xff09;#xff0c;今天给大家分享一下代码实现#xff08;实战篇#xff09;#xff0c;接着上篇往下继续深入。一、代码实现1、修改Scrapy项目中的items.py文件。我们需要获取的数…前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇理论篇今天给大家分享一下代码实现实战篇接着上篇往下继续深入。一、代码实现1、修改Scrapy项目中的items.py文件。我们需要获取的数据是朋友圈和发布日期因此在这里定义好日期和动态两个属性如下图所示。2、修改实现爬虫逻辑的主文件moment.py首先要导入模块尤其是要主要将items.py中的WeixinMomentItem类导入进来这点要特别小心别被遗漏了。之后修改start_requests方法具体的代码实现如下图。3、修改parse方法对导航数据包进行解析代码实现稍微复杂一些如下图所示。l需要注意的是从网页中获取的response是bytes类型需要显示的转为str类型才可以进行解析否则会报错。l在POST请求的限定下需要构造参数需要特别注意的是参数中的年、月和索引都需要是字符串类型的否则服务器会返回400状态码表示请求参数错误导致程序运行的时候报错。l在请求参数还需要加入请求头尤其是Referer反盗链务必要加上否则在重定向的时候找不到网页入口导致报错。l上述的代码构造方式并不是唯一的写法也可以是其他的。4、定义parse_moment函数来抽取朋友圈数据返回的数据以JSON加载的用JSON去提取数据具体的代码实现如下图所示。5、在setting.py文件中将ITEM_PIPELINES取消注释表示数据通过该管道进行处理。6、之后就可以在命令行中进行程序运行了在命令行中输入scrapy crawl moment -o moment.json之后可以得到朋友圈的数据在控制台上输出的信息如下图所示。7、尔后我们得到一个moment.json文件里面存储的是我们朋友圈数据如下图所示。8、嗯你确实没有看错里边得到的数据确实让人看不懂但是这个并不是乱码而是编码的问题。解决这个问题的方式是将原来的moment.json文件删除之后重新在命令行中输入下面的命令scrapy crawl moment -o moment.json -s FEED_EXPORT_ENCODINGutf-8此时可以看到编码问题已经解决了如下图所示。下一篇文章小编带大家将抓取到的朋友圈数据进行可视化展示敬请关注~~
http://www.yutouwan.com/news/31946/

相关文章:

  • 网站的技术方案顺企网企业名录
  • 微网站注意事项wordpress后台html
  • 可以做两个网站指向同一个域名网站界面分类
  • 百度安全网站检测网站制作合肥
  • 公司申请网站建设的工作方案注册公司费用跟后期费用
  • 网站建设交流发言稿艺术作品欣赏网站
  • 计算机网站建设知识国家信用信息公示系统的官网
  • 郴州网站建设公司有哪些wap网站一览
  • 网站开发框架排行seo搜索引擎优化工资薪酬
  • 公司网站备案具体什么情况百度信息流怎么做效果好
  • 网站默认极速模式免费做片头的网站
  • 排行榜软件广州seo网站优化培训
  • 萧山城市建设网站设计制作活动主题
  • qt做网站网站空间大小怎么查看
  • 无锡网站建设团队wordpress如何添加首页描述
  • 铁岭 开原网站建设WordPress漏洞报告
  • 飞沐网站建设公司北京一级消防工程师考试条件
  • 网站开发的技术简介是什么设计得到app下载
  • 网站为什么会被k移动网站
  • 如何网站客户案例wordpress默认插件
  • wordpress添加文章关键词描述无锡关键词优化报价
  • 做那个网站销售产品比较好市场调研报告范文大全
  • 制作一个网站能多少钱公司做网站比较好的平台
  • 网络营销产品的概念举例深圳网站自然优化
  • 顺义建站好的公司新品怎么推广效果最好
  • 水果配送网站建设万网网站后台登陆
  • 青岛网站设计皆挺青岛博采网络福建seo网络
  • 网络正常广州seo网络培训课程
  • 外贸做的亚马逊网站是哪个wordpress wdpx
  • 网站备案注销流程网站建设三合一