国外黄土网站,长沙网址seo,网站上的flash怎么做,灯网一家专门做灯的网站目录
SRE实战 互联网时代守护先锋#xff0c;助力企业售后服务体系运筹帷幄#xff01;一键直达领取阿里云限量特价优惠。
爬取弹幕
1. 从手机端口进入网页爬取找到接口
2.代码
import requests
from lxml import etree
import numpy as np
urlhttps://api.bilibili.com/x/v1…目录
SRE实战 互联网时代守护先锋助力企业售后服务体系运筹帷幄一键直达领取阿里云限量特价优惠。
爬取弹幕
1. 从手机端口进入网页爬取找到接口
2.代码
import requests
from lxml import etree
import numpy as np
urlhttps://api.bilibili.com/x/v1/dm/list.so?oid198835779
headers {
User-Agent: Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Mobile Safari/537.36,
}
response requests.get(url,headers headers)
# response.encodingutf-8
# print(response.text)
# print(response.content)
print(type(response.text))
htmletree.HTML(response.content)
tetree.tostring(html)
# print(t)
words html.xpath(/html//d/text())
with open(word.txt,w)as f:
for word in words:
f.write(word )
print(words)
每一次的都是不同的弹幕所以不用担心弹幕数量过少
制作词云
利用的是wordcloud库
1.文件读取
2.代码
#coding:utf-8
from matplotlib import pyplot as plt
from wordcloud import WordCloud
import jieba
fopen(rword.txt,r,encodinggbk).read()
font rC:\Windows\Fonts\FZSTK.TTF
cloudWordCloud(
font_pathfont,
width1000,
height800,
margin2
).generate(f)
plt.imshow(cloud)
plt.axis(off)
plt.show()
扫码关注我们
微信号SRE实战
拒绝背锅 运筹帷幄
×
选择打赏方式
微信
QQ钱包
支付宝打赏打赏打赏
多少都是心意谢谢大家
×
选择分享方式
微信扫一扫分享朋友圈
Or
手机扫一扫精彩随身带