当前位置: 首页 > news >正文

北京网站设计公司哪家公司好小程序开发公司哪家

北京网站设计公司哪家公司好,小程序开发公司哪家,网站开发者收入来源,wordpress做音乐网插件吗中文分词、词频统计并制作词云图是统计数据常用的功能#xff0c;这里用到了三个模块快速实现这个功能。 中文分词、词频统计 import jieba from collections import Counter# 1. 读取文本内容并进行分词 with open(demo.txt, moder, encodinggbk) as f:report f.read() wo…中文分词、词频统计并制作词云图是统计数据常用的功能这里用到了三个模块快速实现这个功能。 中文分词、词频统计 import jieba from collections import Counter# 1. 读取文本内容并进行分词 with open(demo.txt, moder, encodinggbk) as f:report f.read() words jieba.cut(report)# 2. 按指定长度提取词 report_words [] for word in words:if len(word) 4:report_words.append(word) print(report_words)# 3. 统计高频词汇 result Counter(report_words).most_common(50) print(result) 上面代码用jieba模块进行分词用collections进行词频统计。 jieba是一个优秀的第三方中文词库用于中文分词。中文分词指的是将一个汉字序列切分成一个一个单独的词。jieba可以帮助你快速高效地完成中文分词支持三种分词模式精确模式、全模式和搜索引擎模式。 collections是Python标准库中的一个模块提供了一些额外的容器类型以提供Python标准内建容器dict、list、set和tuple的替代选择。这些容器类型包括namedtuple、deque、Counter等。 简单词云图 import jieba.posseg as pseg from collections import Counter from wordcloud import WordCloud# 1. 读取文本内容并进行分词 with open(demo.txt, moder, encodinggbk) as f:report f.read() words pseg.cut(report)# 2. 按指定长度和词性提取词 report_words [] for word, flag in words:if (len(word) 4) and (n in flag):report_words.append(word) # print(report_words)# 3. 统计高频词汇 result Counter(report_words).most_common(50) # print(result)# 4. 绘制词云图 content dict(result) # print(content) wc WordCloud(font_pathPINGFANG MEDIUM.TTF, background_colorwhite, width1000, height600) wc.generate_from_frequencies(content) wc.to_file(词云图1.png) 这里用到了wordcloud模块来生成词云图。 按照图片绘制词云图 import jieba.posseg as pseg from collections import Counter from PIL import Image import numpy as np from wordcloud import WordCloud# 1. 读取文本内容并进行分词 with open(demo.txt, moder, encodinggbk) as f:report f.read() words pseg.cut(report)# 2. 按指定长度和词性提取词 report_words [] for word, flag in words:if (len(word) 4) and (n in flag):report_words.append(word) # print(report_words)# 3. 统计高频词汇 result Counter(report_words).most_common(300) # print(result)# 4. 绘制词云图 mask_pic Image.open(map.png) mask_data np.array(mask_pic) print(mask_data) content dict(result) wc WordCloud(font_pathPINGFANG MEDIUM.TTF, background_colorwhite, maskmask_data) wc.generate_from_frequencies(content) wc.to_file(词云图2.png) 这里给WordCloud加了mask遮罩参数。 按照图片绘制渐变词云图 import jieba.posseg as pseg from collections import Counter from PIL import Image import numpy as np from wordcloud import WordCloud, ImageColorGenerator# 1. 读取文本内容并进行分词 with open(demo.txt, moder, encodinggbk) as f:report f.read() words pseg.cut(report)# 2. 按指定长度和词性提取词 report_words [] for word, flag in words:if (len(word) 4) and (n in flag):report_words.append(word) # print(report_words)# 3. 统计高频词汇 result Counter(report_words).most_common(300) # print(result)# 4. 绘制词云图 mask_pic Image.open(map.png) mask_data np.array(mask_pic) content dict(result) wc WordCloud(font_pathPINGFANG MEDIUM.TTF, background_colorwhite, maskmask_data) wc.generate_from_frequencies(content) mask_colors ImageColorGenerator(mask_data) wc.recolor(color_funcmask_colors) wc.to_file(词云图3.png) 这里用recolor重绘了颜色。
http://www.yutouwan.com/news/186407/

相关文章:

  • 外贸 网站 源码注册深圳公司
  • 公司网站如何做分录权威做网站的公司
  • 杭州网站建设公司电话个人网站的设计流程
  • 程序员自己建站赚钱南部县房产网
  • 品牌型网站设计做门户网站用什么软件
  • 网站开发工程师学什么区别潍坊住房和城乡建设厅网站电话
  • 需要锦州网站建设c# 网站开发实例教程
  • 怎么买域名建网站给网站做选题
  • 重庆触摸屏_电子商务网站建设网上找工程平台有哪些
  • 网站打开出现建设中定制网站与模板网站
  • 盗版系统网站怎么建立三星网上商城下载
  • 学习网站 现状wordpress错误代码403
  • 顺德企业网站制作百度竞价排名事件
  • 做报纸版式的网站江苏网站seo平台
  • 国内html网站欣赏有谁想做网站 优帮云
  • 5118网站查询做一份网站的步zou
  • 网站健设推广产品多少钱营销型网站的评价
  • 那里可以做PC28网站的品牌宣传的推广
  • 黄页网站推广qq群推广链接
  • 济南网站制作公司wordpress 极简主题
  • 凡科建设网站步骤免费的模板下载
  • postgresql做网站用什么环境什么网站做adsense好
  • 整个网站都在下雪特效怎么做Wordpress动图主题
  • 祁阳做网站哈尔滨网站制作公司
  • 招聘网站套餐视频号推广方法
  • 网站制作进度表营销推广型网站价格
  • 深圳网站建设开发哪家好怎么用网网站模板做网站
  • 网站搜索引擎优化案例茂名网站建设
  • 网站服务器指的是什么wordpress 乱版
  • 做网站怎么备份数据一个新的网站开发语言