当前位置: 首页 > news >正文

电商网站建设案例自己建网站怎么做seo

电商网站建设案例,自己建网站怎么做seo,甘肃省作风建设年活动有网站,windows挂wordpress1 one-hot representation 该单词对应所在元素为1#xff0c;向量中其他元素均为0#xff0c;向量的维度就等于词库中的单词数目  所有向量都是互相正交的#xff0c;我们无法有效的表示两个向量间的相似度  向量维度过大。 from sklearn.feature_extraction.text…1 one-hot representation 该单词对应所在元素为1向量中其他元素均为0向量的维度就等于词库中的单词数目     所有向量都是互相正交的我们无法有效的表示两个向量间的相似度     向量维度过大。 from sklearn.feature_extraction.text import CountVectorizer import seaborn as sns import matplotlib.pyplot as plt corpus [Time flies flies like an arrow.,           Fruit flies like a banana.] vocab set([word for sen in corpus for word in sen.split( )]) one_hot_vectorizer CountVectorizer(binaryTrue) one_hot one_hot_vectorizer.fit_transform(corpus).toarray() print(one_hot_vectorizer.vocabulary_) print(one_hot) sns.heatmap(one_hot, annotTrue,cbarFalse, xticklabelsvocab, yticklabels[Sentence 2]) plt.show() {time: 6, flies: 3, like: 5, an: 0, arrow: 1, fruit: 4, banana: 2} [[1 1 0 1 0 1 1]  [0 0 1 1 1 1 0]] 2 使用sklearn计算tfidf TF-IDFterm frequency–inverse document frequency词频-逆向文件频率是一种用于信息检索information retrieval与文本挖掘text mining的常用加权技术。字词的重要性随着它在文件中出现的次数成正比增加但同时会随着它在语料库中出现的频率成反比下降。 TF是词频(Term Frequency) 词频TF表示词条关键字在文本中出现的频率。这个数字通常会被归一化(一般是词频除以文章总词数), 以防止它偏向长的文件。 IDF是逆向文件频率(Inverse Document Frequency) 逆向文件频率 (IDF) 总文件数目除以包含该词语的文件的数目再将得到的商取对数得到。罕见词的IDF很高高频词的IDF很低。 TF-IDF实际上是TF * IDF 应用 关键字计算出文章中每个词的TF-IDF值之后进行排序选取其中值最高的几个作为关键字。 文章的相似性 计算出每篇文章的关键词从中各选取相同个数的关键词合并成一个集合计算每篇文章对于这个集合中的词的词频生成两篇文章各自的词频向量进而通过欧氏距离或余弦距离求出两个向量的余弦相似度值越大就表示越相似。 from sklearn.feature_extraction.text import CountVectorizer,TfidfTransformer,TfidfVectorizer from pprint import pprint import seaborn as sns from matplotlib.pylab import plt corpus [Time flies flies like an arrow.,           Fruit flies like a banana.] one_hot_vectorizer CountVectorizer() one_hot one_hot_vectorizer.fit_transform(corpus).toarray() pprint(one_hot) #输出词频 transformer TfidfTransformer() tfidf transformer.fit_transform(one_hot) vocab one_hot_vectorizer.get_feature_names() print(vocab) #打印词典 pprint(transformer.idf_ ) #输出逆文档频率 pprint(tfidf.toarray()) #输出TFIDF sns.heatmap(tfidf.toarray(), annotTrue, cbarFalse, xticklabelsvocab,             yticklabels [Sentence 1, Sentence 2]) plt.show() array([[1, 1, 0, 2, 0, 1, 1],        [0, 0, 1, 1, 1, 1, 0]], dtypeint64) [an, arrow, banana, flies, fruit, like, time] array([1.40546511, 1.40546511, 1.40546511, 1.        , 1.40546511,        1.        , 1.40546511]) array([[0.42519636, 0.42519636, 0.        , 0.60506143, 0.        ,         0.30253071, 0.42519636],        [0.        , 0.        , 0.57615236, 0.40993715, 0.57615236,         0.40993715, 0.        ]])
http://www.sadfv.cn/news/167471/

相关文章:

  • 带数据的网站网站开发可以做什么
  • 怎么在工商局网站做股东变更安卓开发自学教程
  • 如何设计网站建设方案莱芜高端网站建设报价
  • 网站模版idc东城手机网站建设
  • 重庆网站建设总结与体会wordpress最新模板下载
  • 面试建设单位在哪个网站做地产网站哪家好
  • 妇联 网站建设情况海兴县网站建设公司
  • 一个网站同时做竞价和seowordpress 过滤iframe
  • 做网站帮京东卖东西怎么合作网站开发方式演进
  • 帮人家做网站难吗一键生成app制作器
  • 如何用手机网站做淘宝客app开发定制公司有哪些
  • 上海网站原型设计淘宝网站开始怎么做
  • 长沙3合1网站建设电话商业公众号开发需要多少钱
  • 医院品牌网站建设云南昆明网络公司有哪些
  • 织梦网站导航浮动小程序商店推荐
  • 南京网站公司科汛kesioncms网站系统
  • 金华市建设局网站职称设计师培训多久
  • 网站怎么绑定织梦wordpress博客收录查询
  • 金山石化网站建设代做ppt的网站
  • 西安公司网站彩票网站如何做
  • 三屏网站建设哈尔滨快速建站专业定制
  • 长沙网站se0推广优化公司做网站是先买域名
  • 网站建设和制作凡科网站模板
  • 怎么做属于自己的售卡网站常州市城市建设局网站
  • 企业微网站哪家好百度应用市场
  • 福田网站建设团队门户网站建设方案
  • 青州做网站wordpress 用户密码加密
  • 欧洲paypal网站wordpress 主题 不一样
  • 单仁咨询建设网站无极电影网迅雷下载
  • 贵阳网站设计多少钱ui界面