当前位置: 首页 > news >正文

专业做外贸英文公司网站台州网站设计公司

专业做外贸英文公司网站,台州网站设计公司,权威发布图片,工程信息网站谁做文章目录 代码代码解读 代码 from tensorflow.keras.preprocessing.text import Tokenizer # 标记器(每一个词#xff0c;以我们的数值做映射#xff0c;)words [LaoWang has a Wechat account., He is not a nice person., Be careful.] # 把这句话中每一个单词#xf… 文章目录 代码代码解读 代码 from tensorflow.keras.preprocessing.text import Tokenizer # 标记器(每一个词以我们的数值做映射)words [LaoWang has a Wechat account., He is not a nice person., Be careful.] # 把这句话中每一个单词映射成我们的数值 tokenizer Tokenizer(num_words15) # 上面三句话中词的总数不超过 15 个估算的值 num_words 设置单词的数量 tokenizer.fit_on_texts(words) word_index tokenizer.word_index print(word_index, len(word_index)) # 把文本转化为序列编码 sequences tokenizer.texts_to_sequences(words) print(sequences) # 文本转化为矩阵 one_hot_matrix tokenizer.texts_to_matrix(words, modebinary) # 向量化是构建神经网络的第一步 print(tokenizer.word_index.keys()) print(one_hot_matrix, one_hot_matrix.shape)代码解读 逐行解读这段代码。 from tensorflow.keras.preprocessing.text import Tokenizer从tensorflow.keras.preprocessing.text模块导入Tokenizer类。Tokenizer用于文本标记将每一个词映射为一个整数值。 words [LaoWang has a Wechat account., He is not a nice person., Be careful.]定义了一个列表words包含三个字符串。 tokenizer Tokenizer(num_words15)创建一个Tokenizer对象并设置参数num_words15意味着最大考虑15个单词。这不代表只有15个单词会被编码而是在后续转换为矩阵时只会考虑频率最高的前15个单词。 tokenizer.fit_on_texts(words)调用fit_on_texts方法让tokenizer在words列表上进行学习从而创建一个词到整数值的映射。 word_index tokenizer.word_index获取tokenizer的word_index属性它是一个字典其中键是单词值是单词对应的整数值。 print(word_index, len(word_index)){‘a’: 1, ‘laowang’: 2, ‘has’: 3, ‘wechat’: 4, ‘account’: 5, ‘he’: 6, ‘is’: 7, ‘not’: 8, ‘nice’: 9, ‘person’: 10, ‘be’: 11, ‘careful’: 12} 12 打印word_index字典和它的长度。 sequences tokenizer.texts_to_sequences(words)调用texts_to_sequences方法将words列表中的文本转化为整数序列保存到sequences中。 print(sequences)[[2, 3, 1, 4, 5], [6, 7, 8, 1, 9, 10], [11, 12]] 打印sequences列表。 one_hot_matrix tokenizer.texts_to_matrix(words, modebinary)调用texts_to_matrix方法将words列表中的文本转化为二进制矩阵保存到one_hot_matrix中。二进制矩阵意味着如果某个单词出现在文本中它的位置会是1否则是0。 print(tokenizer.word_index.keys())dict_keys([‘a’, ‘laowang’, ‘has’, ‘wechat’, ‘account’, ‘he’, ‘is’, ‘not’, ‘nice’, ‘person’, ‘be’, ‘careful’]) 打印word_index字典中所有的键即所有的单词。 print(one_hot_matrix, one_hot_matrix.shape)[[0. 1. 1. 1. 1. 1. 0. 0. 0. 0. 0. 0. 0. 0. 0.] [0. 1. 0. 0. 0. 0. 1. 1. 1. 1. 1. 0. 0. 0. 0.] [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 1. 1. 0. 0.]] (3, 15) 打印one_hot_matrix和它的形状。这个矩阵的每一行对应words列表中的一个文本每一列对应一个单词。如果文本中有该单词则该位置的值为1否则为0。 总结这段代码首先定义了一个文本列表然后使用Tokenizer类将文本转化为整数序列最后将文本转化为二进制矩阵。这是将文本数据预处理为可以输入到神经网络的形式的常见步骤。
http://www.yutouwan.com/news/290724/

相关文章:

  • 著名的外贸网站ps个人网页设计素材
  • 建设网站的法律可行性seo和sem的区别是什么?
  • 南川集团网站建设网站推广昔年下拉
  • 建设网站工作内容想推网站目录源码
  • 建立网站的目的和功能三水网站开发
  • 网站策划的流程微信公众官方平台入口
  • 上市公司专利查询网站可信软件开发工程师
  • 如何用二级域名做网站布奏微商广告推广
  • 网站页面小图标怎么做做网站给客户聊天记录
  • 建设网站需要多少钱济南兴田德润o厉害吗模板下载免费
  • 企业网站建设与管理简述中国工程机械网
  • 做网站郑州汉狮电商网站建设课程设计实验报告
  • dw网页制作教案外汇网站怎么做优化
  • 开发手机网站用什么好处在线工具
  • 营销型网站建设网站建设营销深圳市大鹏建设局网站
  • 做外包装很厉害的网站打开建设银行网站
  • php网站如何做特效讯响模板网站
  • 番禺电子商务网站建设百度投诉中心入口
  • 普通网站报价多少天津品牌建站
  • 家居企业网站建设咨询设计网站遇到的问题
  • 网站推荐你懂我的意思吧知乎wordpress火车头发布
  • 做一下网站需要什么条件广州企业建站模板
  • 安吉网站建设公司淄博网站制作品牌定制
  • 网站建设教程微云网盘网站备案期间可以做推广吗
  • dz论坛网站建设沈阳seo全网营销
  • 颍上做网站中国建筑劳务分包网
  • 做时彩网站违法吗wap的网站模板下载
  • 怎么运行自己做的网站开发企业app公司
  • 网站闭站免费一级域名有哪些
  • 描述建设一个网站的具体步骤网页加速器免费版 安卓