当前位置: 首页 > news >正文

网站作品怎么做网络维护简历模板

网站作品怎么做,网络维护简历模板,如何在门户网站做搜索引擎,辽宁省城乡住房建设厅网站NLP实践——使用Llama-2进行中文对话 1. 前言2. 利用prompt3. 利用Logit Processor3.1 修改13.2 修改23.3 修改33.4 修改4 1. 前言 在之前的博客 NLP实践——Llama-2 多轮对话prompt构建中#xff0c;介绍了如何构建多轮对话的prompt#xff0c;本文将介绍如何使用Llama-2进… NLP实践——使用Llama-2进行中文对话 1. 前言2. 利用prompt3. 利用Logit Processor3.1 修改13.2 修改23.3 修改33.4 修改4 1. 前言 在之前的博客 NLP实践——Llama-2 多轮对话prompt构建中介绍了如何构建多轮对话的prompt本文将介绍如何使用Llama-2进行中文对话。 现有的很多项目在开源的Llama-2基础上进行了中文场景的训练然而Llama-2本身就具有多语种的能力理论上是可以直接运用于中文场景的。 本文所举例使用的模型为Llama-2-7b-chat-hf。 2. 利用prompt 首先可以想到的是使用prompt。可是即便是在prompt中添加了要求模型回答中文的提示模型仍然回答的是英文。 从对话内容可以看到模型可以理解用户的问题却没有输出中文 你好Hello! Im here to help answer any questions you may have. Is there something specific youd like to know or discuss? Please feel free to ask, and Ill do my best to assist you. 3. 利用Logit Processor 在之前另一篇博客 以Llama-2为例在生成模型中使用自定义LogitsProcessor中介绍了怎样使用logits processor来改变生成过程中的概率进而改变生成的结果。那么可以直接想到的是把tokenizer中所有中文字符的概率调大一些就可以强行要求模型生成中文了。 3.1 修改1 首先利用unicode范围获取常见的汉字 import re def is_chinese(word):判断一个字符串是否为汉字if re.match([\u4e00-\u9fff], word):return Trueelse:return FalseCHINESE_TOKEN_IDS [token_id for token, token_id in tokenizer.vocab.items() if is_chinese(token)]然后就可以实现一个processor来提高这些token对应的概率 from transformers.generation.logits_process import LogitsProcessor, LogitsProcessorListclass ChineseLogitsProcessor(LogitsProcessor):生成中文字符---------------ver: 2023-08-02by: changhongyudef __init__(self, chinese_token_id_list: List[int] None,alpha: float 5)::param chinese_token_id_list: 中文token的token的id列表:param alpha: 放大倍数self.chinese_token_id_list chinese_token_id_listself.alpha alphadef __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor) - torch.FloatTensor:for id_ in self.chinese_token_id_list:scores[:, id_] * self.alphareturn scores在生成之前按照之前博客中介绍的方法创建processor logits_processor LogitsProcessorList() logits_processor.append(ChineseLogitsProcessor(CHINESE_TOKEN_IDS))3.2 修改2 然而模型却生成起来停不下了。这是因为没有将EOS token的概率也做相应的放大。 CHINESE_TOKEN_IDS.append(tokenizer.eos_token_id)这下模型可以输出中文了 你好好的好的大家好的我是一个智能问题机器人我可以回应你的问题请问你有任何问题或需要我的服务可是看起来好像哪里怪怪的原来是没有标点。 3.3 修改3 既然没有标点那我们再把标点符号的概率也放大就好了 puncs [, 。, , , “, ”, , ,, ., ?, !, , , :] CHINESE_TOKEN_IDS [token_id for token, token_id in tokenizer.vocab.items() if is_chinese(token)] CHINESE_TOKEN_IDS.extend(tokenizer.convert_tokens_to_ids(puncs)) CHINESE_TOKEN_IDS.append(tokenizer.eos_token_id)现在eos也有了标点符号也有了然而还是出意外了 你好:你好我是一个智能问题机器人我的任务是回应用户的问题。请问你有任何问题3.4 修改4 现在模型倒是可以说中文也带标点了但标点出现在了最开头。这样的话我们可以再添加一个processor不让这些标点出现在最开始就可以了。 class SuppressSpecificBOSTokenLogitsProcessor(LogitsProcessor):防止生成的第一个token是某些特定的token---------------ver: 2023-08-02by: changhongyudef __init__(self, bad_bos_token_id_list: List[int] None)::param bad_bos_token_id_list: 不可以作为第一个token的token的id列表self.bad_bos_token_id_list bad_bos_token_id_listdef __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor) - torch.FloatTensor:new_token_len input_ids.shape[-1] - current_token_lenif new_token_len 0:for id_ in self.bad_bos_token_id_list:scores[:, id_] -float(inf)return scores将两个processor放在一起 logits_processor LogitsProcessorList() logits_processor.append(ChineseLogitsProcessor(CHINESE_TOKEN_IDS)) logits_processor.append(SuppressSpecificBOSTokenLogitsProcessor([tokenizer.convert_tokens_to_ids(punc) for punc in puncs]))终于可以让模型实现中文对话了 你好好的好的你好对不起我不知道你问的问题请问你想问些事情虽然回答的还是有点奇怪但使用中文与模型进行对话的目的也的的确确是达到了。
http://www.sadfv.cn/news/376759/

相关文章:

  • 泉州网站平台建设公司下载网站开发
  • 电子商务网站建设与实例心得制作只有一张图片的网站
  • 外贸网站建设哪家快速杭州蚂蚁 做网站的公司
  • 海宁高端高端网站设计手机优化软件哪个好用
  • 易进网站建设推广商务网站欣赏
  • 论述农产品电商网站建设静态旅游网站
  • 小马网站建设室内设计要学哪些科目
  • 会员发布网站建设山东德州网站建设
  • 做自媒体小视频哪个网站比较赚钱中国网湖北官网
  • 网站建设与维护 技能广州个人网站制作
  • 2023小规模企业所得税怎么征收的seo外链优化
  • 网站常用 英文如何 做网站挣钱
  • 宁波网站建设接单wordpress需要编程技术嘛
  • 哪个协会要做网站建设啊wordpress 双 切换
  • 网站权重降低国内优秀网页鉴赏
  • 搜索网站排行榜网站建设程序员做什么
  • 建设银行网站怎么查工资明细建个购物网站要多少钱
  • 肇庆网站建设方案优化网站建设的软件有哪些
  • 外贸多语言网站免费源码福田网站建设费用明细
  • 江苏盐城网站建设音乐网站界面
  • 网站名称要求网络规划设计师讲义百度网盘下载
  • 重庆营销网站建设公司瀑布流 wordpress
  • 静态网站模板源码下载最值钱的域名列表
  • 企业网站建设找哪家服装网页设计模板
  • 网站开发 售后服务协议温州快速排名优化
  • 如何制作网站要钱吗北京seo推广系统
  • 电脑做试卷的网站网站建设进展报告
  • 怎样制作静态网站中国建设会计学网站
  • 企业网站主页设计模板购物网站建设网页推广
  • 青海省城乡建设信息官官方网站网站被qq拦截 做301