当前位置: 首页 > news >正文

摄影师网站推荐大型门户网站建设哪便宜

摄影师网站推荐,大型门户网站建设哪便宜,物联网是干什么的用的,上海网站建设规范一、综述 本文主要做推荐系统浅析#xff0c;主要介绍推荐系统的定义#xff0c;推荐系统的基础框架#xff0c;简单介绍设计推荐的相关方法以及架构。适用于部分对推荐系统感兴趣的同学以及有相关基础的同学#xff0c;本人水平有限#xff0c;欢迎大家指正。 二、商品…一、综述 本文主要做推荐系统浅析主要介绍推荐系统的定义推荐系统的基础框架简单介绍设计推荐的相关方法以及架构。适用于部分对推荐系统感兴趣的同学以及有相关基础的同学本人水平有限欢迎大家指正。 二、商品推荐系统 2.1 推荐系统的定义 推荐系统本质上还是解决信息过载的问题帮助用户找到他们感兴趣的物品深度挖掘用户潜在的兴趣。 2.2 推荐架构 其实推荐系统的核心流程只有召回、排序、重排。 请求流程 当一个用户打开一个页面这个时候前端会携带用户信息pin或者uuid等去请求后台接口通过color间接调用当后台收到请求后一般会先根据用户标识进行分流获取相关策略配置ab策略这些策略去决定接下来会调用召回模块、排序模块以及重排模块的哪个接口。一般召回模块分多路召回每路召回负责召回多个商品排序和重排负责调整这些商品的顺序。最后挑选出合适的商品并进行价格、图片等相关信息补充展现给用户。用户会根据自己是否感兴趣选择点击或者不点击这些涉及用户的行为会通过日志上报到数据平台为之后效果分析和利用用户行为推荐商品奠定基础。 其实有些问题想说一说 为什么要采取召回、排序、重排这种漏斗分层架构 1从性能方面 终极从百万级的商品库筛选出用户感兴趣的个位数级别的商品。 复杂的排序模型线上推断耗时严重需要严格控制进入排序模型的商品数量。需要进行拆解 2从目标方面 召回模块召回模块的任务是快速从大量的物品中筛选出一部分候选物品目的是不要漏掉用户可能会喜欢的物品。召回模块通常采用多路召回使用一些简化的特征或模型。 排序模块排序模块的任务是精准排序根据用户的历史行为、兴趣、偏好等信息对召回模块筛选出的候选物品进行排序。排序模块通常使用一些复杂的模型。 重排模块重排模块的任务是对排序模块的结果进行二次排序或调整以进一步提高推荐的准确性和个性化程度。重排模块通常使用一些简单而有效的算法。 什么是ab实验 参考论文Overlapping Experiment Infrastructure: More, Better, Faster Experimentation(google2010) 只有在线实验才能真正评估模型优劣ab实验可以快速验证实验的效果快速迭代模型。减少上线新功能的风险。 ab算法Hashuuid实验id创建时间戳%100 特性分流正交 2.3召回 召回层的存在仅仅是为用户从广阔的商品池子中初筛出一批还不错的商品。为了平衡计算速度与召回率正样本占全部正样本的比例指标之间的矛盾采用多路召回策略每路召回策略只考虑其中的单一特征或策略。 2.3.1多路召回的优劣 多路召回采用不同的策略、特征或者简单模型分别召回一部分候选集然后把候选集混合在一起供排序使用。召回率高速度快多路召回相互补充。 多路召回中每路召回的截断个数K是个超参数需要人工调参成本高召回通路存在重合问题冗余。 是否存在一种召回可以替代多路召回向量召回应用而生就目前而言仍然是以向量召回为主其他召回为辅的架构。 2.3.2召回分类 主要分为非个性化召回个性化召回两大类。非个性化召回主要是进行热点推送推荐领域马太效应严重20%的商品贡献80%的点击。个性化召回主要是发掘用户感兴趣的商品着重处理每个用户的差异点提高商品的多样性保持用户的粘性。 非个性化召回 1 热门召回 近7天高点击、高点赞、高销量商品召回 2新品召回 最新上架的商品召回 个性化召回 1标签召回、地域召回 标签召回用户感兴趣的品类、品牌、店铺召回等 地域召回根据用户的地域召回地域内的优质商品。 2cf召回 协同过滤算法是基于用户行为数据挖掘用户的行为偏好从而根据用户的行为偏好为其推荐物品其根据的是用户和物品的行为矩阵共现矩阵。用户行为一般包括浏览、点赞、加购、点击、关注、分享等等。 协同过滤分为三大类基于用户的协同过滤UCF和基于物品的协同过滤ICF和基于模型的协同过滤隐语义模型。是否为用户推荐某个物品首先要把用户和物品进行关联而进行关联的点是另一个物品还是另一个用户决定了这属于哪个类型的协同过滤。而基于隐语义模型是根据用户行为数据进行自动聚类挖掘用户的潜在兴趣特征。从而通过潜在兴趣特征对用户和物品进行关联。 基于物品的协同过滤ICF判断是否为用户推荐某个物品首先根据用户历史行为记录的物品和这个物品的相似关系来推断用户对这个物品的兴趣度从而判断我们是否推荐这个物品。整个协同过滤过程主要分为以下几步计算物品之间的相似度计算用户对物品的兴趣度排序截取结果。 商品相似度计算 衡量相似度主要有以下几种方式夹角余弦距离杰卡德公式。由于用户或物品的表示方式的多样性使得这些相似度的计算非常灵活。我们可以利用用户和物品的行为矩阵来去计算相似度也可以根据用户行为、物品属性和上下文关系构造用户和物品的向量表示去计算相似性。 夹角余弦距离公式 cos⁡θ(x1*x2y1*y2)/(√(x12y12 )*√(x22y22 )) 杰卡德公式J(A,B)(|A⋂B|)/(|A⋃B|) 商品a商品b商品c商品d用户A1001用户B0110用户C1011用户D1100 夹角余弦距离公式计算商品a和b的相似度 Wab(1*00*11*01*1)/(√(12021212 )*√(02120212 ))1/√6 spark实现ICFhttps://zhuanlan.zhihu.com/p/413159725 问题冷启动问题长尾效应。 3向量召回 向量化召回通过学习用户与物品低维向量化表征将召回建模成向量空间内的近邻搜索问题有效提升了召回的泛化能力与多样性是推荐引擎的核心召回通道。 向量万物皆可向量化Embedding就是用一个低维稠密的向量表示一个对象词语或者商品主要作用是将稀疏向量转换成稠密向量降维的效果这里的表示蕴含着一定的深意使其能够表达出对象的一部分特征同时向量之间的距离反映对象之间的相似性。 向量召回步骤离线训练生成向量在线向量检索。 1.离线训练生成向量 word2vec词向量的鼻祖由三层神经网络输入层隐藏层输出层隐藏层没有激活函数输出层用了softmax计算概率。 目标函数 网络结构 总的来说输入是词语的序列经过模型训练可以得到每个词语对应的向量。应用在推荐领域就是输入是用户的点击序列经过模型训练得到每个商品的向量。 优劣简单高效但是只考虑了行为序列没有考虑其他特征。 双塔模型 网络结构分别称为User塔和物品塔其中User塔接收用户侧特征作为输入比如用户id、性别、年龄、感兴趣的三级品类、用户点击序列、用户地址等Item塔接受商品侧特征比如商品id、类目id、价格、近三天订单量等。数据训练正样本数据1负样本0正样本点击的商品负样本全局随机商品样本或者同批次其他用户点击样本 优劣高效完美契合召回特性在线请求得到用户向量检索召回item向量泛化性高用户塔和item塔割裂只在最后做了交互。 2.在线向量检索 向量检索是一种基于向量空间模型Vector Space Model的信息检索方法用于在大规模文本集合中快速查找与查询向量最相似的文档向量。在信息检索、推荐系统、文本分类中得到广泛应用。 向量检索的过程是计算向量之间的相似度最后返回相似度较高的TopK向量返回而向量相似度计算有多种方式。计算向量相似性得方式有欧式距离、内积、余弦距离。归一化后内积与余弦相似度计算公式等价。 向量检索的本质是近似近邻搜索ANNS尽可能减小查询向量的搜索范围从而提高查询速度。 目前在工业界被大规模用到的向量检索算法基本可以分为以下3类 局部敏感性哈希LSH基于图(HNSW)基于乘积量化 简单介绍LSH LSH算法的核心思想是将原始数据空间中的两个相邻数据点通过相同的映射或投影变换后这两个数据点在新的数据空间中仍然相邻的概率很大而不相邻的数据点被映射到同一个桶的概率很小。 相比于暴力搜索遍历数据集中的所有点而使用哈希我们首先找到查询样本落入在哪个桶中如果空间的划分是在我们想要的相似性度量下进行分割的则查询样本的最近邻将极有可能落在查询样本的桶中如此我们只需要在当前的桶中遍历比较而不用在所有的数据集中进行遍历。当哈希函数数目H取得太大查询样本与其对应的最近邻落入同一个桶中的可能性会变得很微弱针对这个问题我们可以重复这个过程L次(每一次都是不同得哈希函数)从而增加最近邻的召回率。 案例:基于word2vec实现向量召回 2.4排序 推荐系统的掌上明珠 排序阶段分为粗排和精排粗排一般出现在在召回结果的数据量级比较大的时候。 进化历程 简单介绍WideDeep 背景手动特征组合实现记忆性效果不错但是特征工程太耗费人力并且未曾出现的特征组合无法记忆不能进行泛化。 目的使模型同时兼顾泛化和记忆能力有效的利用历史信息并具有强大的表达能力​ 1记忆能力 模型直接学习并利用历史数据中物品或者特征共现频率的能力记忆历史数据的分布特点简单模型容易发现数据中对结果影响较大的特征或者组合特征调整其权重实现对强特征的记忆 2泛化能力 模型传递特征的相关性以及发掘稀疏或者从未出现过的稀有特征和最终标签相关性的能力即使是非常稀疏的特征向量输入也能得到稳定平滑的推荐概率。提高泛化性的例子矩阵分解神经网络 兼顾记忆和泛化能力 结果的准确性和扩展性 wide部分专注模型记忆快速处理大量历史行为特征deep部分专注模型泛化探索新世界模型传递特征的相关性发掘稀疏甚至从外出现过的稀有特征与最终标签的相关性的能力具有强大的表达能力。最终将wide部分和deep部分结合起来形成统一的模型。 wide部分就是基础的线性模型表示为yW^T Xb X特征部分包括基础特征和交叉特征。交叉特征在wide部分很重要可以捕捉到特征间的交互起到添加非线性的作用。 deep部分为embeding层三层神经网络relu前馈公式 联合训练 优劣为推荐/广告/搜索排序算法之后的发展奠定了重要基础从传统算法跨越到深度学习算法里程碑意义。兼顾记忆和泛化能力但是Wide侧仍需要手工组合特征。 参考论文Wide Deep Learning for Recommender Systems 2.5 重排 定义对精排后的结果顺序进行微调一方面实现全局最优、一方面满足业务诉求提升用户体验。比如打散策略强插策略提高曝光敏感过滤 MMR算法 实现商品多样性问题​ 目的在推荐结果准确性的同时保证推荐结果的多样性为了平衡推荐结果的多样性和相关性​ 算法原理如公式​ D商品集合Q用户S已被选中的商品集合 R\SR中未被选中的商品集合​ def MMR(itemScoreDict, similarityMatrix, lambdaConstant0.5, topN20):#s 排序后列表 r 候选项s, r [], list(itemScoreDict.keys())while len(r) 0:score 0selectOne None# 遍历所有剩余项for i in r:firstPart itemScoreDict[i]# 计算候选项与已选项目集合的最大相似度secondPart 0for j in s:sim2 similarityMatrix[i][j]if sim2 second_part:secondPart sim2equationScore lambdaConstant * (firstPart - (1 - lambdaConstant) * secondPart)if equationScore score:score equationScoreselectOne iif selectOne None:selectOne i# 添加新的候选项到结果集r同时从s中删除r.remove(selectOne)s.append(selectOne)return (s, s[:topN])[topN len(s)] 意义是选择一个与用户最相关的同时跟已选择物品最不相关的物品。时间复杂度O(n2) 可以通过限制选择的个数进行降低时间复杂度​ 工程实现需要用户和物品的相关性和物品之间的相似性作为输入用户和物品的相关性可以用排序模型的结果作为代替物品之间的相似性可以通过协同过滤等算法得到商品向量计算余弦距离。也可以简单得是否同一三级类目、同一店铺等表征​ 三、总结 就简单唠叨这么多啦主要想让大家了解一下推荐系统向大家介绍一下整个推荐架构以及整个推荐都有哪些模块。由于本人水平有限每个模块也没有讲的特别细希望之后能在工作中继续学习这个领域深挖细节产出更好的东西呈现给大家。感谢 作者京东零售 闫先东 来源京东云开发者社区
http://www.sadfv.cn/news/132564/

相关文章:

  • 抚州做网站高校网站建设自查报告
  • 手机网站建设推广方案wordpress增加目录
  • 工作网站开发制作一个公司设计网站怎么做
  • 网站代理服务器有问题苏州做手机网站
  • 医疗网站建设好么网页升级访问紧急大通知狼
  • 如何利用fortran语言建设网站html网站欣赏
  • 免费的200m网站空间wordpress柒主题
  • wordpress tag=广州市网络优化推广企业
  • 外贸网站建设合同作网站
  • 网站网站开发建设手机网站的目的
  • 公司产品网站应该怎么做免费可以看的软件大全下载
  • 广东省自然资源厅网站亚洲一线产区二线产区精华
  • app开发和网站开发视频网站建设技术方案书
  • 关于做公司app的软件或网站做o2o平台网站需要多少钱
  • 宜昌建网站wordpress 文章分页代码
  • 登不上建设企业网站美空wordpress主题
  • 怎么看网站开发的发展手机能看的网站有哪些
  • 做游戏攻略网站赚钱吗现代锦州网站建设
  • wordpress 建站对比女生学电子商务好吗
  • 网站内容及功能模块设计阳江本地最新招聘信息
  • 网站开发环境介绍泰山区最新通告
  • xxx美食网站建设规划书推广引流文案
  • 三亚网站外包网站建设在线视频
  • 免费建站系统官网二级域名免费分发
  • 河北住房和城乡建设厅网站电话asp 免费网站模板
  • 上海做网站优化公司做个游戏app的费用大概多少
  • 中国建设银行网站忘记密码韩国美食网站建设目的
  • 外贸网站建设推广方案外贸先做网站还是开公司
  • 网站会员功能ui培训周末班
  • 网站建设与发布tp5网站开发逻辑架构