当前位置: 首页 > news >正文

网站界面设计需要首先做市场研究吗网站开发中设计登录界面

网站界面设计需要首先做市场研究吗,网站开发中设计登录界面,一个页面对网站如何建设,网络推广有哪些常用方法如果有A、B、C三位同学#xff0c;他们各自手上有10、15、20块钱#xff0c;这时需要在相互不知道对方有多少钱的情况下#xff0c;不借助力第三方来计算三个人一共有多少钱。请问这时候#xff0c;我们如何实现呢#xff1f;——这#xff0c;就是最经典的秘密共享场景。… 如果有A、B、C三位同学他们各自手上有10、15、20块钱这时需要在相互不知道对方有多少钱的情况下不借助力第三方来计算三个人一共有多少钱。请问这时候我们如何实现呢——这就是最经典的秘密共享场景。在看完这篇文章后答案就出来了~ 背景 互联网时代一切基于数据。 随着人工智能的兴起数据的质量和数量已经成为影响机器学习模型效果最重要的因素之一因此通过数据共享的模式来“扩展”数据量、从而提升模型效果的诉求也变得越发强烈。 但在数据共享过程中不可避免会涉及到两个问题隐私泄露和数据滥用。 提到这两个关键词大家一定都对其背后的缘由有所耳闻 第一则2018年3月剑桥咨询公司通过FaceBook的数据共享漏洞收集了5000万用户信息据说有可能利用这些信息操控美国总统竞选造成恶劣社会影响事件曝光后FB公司股票大跌7%引发一系列后续问题。 第二则2018年5月欧盟通过General Data Protection RegulationGDPR法案法案指出所有与个人相关的信息都是个人数据对数据的使用行为必须要有用户的明确授权。把对隐私保护的要求提到了一个新的高度。 随着对数据安全的重视和隐私保护法案的出台以前粗放式的数据共享受到挑战各个数据拥有者重新回到数据孤岛的状态同时互联网公司也更难以收集和利用用户的隐私数据。 数据孤岛现象不仅不会消失反而会成为新的常态甚至它不仅存在于不同公司和组织之间在大型集团内部也存在。未来我们必须面对这样的现状如果我们想更好的利用数据用大数据和AI做更多有意义的事情就必须在不同组织之间、公司与用户之间进行数据共享但这个共享需要满足隐私保护和数据安全的前提。 隐私泄漏和数据滥用如同达摩克利斯之剑悬在各个公司和组织头上因此解决数据孤岛成为AI行业需要解决的首要问题之一。 如何解决数据孤岛问题 当前业界解决隐私泄露和数据滥用的数据共享技术路线主要有两条。一条是基于硬件可信执行环境TEE Trusted Execution Environment技术的可信计算另一条是基于密码学的多方安全计算MPCMulti-party Computation。 TEE字面意思是可信执行环境核心概念为以第三方硬件为载体数据在由硬件创建的可信执行环境中进行共享。这方面以Intel的SGX技术AMD的SEV技术ARM的Trust Zone技术等为代表。TEE方案的大致原理如下图所示 目前在生产环境可用的TEE技术比较成熟的基本只有Intel的SGX技术基于SGX技术的各种应用也是目前业界的热门方向微软、谷歌等公司在这个方向上都有所投入。 SGXSoftware Guard Extensions 是Intel提供的一套软件保护方案。SGX通过提供一系列CPU指令码允许用户代码创建具有高访问权限的私有内存区域Enclave - 飞地包括OSVMMBIOSSMM均无法私自访问EnclaveEnclave中的数据只有在CPU计算时通过CPU上的硬件进行解密。同时Intel还提供了一套远程认证机制Remote Attestation通过这套机制用户可以在远程确认跑在Enclave中的代码是否符合预期。 MPCMulti-party Computation多方安全计算一直是学术界比较火的话题但在工业界的存在感较弱之前都是一些创业小公司在这个方向上有一些探索例如SharemindPrivitar直到谷歌提出了基于MPC的在个人终端设备的“联邦学习” (Federated Learning的概念使得MPC技术一夜之间在工业界火了起来。MPC方案的大致原理如下图所示 目前在MPC领域主要用到的是技术是混淆电路Garbled Circuit、秘密分享Secret Sharing和同态加密Homomorphic Encryption。 混淆电路是图灵奖得主姚期智教授在80年代提出的一个方法。其原理是任意函数最后在计算机语言内部都是由加法器、乘法器、移位器、选择器等电路表示而这些电路最后都可以仅由AND和XOR两种逻辑门组成。一个门电路其实就是一个真值表假设我们把门电路的输入输出都使用不同的密钥加密设计一个加密后的真值表这个门从控制流的角度来看还是一样的但是输入输出信息都获得了保护。 秘密分享的基本原理是将每个数字随机拆散成多个数并分发到多个参与方那里。然后每个参与方拿到的都是原始数据的一部分一个或少数几个参与方无法还原出原始数据只有大家把各自的数据凑在一起时才能还原真实数据。 同态加密是一种特殊的加密方法允许对密文进行处理得到仍然是加密的结果即对密文直接进行处理跟对明文进行处理后再对处理结果加密得到的结果相同。同态性来自抽象代数领域的概念同态加密则是它的一个应用。 当前业界针对数据共享场景利用上面的技术路线推出了一些解决方案包括隐私保护机器学习PPML、联邦学习、竞合学习、可信机器学习等但这些方案只利用了其中的一部分技术从而只适合部分场景同时基本处于学术研究阶段没有在生产环境落地。 共享机器学习蚂蚁金服数据孤岛解决方案 为了更好的应对形势变化解决数据共享需求与隐私泄露和数据滥用之间的矛盾蚂蚁金服提出了希望通过技术手段确保多方在使用数据共享学习的同时能做到用户隐私不会被泄露数据使用行为可控我们称之为共享机器学习Shared Machine Learning。 共享机器学习的定义在多方参与且各数据提供方与平台方互不信任的场景下能够聚合多方信息并保护参与方数据隐私的学习范式。 从17年开始蚂蚁金服就一直在共享机器学习方向进行探索和研究在结合了TEE与MPC两条路线的同时结合蚂蚁的自身业务场景特性聚焦于在金融行业的应用。 蚂蚁金服共享机器学习方案拥有如下特性 • 多种安全计算引擎整合可基于不同业务场景来选择合适的安全技术。既有基于TEE的集中式解决方案也有基于MPC的分布式解决方案既可满足数据水平切分的场景也能解决数据垂直切分的诉求既可以做模型训练也可以做模型预测。 • 支持多种机器学习算法以及各种数据预处理算子。支持的算法包括但不限于LRGBDTXgboostDNNCNNRNNGNN等。 • 大规模集群化。支持大规模集群化提供金融级的高效、稳定、系统化的支撑。 基于数年沉淀与积累目前共享机器学习技术已在银行、保险、商户等行业成功落地诸多场景业务。通过在业务中打磨出的金融级共享机器学习能力沉淀下来一套数据共享场景的通用解决方案未来会逐步对外开放。 在几年的艰苦研发中共享学习累积专利50余项。在2019中国人工智能峰会上共享机器学习获得“紫金产品创新奖”在8月16日的全球人工智能创业者大会上获得“应用案例示范奖”。 下面我们将分享基于上面两种路线的共享机器学习实践细节。 基于TEE的共享学习 蚂蚁共享学习底层使用Intel的SGX技术并可兼容其它TEE实现。目前基于SGX的共享学习已支持集群化的模型在线预测和离线训练。 1.模型在线预测 预测通常是在线服务。相对于离线训练在线预测在算法复杂度上面会相对简单但是对稳定性的要求会更高。 提升在线服务稳定性的关健技术之一就是集群化的实现——通过集群化解决负载均衡故障转移动态扩容等稳定性问题。 但由于SGX技术本身的特殊性传统的集群化方案在SGX上无法工作。 为此我们设计了如下分布式在线服务基本框架 该框架与传统分布式框架不同的地方在于每个服务启动时会到集群管理中心ClusterManager简称CM进行注册并维持心跳CM发现有多个代码相同的Enclave进行了注册后会通知这些Enclave进行密钥同步Enclave收到通知后会通过远程认证相互确认身份。当确认彼此的Enclave签名完全相同时会通过安全通道协商并同步密钥。 该框架具备如下特性 • 通过集群化方案解决了在线服务的负载均衡故障转移动态扩缩容机房灾备等问题 • 通过多集群管理和SDK心跳机制解决代码升级灰度发布发布回滚等问题 • 通过ServiceProvider内置技术配合SDK降低了用户的接入成本 • 通过提供易用性的开发框架使得用户在开发业务逻辑时完全不需要关心分布式化的逻辑 • 通过提供Provision代理机制确保SGX机器不需要连接外网提升了系统安全性。 目前在这套框架之上已经支持包括LR、GBDT、Xgboost等多种常用的预测算法支持单方或多方数据加密融合后的预测。基于已有框架也可以很容易的扩展到其它算法。 2.模型离线训练 模型训练阶段除了基于自研的训练框架支持了LR和GBDT的训练外我们还借助于LibOs Occlum和自研的分布式组网系统成功将原生Xgboost移植到SGX内并支持多方数据融合和分布式训练。通过上述方案不仅可以减少大量的重复性开发工作并且在Xgboost社区有了新的功能更新后可以在SGX内直接复用新功能无需额外开发。目前我们正在利用这套方案进行TensorFlow框架的迁移。 此外针对SGX当下诟病的128M内存限制问题超过128M会触发换页操作导致性能大幅下降我们通过算法优化和分布式化等技术大大降低内存限制对性能的影响。 基于TEE的多方数据共享学习训练流程如下 机构用户从Data Lab下载加密工具使用加密工具对数据进行加密加密工具内嵌了RA流程确保加密信息只会在指定的Enclave中被解密用户把加密数据上传到云端存储用户在Data Lab的训练平台进行训练任务的构建训练平台将训练任务下发到训练引擎训练引擎启动训练相关的Enclave并从云端存储读取加密数据完成指定的训练任务。采用该方式进行数据共享和机器学习参与方可以保证上传的数据都经过加密并通过形式化验证保证加密的安全性。 基于MPC的共享学习 蚂蚁基于MPC的共享学习框架分为三层 • 安全技术层安全技术层提供基础的安全技术实现比如在前面提到的秘密分享、同态加密、混淆电路另外还有一些跟安全密切相关的例如差分隐私技术、DH算法等等 • 基础算子层在安全技术层基础上我们会做一些基础算子的封装包括多方数据安全求交、矩阵加法、矩阵乘法以及在多方场景下计算sigmoid函数、ReLU函数等等同一个算子可能会有多种实现方案用以适应不同的场景需求同时保持接口一致 • 安全机器学习算法有了基础算子就可以很方便的进行安全机器学习算法的开发这里的技术难点在于如何尽量复用已有算法和已有框架我们在这里做了一些有益的尝试但也遇到了很大的挑战。 目前我们这套基于MPC的共享学习框架已支持了包括LR、GBDT、GNN等头部算法后续一方面会继续根据业务需求补充更多的算法同时也会为各种算子提供更多的技术实现方案以应对不同的业务场景。 基于MPC的多方数据共享学习训练流程如下 如图所示训练步骤为 机构用户从Data Lab下载训练服务并本地部署用户在Data Lab的训练平台上进行训练任务的构建训练平台将训练任务下发给训练引擎训练引擎将任务下发给机构端的训练服务器WorkerWorker加载本地数据Worker之间根据下发的训练任务通过多方安全协议交互完成训练任务 训练引擎的具体架构如下 其中Coordinator部署于蚂蚁平台用于任务的控制和协调本身并不参与实际运算。Worker部署在参与多方安全计算的机构基于安全多方协议进行实际的交互计算。 用户在建模平台构建好的训练任务流会下发给Coordinator的Task Flow ManagerTask Flow Manager会把任务进行拆解通过Task Manager把具体算法下发给Worker端的Task ExecutorTask Executor根据算法图调用Worker上的安全算子完成实际的运算。 利用这套方法可以做到数据不出域就可以完成数据共享训练工具可以部署在本地的服务器。 共享学习 VS. 联邦学习 目前国内对于数据共享场景的机器学习解决方案比较熟悉的可能是由谷歌提出的联邦学习概念。 经过我们的了解其实联邦学习目前涉及两个不同的概念 • 第一种联邦学习旨在解决云 端的训练过程中端上的隐私不要被暴露的问题是一个To C 数据水平切分的场景。除了保护端上的数据隐私外其重点还在于如何解决训练过程中端自身可能掉线等问题。 • 第二种联邦学习则主要用于解决To B场景中各方隐私不泄露的问题即可以应用于数据的水平切分场景也可以应用于数据垂直切分的场景。 它们侧重于不同的数据共享场景采用不同的技术相比之下蚂蚁金服的共享学习兼容多种安全计算技术并且支持多种机器学习算法和使用场景。 除此之外共享学习和联邦学习的差异在于 联邦学习只解决数据不出域的情况这就限制了其可以使用的技术只有严格的MPC算法才符合这个要求而共享学习目前基于TEE的集中式共享学习技术是联邦学习没有涉及的联邦学习讲究的是参与各方的“身份和地位”的相同所以叫联邦而共享学习则不强调各共享方的地位对等在很多场景下不同的参与方是拥有不同的角色的。 目前数据共享下的机器学习仍然还有很多可突破的地方这些不同只是对当前状态的一个比较希望大家能对共享学习有更好的理解。 未来展望 让数据孤岛在安全环境下进行连接、合作、共创、赋能是蚂蚁金服共享机器学习的核心使命。 共享机器学习作为一个安全与AI的交叉学科正在越来越受到关注尤其是在金融行业有着广阔的应用空间。但是这个领域的各项技术也远未到成熟的阶段。我们团队经过两年的摸索也只是取得了阶段性的一些成果在算法的计算性能以及支持算法的多样性等各个方面还有一段路要走。 9月27日杭州云栖大会蚂蚁金服将向外界首次分享共享学习的理念和实践欢迎届时关注。后续我们也会分享更多共享学习方面的研究进展及实践经验 欢迎业界同仁交流探讨共同探索更多更强的数据孤岛解决方案推进数据共享下的机器学习在更多场景下落地。 原文链接 本文为云栖社区原创内容未经允许不得转载。
http://www.yutouwan.com/news/199497/

相关文章:

  • dedecms制作网站教程智能模板网站建设工具
  • 网站开发侵权前端和后端哪个难
  • 网站开发环境实验报告有设计感的网页设计
  • 遵义网站建设安卓神级系统优化工具
  • 免费网站封装app胶州网站建设电话
  • 泰安可信的网站建设广州市 优化推广
  • 网站建设欣wordpress积分墙
  • 中国建设银行官方网站首页做网站东莞选哪家公司好
  • 创业网站搭建设计方案网站建设招聘启事
  • wordpress 手机网站支付宝网站后台难做吗
  • 二合一收款码免费制作网站中华室内设计网官网
  • 河南广宇建设集团有限公司网站wordpress卡死了
  • 网站开发技术课程设计报告商务网站开发考题
  • 网站域名续费怎么做有没有专业做二手老车的网站
  • 贵阳网站建设-中国互联中移建设 网站
  • 网站配置支付宝国内返利网站怎么做
  • 广元专业高端网站建设四川建设人才考试官网
  • 牛商网做的网站有哪些做网站高亮
  • 金融网站织梦模板小企业销售管理软件
  • 网站建设怎么入会计账电商培训方案
  • 用电脑做兼职的网站自己做网站教学视频教程
  • 南宁网站建设蓝云品牌广告设计制作公司网站源码
  • 网站上传照片失败建站之星网站空间根目录
  • 做网站 做好把我踢开搭建网站的空间哪里买
  • 数据库网站建设方案服装设计以及网页设计素材
  • 三门峡做网站推广怎么做轴承网站
  • 安 网站建设网络营销学校
  • 洛阳网站建设培训什么叫做电商
  • 酒厂网站源码17网站一起做网店
  • 网站改版的原因wordpress 文本 点不了