甜品网站模板代码,wordpress的菜单静态,宣城建设网站,wordpress canvas来源#xff1a;世界科学概要#xff1a;社交媒体拥有数以亿计的用户#xff0c;他们每年发布数以千亿计的微博和帖子#xff0c;这将社会科学推向了大数据时代。人工智能“知道”星系应该是什么样的#xff0c;它把一张模糊的图像#xff08;左#xff09;变成了一张清… 来源世界科学概要社交媒体拥有数以亿计的用户他们每年发布数以千亿计的微博和帖子这将社会科学推向了大数据时代。人工智能“知道”星系应该是什么样的它把一张模糊的图像左变成了一张清晰的图像右 AI可以通过你的智能手机与你对话可以在无人驾驶汽车里上路行驶心怀疑虑的未来主义者担心AI的飞速发展将有可能导致大规模失业但对于科学家来说AI前景是光明的它将加速科学发现的进程。算法如何分析大众情绪社交媒体拥有数以亿计的用户他们每年发布数以千亿计的微博和帖子这将社会科学推向了大数据时代。心理学家马丁•塞利格曼Martin Seligman认识到社交媒体提供了一个前所未有的机会——利用人工智能从大众沟通中提取意义。在宾夕法尼亚大学积极心理学研究中心塞利格曼和20多位心理学家、医生和计算机科学家投身于世界福祉项目利用机器学习和自然语言处理技术大量筛选数据以期衡量公众的情绪和身体健康状况。从传统上来讲这些都是通过调查完成的。但塞利格曼说“社交媒体数据并不引人瞩目非常廉价而且所获数据的数量级也更大。”社交媒体上的数据是凌乱的但是人工智能可以提供一种揭示其中模式的高效方法。在最近的一项研究中塞利格曼及同事研究了29000名用户在脸谱网上更新的内容他们对于是否患有抑郁症进行了自我评估。研究人员利用其中28000名用户的数据资料通过机器学习算法发现用户用词和抑郁程度存在关联。这样一来仅仅根据更新内容这种算法就可以成功地判定出其余用户的抑郁程度。在另一项研究中研究小组分析了1.48亿篇微博以预测一个县城中的心脏病致死率。结果证明跟愤怒和消极关系有关的话语成为危险指标。相较于根据吸烟、糖尿病等10个主要危险指标进行的预测通过社交媒体进行的预测与实际死亡率更加接近。除此之外研究人员还利用社交媒体来预测人的性格、收入和政治思想意识并研究医院护理、神秘经历和刻板印象等情况。通过推特的数据研究人员甚至创建了一张地图用不同颜色描绘了美国每个县居民的幸福感、抑郁度、信任度和五种人格特质。德克萨斯大学奥斯汀分校的社会心理学家詹姆斯•潘尼贝克James Pennebaker说“语言分析与心理学的联系正在发生一场革命。”潘尼贝克注重的不是内容而是风格。例如他发现可以根据大学招生考试的文章中所使用的功能词来预测成绩。冠词和介词的使用体现了分析思维能力可以预测其成绩会较高代词和副词的使用体现了叙事思维能力可以预测其成绩会较低。此外潘尼贝克发现的证据表明1728年的剧本《双重背叛》Double Falsehood中的大部分内容可能是由威廉•莎士比亚撰写的根据认知复杂性和罕见词等因素机器学习算法认定该剧本与莎士比亚的其他作品一致。潘尼贝克称“现在我们可以分析一个人曾经撰写和发布过的所有内容并且逐渐分析你和他人的谈话方式。结果就是我们可以越来越详细地描绘出大家到底是什么样的人。”通过基因组搜寻自闭症的根源对于遗传学家来说自闭症是一个棘手的问题而遗传模式表明自闭症具有很强的遗传因素。但是对自闭症有影响的数十种已知基因的变体只能解释所有病例的大约20。要想找到可影响自闭症的其他变体就需要在25 000个其他人类基因及其周围DNA的相关数据中寻找线索——这是人类研究者难以招架的任务。因此普林斯顿大学的计算生物学家奥尔加•特洛伊安斯卡亚Olga Troyanskaya和纽约市西蒙斯基金会引入了人工智能工具。纽约基因组中心创始人、洛克菲勒大学医学科学家罗伯特•达内尔Robert Darnell解释说“我们所能做的就是像生物学家一样揭示自闭症等疾病是由什么引起的。在某个方面当一个科学家提出10个问题时机器却有能力提出1万亿个问题机器将改变整个游戏规则。”特洛伊安斯卡亚整合了数百个数据集这些数据集包含了哪些基因在特定的人类细胞中表现出活性、蛋白质之间是如何发生相互作用、转录因子结合位点以及其他关键基因组特征所在之处的描述。然后特洛伊安斯卡亚及其研究小组利用机器学习创建了一份基因相互作用的图谱并将少数已经熟知的自闭症风险基因与数千个其他未知基因进行对比试图寻找其中的类似之处。2016年他们在《自然-神经科学》上发文说对比表明另外2500个基因可能跟自闭症有关。然而就像最近遗传学家才认识到的那样——基因并不是单独起作用的基因的行为是由附近数百万个非编码碱基决定的而非编码碱基与DNA结合蛋白以及跟其他因子发生相互作用。与寻找这些基因相比识别哪些非编码变体可能会影响到附近的自闭症基因是个更加困难的问题。在普林斯顿大学特洛伊安斯克亚的实验室里有位名叫周健Jian Zhou的研究生正在利用人工智能解决这个问题。为了训练这个深度学习系统周健为这个系统引入了DNA元素百科全书和人类表观基因组学收集的数据这两个项目记录了数万个非编码DNA位点是如何影响附近基因的。在评估非编码DNA未知片段上潜在的活动时该系统实际上学会了如何确定应寻找的特征。2015年10月当周健和特洛伊安斯克亚在《自然-方法学》上描述他们这个被称为DeepSEA的计划时加州大学尔湾分校的计算机科学家谢晓辉Xiaohui Xie将其称为“把深度学习应用到基因组学的里程碑”。目前普林斯顿大学的研究团队正在利用DeepSEA计划对自闭症患者的基因组进行分析希望能够对非编码碱基带来的影响进行排序。同样谢晓辉也正在利用人工智能处理基因组但他关注的范围不仅仅是自闭症他更希望根据突变的危害程度对其进行分类。但是谢晓辉警告说在基因组学中深度学习系统只有在受过训练的领域才能像数据集那样有效。他说“在我看来当前人们会质疑这种系统在分析基因组方面的可靠性。但是将来越来越多的人会接受深度学习。”能够理解太空的机器2017年4月天体物理学家凯文•沙文斯基Kevin Schawinski在推特上发布了4个星系的模糊图片并随图附上了一个请求希望同行的天文学家能够帮助他进行分类。同行们意见一致这些图像看起来像椭圆和螺旋结构属于熟悉的星系类型。但一些天文学家仍心存疑虑因为沙文斯基是有头脑的所以他们直截了当地问道这些是真正的星系吗它们是利用相关物理学原理在电脑上模拟出来的模拟星系吗沙文斯基回答说其实两者都不是。在瑞士苏黎世联邦理工学院沙文斯基、计算机科学家张策Ce Zhang及其合作人员在一个神经网络中模拟了这些星系该神经网络对物理学原理一无所知似乎只是帮助我们理解在深层次观察中星系看起来应该是什么样的。沙文斯基只不过是想利用在推特上发布的帖子来看看神经网络创造的星系在多大程度上是可信的但是他更远大的目标是开创一项技术能够像电影中那样将模糊的观测图像奇迹般地清晰化——神经网络能够使模糊的星系图像看起来更加清晰就好像是用较为高级的望远镜拍摄的。这样天文学家们就能够从大量的观察中得到更为精确的细节画面。沙文斯基说“在巡天工程中我们花费了数亿甚至是数十亿美元的资金。从某种程度上说一旦有了这项技术我们即刻就能提取更多的信息。”沙文斯基在推特网上发布的星系图像是生成对抗性网络的作品该网络是一种机器学习模型包括两个互相对抗的神经网络其中一个网络是可以创造图像的生成器另一个是可以挑出瑕疵、去除伪造成分的鉴别器它可以形成优化的生成器。沙文斯基的研究小组拍摄了数千张真实的星系图像然后人为分解它们。接着研究人员训练生成器拼接图像使它们具有鉴别器的功能。最终神经网络会胜过其他技术成为消除星系图像杂乱成分最好的技术。伊利诺伊州巴达维亚地区费米国家加速器实验室的天体物理学家布莱恩•诺德Brian Nord说沙文斯基的方法是机器学习在天文学领域一个特别前卫的例子但并非绝无仅有。2017年1月在美国天文学会的一次会议上诺德提出了一种机器学习策略用来搜寻强效引力透镜——遥远星系的图像在通往地球的过程中经过扭曲的时空时会在太空中形成罕见的光弧。这些引力透镜可用于测量宇宙间天体的距离并发现肉眼看不见的质量密度。强效引力透镜的视觉效果十分独特但难以利用简单的数学规则描述——利用传统的计算机很难分辨出来但是对于人类来讲却相对容易分辨。诺德和其他科学家意识到利用数千个透镜对神经网络进行培训之后神经网络就可以获得类似人类的直觉。诺德称“实际上在接下来的几个月里我们撰写了十几篇论文都是研究应用机器学习搜寻强效引力透镜的这是一件激动人心的事情。”在整个天文学领域这只是冰山一角。天文学家越来越认识到人工智能提供了一个强有力的工具可以利用PB级数据发现有趣的天体并对其进行分类。沙文斯基称“人人都在惊呼‘天哪我们拥有的数据太多啦’我认为在大数据时代利用人工智能终将会有真正的发现。”神经网络学习化学合成的艺术有机化学家善于反向思维。类似于烹饪大师先从看到成品菜肴开始然后再研究如何烹制……许多化学家都是从他们想要制造的分子的最终结构开始思考如何组装它。德国明斯特大学的研究生马尔文•塞格勒Marwin Segler说“要想知道如何合成分子你所需要的只是合适的成分和方法。”目前塞格勒和其他研究人员正在将人工智能引进他们的分子实验室。研究人员希望人工智能能够帮助他们应对分子制造过程中的一个关键挑战从数百个潜在的构建材料和数千个相关的化学规则中做出最合适的选择。几十年来一些化学家利用已知的化学反应煞费苦心地为计算机编程希望创建一个能够快速计算出最灵敏的分子合成法的系统。然而塞格勒说“化学可能是非常微妙的很难以二进制的方式写下所有的规则。”因此塞格勒、明斯特大学计算机科学家迈克•普罗伊斯Mike Preuss和塞格勒的顾问马克•沃勒Mark Waller将目光转向了人工智能。他们没有利用化学反应的严格规则进行编程而是设计了一个深度学习的神经网络程序。通过数以百万计的化学反应实例该程序能够自行学习反应是如何进行的。塞格勒称“你提供的数据越多效果就越好。”随着时间的推移这个神经网络学会了如何预测化学合成过程中目标分子的最佳反应。它从零开始最终拿出了自己的分子制造方案。这3位研究人员测试了40种不同的目标分子并与传统的分子设计程序进行对比。根据2017年研究人员在一次会议上的报告在两个小时的计算时间内传统程序完成了22.5%目标分子的合成方案而人工智能程序则完成了95%的合成方案。塞格勒不久将要前往伦敦的一家制药公司工作他希望通过这个方法改进医药的生产过程。加州帕洛阿尔托市斯坦福大学的有机化学家保罗•温德Paul Wender认为现在判断塞格勒的方法是否有效还为时尚早。然而温德也正在将人工智能应用到有机化学合成他认为不仅在合成已知分子方面而且在寻找制造新分子的方法方面人工智能都可能会产生深远影响。塞格勒接着说人工智能不会很快取代有机化学家因为化学家们所做的远远不只是预测反应将会如何进行。就化学来说人工智能就像GPS定位系统它可能适于寻找合成的路线途径但它本身却不能自行设计和执行整个合成过程。当然人工智能开发人员也已经着眼于完成其他任务了。