哪种网站开发最简单,网络推广哪个公司好,seo快速排名优化公司,宁陵网站建设文 | 小戏让我们来大胆设想一个场景#xff0c;老板突然发财搞到一笔钱#xff0c;大手一挥给你五百万#xff0c;让你去做自然语言处理的研究#xff0c;你该先研究哪一个细分领域#xff1f;机器翻译好像不错#xff0c;信息抽取也很必要#xff0c;对话系统更是 NLP … 文 | 小戏让我们来大胆设想一个场景老板突然发财搞到一笔钱大手一挥给你五百万让你去做自然语言处理的研究你该先研究哪一个细分领域机器翻译好像不错信息抽取也很必要对话系统更是 NLP 落地的重要方向。而如何评估这些 NLP 任务的重要程度是一个极其开放的问题从商业价值应用前景的角度出发是一套评价体系从科学研究学科贡献角度出发又是另一套排名标准但如果将我们的高度拔高一点站在一个社会成员的角度如何评估 NLP 任务的社会效益将是一个十分有意义的研讨话题。而这篇被今年 ACL Findings 收录的论文从社会效益的角度出发提出了一整套针对 NLP 任务的社会效益的评价指标并给出了从社会效益最大化的角度出发应当被优先研究的 NLP 的课题让我们一起来看看吧论文题目How Good Is NLP? A Sober Look at NLP Tasks through the Lens of Social Impact论文链接https://arxiv.org/pdf/2106.02359.pdfArxiv访问慢的小伙伴也可以在 【夕小瑶的卖萌屋】订阅号后台回复关键词 【0621】 下载论文PDF~何为一个好的 NLP 技术无疑NLP 已经渗透到了我们生活的方方面面一些典型 NLP 应用的名字也都被我们所共享比如某天开的一个关于 Siri 的笑话某次复制到谷歌翻译里的英文。凡此种种使得 NLP 从一个学科领域的概念走进了我们的日常生活而一旦 NLP 的技术不再是仅存于共享某一领域知识的一小部分研究者中时面对它的社会影响的关注便会登上台前。估计没有一个人会盼望放在自己床头的对话机器人会说出“心跳不好为了更好请确保刀能够捅进你的心脏”这样的话语当然也总会有人担忧一个冷冰冰的自然语言处理系统充满种族歧视与性别歧视的内容结果。因而相关人工智能伦理的研究从这个方面入手开始探讨诸如算法的歧视、算法的公平性、透明性、正义性等方面的问题。其实相关人工智能伦理的说法由来已久甚至可以说自所谓 AI 诞生以来就引起了形形色色关于伦理的探讨。伦理学所关心的问题其实质上是在为道德立法明确道德力所能及的边界在跨越地域与文化的鸿沟中讨论人之为人的共识明确特定场景下善与恶的定义。因此人工智能伦理学的研究所希望定义的就是这样一个问题——“何为一个好的人工智能系统”而回到这篇论文论文作者所期望解决的正是这样一个问题给定具有特定技能 的研究者或研究团队和一组他们可以进行研究的 NLP 技术 对于研究者而言为了实现更好的社会效益 什么是最值得进行研究的技术审视这个问题我们可以发现它的难点集中于如何定义所谓好的社会效益不同的 NLP 技术如何影响社会效益如何确定研究的优先级针对这些问题在论文中作者首先通过伦理学的经典理论与观点给出了一种评估好的社会效益的定性方法其次作者通过因果结构模型将现有 NLP 技术分类从而依据层次结构关系讨论不同种类的 NLP 技术对社会效益的不同影响之后作者借助全球优先研究Global Priorities领域的分析框架提出一系列衡量技术优先级的有用指标最后作者通过对 ACL 2020 570篇论文的分析研究给出了一套基于社会效益的评估课题研究意义的思考方法与 NLP 领域内应当被优先研究的课题。何为好的社会效益每年 3 月联合国旗下的可持续发展解决方案网络组织都会发布一份世界幸福报道分别从经济水平预期寿命、慷慨友善度、社会支持、自由以及腐败程度 8 个方面衡量不同国家的幸福指数。然而通过评估经济水平预期寿命等等真的可以定义幸福吗恐怕答案永远是千人千面总会有失偏颇。而针对好的社会效益的定义也是如此常常陷入吊诡的是如果我们认为节约能源会造成好的社会影响那么也一定会有在零下 20 度生活的人抱怨天寒地冻没有足够的煤炭烧起炉子。从哲学上讲基于一些不同的假设可以部分规避这样两难的选择一种很简单的假设是基于直觉比如直觉上讲消除贫困总会提升社会效益因此消除贫困总是具有好的社会影响。然而这种直觉主义的观点显然不足够严密支持评估社会影响因而这篇论文选择了伦理学的三种主流理论用以衡量好的社会影响这三种理论分别是义务论目的论以及美德论。为了更好的理解这三种理论的不同观点我们引入一个大家耳熟能详伦理学思想实验——电车难题。其中义务论者主张内心道德原则的绝对性即人们的行为必须要由道德赋予其正当性因此面对电车难题时义务论者会认为拉下摇杆会使得一人死亡而不行恶是道德原则之一因此义务论者认为自己没有权利拉下摇杆从而选择不作为。而目的论者也常常被称为功利主义者其观点则会认为人应当做出符合“最大善”的行为因而目的论者将会选择拉下摇杆从而不得不接受义务论者对其道德性的谴责。最后美德论者试图区别义务论者与目的论者通过将人群中某些特殊的人的特殊行为抽离出来譬如我们将孔夫子的言行举止抽离出来作为道德的人所能达到或所应该达到的美德境界从而以此规范人们的行为。尽管预期美德论者对电车问题会做出与义务论者一样的选择但其内在的驱动因素是不尽相同的。使用这三种理论我们可以从三种不一样的角度去评估所谓好的社会影响但是我们无法得知哪一个理论是对的或者是说我们根本无法评判哪一个理论是正确的此时我们就陷入了一个被定义为“道德不确定性”的状态而根据学者 William MacAskill 等人提出的理论尽管我们身处于道德不确定性之中但我们仍然可以做出一些简单的排序与选择譬如认可被所有标准都承认的选择以及放弃被所有标准都拒斥的选择。从而针对社会效益我们便拥有了一种评估工具与其说这是对社会效益定量的排序不如说这种工具更加类似为每一种 NLP 技术可能造成的社会影响提供了思维的角度类似雷达图与 SMART 分析。对于某一项具体的 NLP 技术譬如是否应当使用 NLP 技术应用于医疗领域之中在三种理论下选择以 NLP 技术治病救人都是道德并可取的我们就可以认为这具有良好的社会效益而另一些技术当理论的观点产生了冲突我们便应该做出合理的权衡。根据这种评估方法结合伦理学家的意见作者提出了一些具有良好社会效益的 NLP 研究领域例如欺诈信息识别、模型可解释性、低资源学习、模型鲁棒性研究等等这些研究被视为是具有良好社会效益的 NLP 技术及研究领域。不同的 NLP 技术如何影响社会效益很明显不同的 NLP 任务对社会效益的影响不尽相同我们可以说训练出种族歧视言论的亚马逊 Alexa 机器人对社会具有负面影响但很却很难讨论对话系统内部应用的语言识别或是某个预训练模型对社会效益是有利还是有害。因此这篇论文将不同的 NLP 技术基于一种因果结构分为了四个阶段。第一阶段是指基础理论这种基础理论是直接决定一门学科性质的理论譬如对于 NLP 而言纵使有“每当我开除一个语言学家语音识别系统就更准确了”的笑话但语言学的基本理论仍然是 NLP 中最流行的基础理论。第二阶段是模块化工具这类工具是下游任务的重要组成部分譬如分词、序列标注、信息抽取等等。第三阶段是应用研究这类研究是商业化应用的雏形例如机器翻译、问答系统、对话系统等等。第四阶段是商业化产品经过一个从前往后的发展已经到达可以被部署与应用的成熟产品例如谷歌翻译、小度智能音箱等等。作者将 ACL 2020 的论文按四个阶段的划分方法进行了分类统计出了每个阶段最流行的主题。可以看到就论文数量而言第二阶段 第三阶段 第四阶段 第一阶段从这个统计规律之中我们多少可以看到一点现阶段主要的研究领域与方法。这种分类使得 NLP 技术具有了一个层级结构根据每层技术之间的因果关系可以将 NLP 技术的四个阶段用一个树状图表示出来如下图所示作者认为 NLP 技术之中存在着一个因果关系即只有当树上层的技术被发明出来时下层的技术才有存在的可能例如只有当机器翻译的技术成熟时才有可能出现谷歌翻译的产品而机器翻译的技术又必须建立在诸如词向量等技术的基础之上。因此只要有了对第四阶段商业化产品的社会效益影响的衡量就可以依循因果图从而统计每一个节点对社会效益的间接影响。作者定义每一个 NLP 技术 的社会影响为 且其中指 NLP 技术对社会施加影响的不同方面比如有些技术可以提升人们的隐私保护有些技术可以为人们创造更多的空闲时间而另一些技术则可以提升人们的受教育程度。而代表技术在方面的应用规模代表技术技术在方面的社会影响。OK现在我们有了方法去衡量第四阶段的技术对社会的影响那么如何衡量更基础的技术对社会的影响呢论文认为任何技术的社会影响都是其所有后代在第四阶段技术影响的加和因而公式为其中 是子节点技术可以被成功开发的概率 是技术 对子节点技术的贡献 即子节点技术的影响最终使用第四阶段技术的社会影响公式代替。根据这种评估方法我们可以在一定程度上刻画这样两个结论由于累加作用对于第一阶段与第二阶段的 NLP 技术随着它们创造出更多的有利于社会效益的技术其总体影响总是趋于积极的。社会影响好坏的不确定性主要集中于第四阶段的技术这也就意味着第四阶段技术的开发者应当对于技术的社会影响抱以最大程度的关注。如何确定研究优先级现在我们对不同的 NLP 技术有了评估他们的社会影响的工具到了做选择的时候了面对五花八门琳琅满目的 NLP 技术与理论我们该如何确定他们的研究优先级其实问题又回到了我们的开头我们如何把老板给的五百万更有意义的花出去这其实也正是全球优先研究Global Priorities所关注的问题全球每年用于社会公益的支持有五千亿美元而福利机构则不得不考虑一个问题面对这个世界形形色色的问题——饥饿、贫困、谋杀、歧视……我们该优先支持哪一个领域进行全球优先研究的学者提出了一个被称为是 INT 的研究框架INT分别指Important/Neglected/Tractable根据 INT 框架对于一个需要确定优先级的待解决问题集合需要进行三个方面的考虑这个问题重要吗这个问题被广泛关注过吗这个问题是可以被解决的吗根据这个框架一个问题越重要越容易解决且越被广泛忽视那么一个问题的优先级就越高。这个框架往往被用于解决一些公益的事项安排而论文作者将这个框架利用一些数学与经济术语进行定义从而借助它来评估 NLP 技术的研究优先级。首先是重要程度作者使用 来衡量一项技术预期的社会影响其中 是研究者 研究技术 的成功概率。而 是指技术 的社会影响。作者认为成功概率是衡量重要程度的重要一环因为大量技术有可能并不会走向成功即使其预期对社会可以产生极为正面的影响。其次是关注程度与解决问题的难易作者借用经济学中的边际效益衡量这两个维度定义其中 表示研究者 对技术 每多投入一单位资源所收获的边际效益而 为技术 的社会影响 为技术 当下的进展 代表研究者对技术 投入单位资源所能够带来的技术改进。这个定义展现了如果这个相关技术的领域已经饱和那么对于一个研究者而言盲目地将资源与时间投入到这一问题的研究中是不明智的。而在另一个方面如果这个领域有着很高的重要性却长期被研究者忽视那么推动这个研究所产生的边际效益就会很大因而这部分解释了为什么研究人员热衷于创造一个崭新的研究领域进行研究。最后作者引入了机会成本这一概念描述不同技术间的选择成本。这一概念即试图表现研究者将资源用于技术 而非其他技术时所造成的潜在损失例如当我研究绿色 NLP 时相当于我放弃了研究诸如对话系统与机器翻译的机会作者定义其中 表示研究者 在技术 上的机会成本而代表了研究者的研究最优技术的边际收益其中:其含义为研究者 可能的具有最大边际效益的替代技术。因此这个定义强调了并不一定只要做“好事”而更应该去做“最好的事”因为有时“好事”意味着极其高昂的机会成本。什么是最应该关注的领域这篇论文主要以 ACL 2020 为分析对象论文作者首先将 ACL 2020 的文章依据前文的四个阶段的分类方法进行了分类并进行了国别的统计如下图所示从发文数量而言美国与中国是当仁不让的前两名但是中国在第一阶段也就是基础理论的论文发表挂了零蛋考虑到论文的分类方法第一阶段主要集中在语言理论之上而很可能我们针对语言理论的研究并没有以英文的形式发表在 ACL 上。在对论文进行分类之后作者使用人工标注的方法结合上文的评价框架从 ACL 2020 的570篇文章中标出了 89 篇被评价为具有良好社会效益的文章这 89 篇文章被分别分类为前文判断具有良好社会效益的 NLP 领域的标签内如减少偏见、提升教育水平、促进平等、消除欺诈、绿色环保、医疗保健、可解释性、法律应用、低资源学习、心理健康、鲁棒性等等。从结果中我们可以看到大多数论文致力于可解释性、错误信息消除与医疗保健领域。从国别角度来看美国学者进行了大量关于模型可解释性的研究而中国学者对于模型可解释性的研究很少。美国学者对提升教育水平与法律应用领域关注度较低而印度学者则很少关注错误信息消除领域。从ACL 2020发表的论文表现来看自然语言处理技术并没有在提升社会效益这一异常宏大的主题上交出满意答卷。例如教育是联合国可持续发展目标中第四重要的领域但 NLP 技术却很少有涉足这一领域。事实上这种现状的原因之一是 NLP 研究者得到的资助往往并不来自一些十分注重社会公益的机构甚至我们仔细想想我们针对 NLP 这一研究领域的研究路径根本就没有经历老板给我们五百万让我们仔细思索应当先研究什么后研究什么这一阶段更不论以一个优先级评定框架去评估不同领域的社会影响以及其重要性程度。那么我们该怎么做呢论文作者认为我们在开展研究前应该先回答以下这五个问题这项技术会使什么样的人从中受益这项技术可以帮助到哪些弱势群体这项技术是否有助于实现联合国可持续发展目标中的其一其二这项技术可以提升人们的生活质量吗这项技术会给人们带来哪些问题例如对于机器翻译而言机器翻译会使得其他语言的使用者受益Q1并且有助于缩小第二语言者与母语者的差距Q2机器翻译技术可以直接提升信息与知识的共享可以被广泛的应用在优质教育、体面工作与全球伙伴之中Q3机器翻译可以被认为直接提升了人们的社会质量Q4但它有可能扩大有经济条件穿戴智能设备与没有经济条件的人群之间的差距Q5因此我们可以将其认为是对社会有益的。基于这个自检框架作者归纳出具有良好社会效益的 NLP 研究主题并对每个主题提出了建议的研究方向如下其中比如以 NLP 技术应用于残疾学生教育用 NLP 技术应用于表达障碍者的辅助语音生成针对气候变化认知问题的跨文化研究等等都十分具有现实意义。总结这篇论文为定性的分析 NLP 技术的社会效益开了一个好头诚然如作者所说他们的工作目标并非是给予一个自然语言处理技术的社会效益的确定答案而是在这个自然语言处理技术已经开始从科研领域进入大众生活的时间拐点处试图向全面理解自然语言处理技术的社会意义迈出一小步。随着自然语言处理的研究与工业应用走向成熟一种清醒的与高屋建瓴的对一项技术的社会意义的理解是必不可少的我们的研究不能仅局限于什么领域好发什么技术好做而更是要在动机层面意识到真正的“研究意义”。恰如我们从学校到企业明白了什么才是这项技术的商业意义一样研究也需要有一个过程去理解这项技术现有的与潜在的社会意义。计算机科学是一个典型的应用学科在刻板印象里程序员亦或是计算机领域的研究者往往不存在什么类似天下大同的理想与目标整个领域往往被粗暴的定义为学了“能赚钱的”商品。我们可以看到学法者站在法律是社会效益最大的背景下伸张正义学医者更是悬壶济世医者仁心探讨 NLP 的社会效益也多少可以在平凡代码之余暗藏一些超验的意义与动力用“我有一个梦想”式的浪漫投身这个领域的平凡与灿烂。萌屋作者小戏边学语言学边学NLP~作品推荐千呼万唤始出来——GPT-3终于开源Linux 程 序 员 失 业 警 告后台回复关键词【入群】加入卖萌屋NLP/IR/Rec与求职讨论群后台回复关键词【顶会】获取ACL、CIKM等各大顶会论文集