研究发现了未解决的编辑分歧的原因,并提供了可改进审议的预测工具。
技术

维基百科使大规模在互联网最大的通用参考资源上开放协作。但是,和许多合作写作项目一样,制作的内容可以是一个有争议的话题。

征求意见(RFC)过程


经常,多个维基百科编辑会对文章或政策的某些更改意见不同。正式解决此类争议的主要方式之一是征求意见(RFC)程序。

吵架的编辑会在论坛上公布他们的审议结果,其他维基百科的编辑会插话,中立的编辑会做出最后的决定。

理想的,这应该解决所有问题。但麻省理工学院研究人员的一项新研究发现,令人衰弱的因素——如过度争吵和措辞不当的争论——已经导致约三分之一的RFC无法解决。

为了研究,研究人员汇编并分析了第一个全面的RFC对话数据集,在八年的时间里,对经常关闭RFC的编辑进行采访,了解他们为什么找不到解决方案。

他们还开发了一个机器学习模型,利用该数据集预测RFC何时会过时。而且,他们推荐的数字工具可以使讨论和解决更有效。

“三分之一的讨论没有结束”


“令人惊讶的是,三分之一的讨论没有结束,“艾米X张说,麻省理工学院计算机科学与人工智能实验室(CSAIL)博士生,论文合著者,这是在最近的计算机支持合作工作和社会计算的ACM会议上提出的。

“在维基百科上,每个人都是志愿者。人们投入工作,他们也很感兴趣……编辑们可能在等着有人关门,这样他们就可以重新开始编辑了。

“我们知道,通过讨论,看透并解决一个大问题很难,尤其是前后和满足。[我们希望]帮助那个人完成这项工作。”“

论文的合著者是:第一作者简·伊姆,密歇根大学信息学院的研究生;克里斯托弗J。维基媒体基金会的Schilling;大卫·卡格,计算机科学教授和CSAIL研究员。

(不是)发现关闭


维基百科提供了多种渠道来解决编辑争议,包括两位编辑讨论他们的问题,把想法交给社区的简单多数票,或者把辩论带到一个主持小组。

维基百科之前的一些研究已经深入探讨了这些渠道,以及投稿人之间的反复“编辑战争”。“但RFC很有趣,因为投票的心态要少得多,“张说。

“对于其他过程,一天结束后,你将投票,看看会发生什么。[RFC参与者]有时投票,但更重要的是达成共识。重要的是讨论中实际发生的事情。”“

要提交RFC,一位编辑起草了一份模板建议,基于一篇文章的基本“谈话”页面没有解决的内容争议,并邀请更广泛的社区发表评论。

提案的范围很广,从名人背景信息的细微分歧到维基百科政策的变化。任何编辑器都可以启动RFC和任何编辑器-通常,更有经验的人-没有参加讨论,被认为是中立的,可以结束讨论。

30天后,bot自动删除RFC模板,有决议或无决议。RFC可以通过一个总结语句来正式结束,非正式地,由于与会者的压倒性同意,或是不新鲜,意思被删除而没有解决。

数据库大约有7个,000次RFC对话


为了他们的学习,研究人员编制了一个由7个从2011年到2017年,来自英语维基百科的1000次RFC对话,其中包括结束语,作者帐户信息,以及一般的回复结构。

他们还采访了维基百科10个最常结案的人,以便更好地理解他们解决争端的动机和考虑。

分析数据集,研究人员发现,大约57%的RFC被正式关闭。其余43%中,78%(约2,300)在没有非正式决议的情况下变得陈旧-或,在所有研究的RFC中,大约有33%是这样的。将数据集分析与访谈相结合,研究人员随后详细阐述了分辨率失效的主要原因。

主要问题包括初始论点表达不清楚,发起人对该事项不清楚或者有故意偏颇的建议的;在讨论中过度争吵会导致更复杂的问题,比较长的,难以完全检验的争论性线程;第三方编辑的兴趣很简单,因为主题可能太深奥,除其他因素外。

有用的工具


然后,团队开发了一个机器学习模型来预测给定的RFC是关闭(正式还是非正式)还是过时,通过分析文本的60多个特点,188bet亚洲体育维基百科页面以及编辑帐户信息。

该模型在讨论开始后一周内预测失败或成功的准确率达到75%。

一些信息更丰富的预测功能,188bet亚洲体育他们发现,包括讨论的长度,参与者和回复的数量,文章的修订次数,话题的流行和兴趣,讨论参与者的经验,以及粗俗的程度,否定性,以及评论中的普遍攻击性。

有一天,这个模型可以被RFC发起者用来监控一个正在展开的讨论。“我们认为,对编辑来说,知道如何针对他们的干预措施是有用的,“张说。

“他们可以将(RFC)发布到更多(维基百科论坛)或邀请更多人,如果它看起来有不被解决的危险。”“

研究人员建议维基百科可以开发工具帮助闭门人组织冗长的讨论。在一条线内标记有说服力的论点和观点的变化,并鼓励合作关闭RFC。

未来,该模型和建议的工具可能用于涉及大规模讨论和讨论的其他社区平台。张指向在线城市和社区规划论坛,公民参与提案的地方。

“人们正在讨论(提案)并投票表决,因此,这些工具可以帮助社区更好地理解讨论……而且对提案的实施者也很有用。”“

张感应电动机,其他研究人员现在已经建立了一个编辑网站在所有专业知识的层次上团结起来互相学习,更容易监控和结束讨论。

“靠得更近的工作相当困难,“张说,“因此,想要结束这些讨论的人非常少,特别困难,比较长的,更重要的是。这将有助于减少进入的障碍[让编辑更接近],并帮助他们协作关闭RFC。”“

“有趣的结论来自定性分析”


“令人惊讶的是,三分之一的讨论从未得到解决,[更重要的是]讨论无法结束的原因,最有趣的结论来自定性分析,“罗伯特·克劳特说,卡内基甜瓜大学人机交互名誉教授。

“这项研究的一些发现超越了维基百科,可以应用于其他环境下的许多讨论。”更多的工作,他补充说:可以提高机器学习模型的准确性,以便为维基百科提供更具操作性的见解。

这项研究揭示了一些RFC是如何处理的。”偏离既定规范,导致效率低下和偏见”,达里奥·塔拉巴雷利说,维基媒体基金会研究主任。

“结果表明,参与者的经验和讨论的时间长度对及时关闭RFC具有很强的预测作用。这为如何使新来者和代表不足群体的成员更容易接触到与治理相关的讨论这一问题带来了新的经验证据。”“

//www.bjgzb.com/wp-content/uploads/2018/11/a-aaaawik.jpg//www.bjgzb.com/wp-content/uploads/2018/11/a-aaaawik-300x300.jpg戴维奥里奥登技术数据,数字,MIT
维基百科使大规模在互联网最大的通用参考资源上开放协作。但是,和许多合作写作项目一样,制作内容可能是一个有争议的主题。请求评论(RFC)处理通常,多个维基百科编辑会对文章或政策的某些更改意见不同。最主要的方法之一…