当您在Internet上搜索内容时,您是一页一页地浏览建议还是从前几个选择中进行选择?由于大多数人都是从这些列表的顶部进行选择的,因此他们很少看到绝大多数选项,从而在从招聘到媒体曝光到电子商务等各个方面都产生了偏见。
在一份新论文中,康奈尔大学的研究人员介绍了他们开发的一种工具,可以在不牺牲其实用性或相关性的情况下提高在线排名的公正性。
计算机科学博士生Ashudeep Singh说:“如果您可以平等地检查所有选择,然后决定选择什么,那将是理想选择。但是,由于我们无法做到这一点,因此排名成为导航这些选择的关键界面。” “在动态学习到排名中控制公平和偏差”一书的第一作者,该书在7月25日至30日举行的计算机科学协会SIGIR信息检索研究与开发会议上获得了最佳论文奖。
辛格说:“例如,许多YouTube员工会发布相同食谱的视频,但是其中一些视频的观看者比其他人更多,即使他们可能非常相似。” “这是由于搜索结果呈现给我们的方式而发生的。我们通常以线性方式降低排名,而注意力迅速下降。”
研究人员的方法称为FairCo,可以使他们大致平等地接受同样相关的选择,并避免对已经排在首位的物品给予优惠待遇。这可以纠正现有算法中固有的不公平现象,从而加剧不平等和政治分化,并减少个人选择。
“他们如何分配曝光率排名系统。那么,我们如何确保每个人都能获得应有的曝光率呢?” 计算机科学和信息科学教授,论文的高级作者Thorsten Joachims说。“例如,在电子商务系统和对职位空缺进行排名的系统中,构成公平性的方法可能大不相同。我们提出了可让您指定公平性标准的计算工具,以及可证明强制执行的算法他们。”
在线排名系统最初基于1960年代和70年代的图书馆学,旨在使用户更轻松地找到他们想要的书。但是,这种方法在两面市场中可能是不公平的,在两面市场中,一个实体想要找到东西,而另一个实体想要找到。
Joachims说:“在优化排名中,许多机器学习工作仍然非常专注于最大化用户的效用。” “过去几年中我们所做的是提出有关如何最大程度地提高实用性,同时仍然对所搜索项目公平的概念。”
优先处理较受欢迎商品的算法可能不公平,因为列表中出现的选项越高,用户点击并做出反应的可能性就越大。这会造成“富人致富”现象,其中一种选择变得越来越流行,而其他选择则消失了。
算法还寻找与搜索者最相关的项目,但是由于绝大多数人都选择了列表中的前几个项目之一,因此相关性的微小差异可能会导致曝光差异巨大。例如,如果该新闻出版物的读者中有51%偏爱偏向保守的观点,而49%偏爱比较自由的文章,则可以认为主页上突出显示的所有头条新闻都倾向于保守。
乔阿希姆斯说:“当相关性的微小差异导致一方扩大时,通常会导致两极分化,一些人倾向于主导对话,而其他意见则被忽视,而没有引起他们的公平关注。” “您可能希望在电子商务系统中使用它,以确保如果您要生产30%的人喜欢的产品,则可以以此为基础获得一定的曝光。或者,如果您有简历,数据库,您可以制定保障措施以确保它不会因种族或性别而受到歧视。”