算法是什么意思?你惧怕算法吗?( 二 )
在2005年至2015年间获得诺贝尔奖的25位科学家中,有14个人在35岁时的“h指数”低于10 。业界普遍认为,“h指数”需要达到12才能获得终身职位,这就意味着这些诺贝尔奖得主在35岁之前都无法找到工作 。
显而易见,类似“大家也喜欢”这样的算法使我们的集体行为呈现出新的形式,也为我们相互之间的交流提供了新的方式 。但是我们不应该让算法来决定我们看待这个世界的方式 。在学术界,这种情况在某种程度上已经发生了 。因为容易量化,论文被引用次数和论文的影响因子已经成为科学研究中的通用货币 。
在学术界,当科学家们惧怕算法时,到底在惧怕什么?针对这一个问题,萨普特教授毫不讳言地指出,由“大家也喜欢”的算法进而引出的“h指数”,虽说可以提高学术论文的引用量,但将这个指标作为考核学术成果的唯一标准,必然会造成学术界的反向激励和逆淘汰现状 。从这一点上看,数据算法对大部分科学家来说是“黑箱”,我们应该了解其中可能存在的问题,避免被误导或操纵,别让“h指数”劫持了科学家 。
警惕算法将我们置身于狭隘的“茧房”
从纽约、伦敦、巴黎、东京等世界发达城市,再到国内的北上广深等一线城市,不少都市白领或主流“数字青年”也许早已习惯于这样一种生活方式:用计步器衡量自己每天的活动轨迹;用膳食APP记录自己每餐摄入的卡路里;用智能手环监测自己的睡眠;用“点赞”数量去衡量友情和人脉……算法不停地旋转和降维你的数据集,直到它能读懂你、透视你 。
在萨普特教授看来,当算法步入社会情境,人们在现实空间的本我之外,于虚拟空间通过数字化技术构建了另外一个自我 。伴随着两个世界的互通和连接,两个自我不断产生复杂互动,进而带来积极和消极正反两个不同方面的影响 。
以脸书的算法为例,它会根据用户已经做出的行为来决定给用户看什么样的内容 。其通过“你见到该文章的可能性=你对该报纸的兴趣×你和分享该文章的朋友的亲密度”这样的一个等式来决定,一篇最近分享的报纸文章在你动态消息上出现的可能性 。
按照萨普特教授的分析,当你和朋友交流你分享的帖子时,你同时提高了这个等式中的两个量:你对《每日电讯报》的兴趣增加了,这导致脸书增加了你和这位朋友间的亲密度 。因此,我们可以认为见到某篇文章的可能性是随参与度的平方变化的 。在上述的那个等式中,你对一份报纸的兴趣体现的就是你与这份报纸间的参与度;你与分享该文章朋友的亲密度体现的就是你们之间的参与度 。如此一来,《每日电讯报》以后的文章在你页面的曝光度就会增加,而增加的曝光度使你将来更有可能点击这些链接,从而进一步提高脸书算法对《每日电讯报》做出的排序,给它带来更多的曝光 。就像“大家也喜欢”的亚马逊模型一样,“过滤器”模型简化了脸书算法的实际操作 。
我们越是点击某类信息,这些“过滤器”算法就越是推送相关内容 。与“过滤器”模型概念相映成趣,美国哈佛大学法学院教授凯斯·R·桑斯坦在其著作《信息乌托邦》中提出了“信息茧房”的概念 。桑斯坦认为,公众往往只关注他们感兴趣的信息,因而知识结构是不全面的,长此以往,将置身于狭隘的“茧房”中 。桑斯坦还生动地描述了“个人日报”现象 。用户的个性化需求不断被满足,未来某一天,将出现新的界面代理人,它将能够为每个人量身定制一份“个人日报” 。
算法的便利让人惊叹,也让人警惕:凭什么算法可以攫取数据来分析大众的偏好,引导他们的行为 。大众开始对算法疲劳,也开始对算法用同类信息编织出来的“信息茧房”感到不满 。我们应当如何发现和享受真正的“算法之美”,构造安全、公平、透明、可问责的算法,从而迈向信任算法的社会呢?萨普特教授并没有给出自己的结论和答案 。但人类和算法相处的纪元才刚刚开始,这一条惊险和探寻应对良策之路显然还要走很长的时间 。
推荐阅读
- 鸽子党什么意思
- 12mis含义是什么
- 医学endo什么意思
- 10h是什么意思
- 核数是什么意思
- 12个月花歌谣是什么
- 14点30分是什么时辰
- x和xs外观区别是什么
- 26朵玫瑰花代表什么意思
- 时间太瘦,指缝太宽什么意思
