论个性化信息推荐系统的运作逻辑及影响

王茜

(郑州大学新闻与传播学院,河南 郑州 450001

 

摘要:在信息大爆炸时代,基于数据挖掘、智能算法等技术手段的个性化信息推荐成为新的潮流。在国内主打个性化资讯推荐的三家客户端,天天快报的信息窄化程度最高,今日头条次之,而一点资讯在用户兴趣和信息多样性之间的平衡上做得最为出色。资讯客户端对用户兴趣一味迎合带来了一些负面影响,包括信息窄化、公共新闻事件的弱化以及算法短视。

关键词:个性化推荐;资讯客户端;智能算法

 

文章发表于《郑州大学学报(哲学社会科学版)》2017年第1期

 

1995年,麻省理工学院媒体实验室创办人之一尼古拉斯•尼葛洛庞帝提出了“我的日报”(The Daily Me)的假设:“试想这样的未来,你的界面代理人可以阅读地球上每一种报纸、每一家通讯社的消息,掌握所有广播电视的内容,然后把资料组合成个性化摘要”[1] (P153)。二十多年后的今天,尼葛洛庞帝的预言已然变成了现实。数字化技术使数据储存成本大大降低,而物联网、传感器、射频识别等新技术的兴起进一步促进了信息的大繁荣,基于算法的个性化信息推荐开始成为新的潮流,帮助用户在浩如烟海的信息洪流中捕捉所需资讯。《纽约时报》在其2014年发布的《创新报告》中指出,个性化意味着“运用科技手段来确保对的故事在对的时间、对的地点找到对的读者”,这将带来“无数机会”[2](P37)。而无论是宣扬“你关心的,才是头条”的今日头条,还是“为你私人订制的资讯客户端”一点资讯,资讯客户端都不断进行新的尝试以优化使用体验,增强用户黏度。

现如今,通过分析用户的阅读历史、社交网络帐号、IP地址、所使用的手机型号等,媒介组织能够进行深度数据挖掘,智能计算用户兴趣,并为其推荐个性化内容。把关权力日益从人工编辑向智能算法让度,这加深了学者对把关机制不透明、算法歧视、信息窄化等问题的隐忧。

一、文献回顾与研究问题

谷歌自2009年12月4日起开始推行个性化信息搜索服务。自这天起,即便不登陆谷歌帐号,用户搜索到的结果是个性化的、“.....千面”的。伊莱·帕里泽认为这是一场“重要的却几乎悄无声息的信息消费变革”,标志着个性化时代的开启[3](P7)。

在对个性化进行定义时,学者强调了用户与系统之间的互动性[4]。一方面,通过分析用户的兴趣图谱和信息消费习惯,系统开始形成有关用户兴趣的判断;另一方面,基于算法的个性化信息推荐系统开始发挥把关功能,影响用户的信息消费环境。陈力丹指出,在传者和受者之间加入了智能化的信息过滤系统,传统传播模式受到挑战[5]。首先是把关主体发生的变化。研究者认为,算法正在代替人类进行价值判断,“在决定着什么是‘重要’、‘相关’、‘适合’或‘有害’”,这会带来全新的伦理问题[6]。其次是把关机制的不透明。基于算法的把关过程并不像看起来那般客观中立,人为因素可在多个环节对其产生影响,如算法标准的设定、算法运行过程中的人工干预等。学者注意到当前算法的“短视”(myopia)倾向,即仅仅关注当下目标的实现,未把长期目标纳入考量,这种设计逻辑使得

骗点击量的内容充斥网络。

关于个性化信息推荐对用户信息环境的影响,学界已经有丰富的研究成果。在个人层面,学者认为个性化信息推荐会限制用户视野,造成信息窄化。推荐系统倾向于迎合用户兴趣,强调信息的易消费性而非重要性。例如,今日头条创始人张一鸣强调,“只有让用户越方便、越偷懒的应用,才能体现出真正的个性化推荐”[8]。在社会层面,个性化信息推荐可能会加深个人化、极端化和商业化,这将阻碍人们就公共事务进行理性讨论继而产生合意的商谈过程。除了有关“回音室”“过滤器气泡”以及“信息茧房”等的思辨性分析,一批实证研究也开始出现。例如,学者通过追踪五万名美国用户的互联网浏览历史来探究意识形态隔离情况,结果显示:相比较通过媒介组织主页获取信息,通过社交网络和个性化搜索引擎获取信息的用户呈现出更高程度的意识形态隔离,不过隔离程度仍比较有限[9]。

总体而言,上述文献凸显了研究个性化信息推荐的重要性和现实意义。那么在中国,不同媒介的推荐系统是如何运作的?对个性化的强调和推崇将如何影响用户的信息环境?如果用户仅仅关心某一领域的资讯,客户端是会一味迎合,还是会推荐其它有价值的内容来拓宽用户视野?当重大新闻事件发生时,机器和算法能进行准确的新闻价值判断,继而发挥舆论引导功能吗?为了回答这些问题,笔者选取了三家主打个性化资讯推荐的客户端——今日头条、一点资讯和天天快报作为研究对象,于2016年7月14日至27日进行了为期两周的参与式观察,记录了三家客户端的新闻推送,包括推送的时间、类型、频次等。

由于算法的运作机制十分复杂,本文仅仅探讨用户历史阅读行为对新闻推送的影响,把其它影响因素排除在外。用户的点赞、转发、评论、收藏、社交账户登录、手机型号等因素都会影响个性化信息推荐系统对用户兴趣的识别过程,想要了解单个因素及各因素之间的排列组合如何发挥作用无法仅仅通过参与式观察来实现。未来研究可以通过与技术人员、算法工程师等进行深度访谈来进一步拓展。

 

 

二、研究结果

笔者两周共记录了357条新闻推送,其中今日头条89条,天天快报139条,一点资讯129条。将结果导入在线词频分析工具“图悦”,笔者得到了三家客户端新闻推送标题中出现的热频词汇。今日头条的新闻推送中,排名前五的热频词汇分别是:林心如(8次)、暴雨(5次)、霍建华(5次)、河南(5次),洪灾(4次)和郑州(4次)并列第五;天天快报排名前五的热频词汇分别是:郑州(24次)、林心如(11次)、范冰冰(7次)、赵丽颖(7次)及杨幂(7次);一点资讯排名前五的热频词汇分别是:赵丽颖(9次)、邢台(6次)、河南(6次)、南海(5次),肯德基(4次)、郑州(4次)和老虎(4次)并列第五。

通过热频词汇可以看出,一点资讯的新闻推送类型比今日头条和天天快报更加丰富。除了明星八卦和本地新闻外,一点资讯还推送了包括“邢台泄洪”“南海仲裁案”“抵制肯德基”及“野生动物园老虎袭人”事件等要闻。下面对三家客户端进行分别讨论。

1. 今日头条新闻推送情况

今日头条于2012年8月推出,上线不到两年便积累了上亿用户,业务模式受到了业界和学界瞩目。创始人张一鸣这样介绍今日头条的推荐机制:“当用户绑定微博登录后的5秒钟之内,系统会为用户建立起一个DNA兴趣图谱。这个图谱类似于一个数学模型,主要根据用户SNS账号上的标签、关注人群、好友、评论/转发、收藏等数据,以及用户的手机、位置、使用时间等数据提取而来。当中包括可视的(兴趣、爱好等比较好衡量的因素)和不可视的(文艺、清新等主观因素)两大主题,上万个维度。随后,系统会自动记录用户的阅读情况,不断摸索用户的兴趣,同时也在不断优化推荐的算法。六七次之后,机器就能基本上判断出用户的兴趣了。”[8]

今日头条不仅能通过大数据和算法推测出用户想看什么,还能让用户决定不看什么。打开客户端会发现,今日头条每条资讯后面都有一个叉号,点击它便可屏蔽相关内容,且有多个理由可供选择,包括“重复、旧闻”、“内容质量差”、新闻来源、新闻类型(如时政外交、政法、体育、社会)、关键字(如人名、地域)等。

笔者将两周内记录的新闻推送呈现如下(见图1)。可以看出,今日头条推送的新闻类型较少,娱乐新闻的占比超过50%;其次为本地新闻,其它类型资讯所占比例较为平均。这一结果呼应了尼尔·瑟曼的隐忧:个性化及伴随而来的内容推荐精准化将导致用户“失去意外发现好文章的机会”[10]。尽管如此,今日头条在突发事件的新闻推送中表现较为出色,这与天天快报形成了对比。


 

2. 天天快报新闻推送情况

天天快报是腾讯公司2015年7月推出的一款兴趣阅读客户端,以区别于主打权威资讯的腾讯新闻。如图2所示,天天快报推送的资讯涵盖类型虽然比今日头条要多,但 “娱乐”“本地”“社会”三种类型所占比例占90%以上。


 

由于新闻推送次数过多会打扰用户,引起反感。因此,在有限的新闻推送次数之内,强调某些新闻类型的同时,其它类型的新闻必然会被弱化。在为期两周的观察时间里,天天快报至少遗漏了三次重大新闻事件,包括“7·14尼斯恐怖袭击事件”“7·19台湾游览车火灾事故”以及“7·23邢台洪灾”。分析天天快报的新闻推送可以发现,过度依赖算法,迎合用户兴趣,会增加重大新闻事件遗漏的几率。与此同时,个性化信息推荐系统运行过程中可能存在的算法歧视问题也值得注意,例如判断穷人不需要财经新闻,从而没有相关的资讯推送。

3. 一点资讯新闻推送情况

一点资讯于2013年7月上线,截至2015年底累计用户1.7亿,进入新闻资讯类客户端第一阵营。如图3所示,一点资讯的资讯推送是三家客户端中“营养”最均衡的。

一点资讯新闻推送具有以下特点:第一,推送的资讯类型广泛,不仅涵盖了娱乐、本地、国际、社会、时政、要闻、生活百科、军事等,且各类型所占比例较为平均;第二,一点资讯推出的“新闻早知道”,包罗了“昨夜今晨发生这些大事”,资讯精编反映出其对内容运营的重视;第三,面对重大新闻事件,一点资讯通过多角度、组合式的新闻推送,积极发挥舆论引导功能。例如,7月23日推送的10条新闻中,6条都与邢台洪灾事件相关,包括《泄洪不通知?邢台多人梦中死》《邢台4名孩子被洪水冲走遇害》《泄洪未通知?邢台副市长回应》《河北洪灾致105死104失踪》《你曾有无数机会救邢台的孩子》《邢台市长救洪灾道歉》等。次日发生的野生动物园老虎袭人事件,一点资讯连续两天推送了事件报道《野生动物园老虎伤人视频曝光》,事件后续《北京老虎咬人 妈妈救女儿丧命》以及评论《老虎咬死人,为何心疼老虎?》。

三、结论和讨论

本文以资讯客户端为研究对象,阐释了个性化信息推荐系统的运作逻辑及其对用户信息环境的影响。通过为期两周的参与式观察,笔者发现天天快报的信息窄化程度最高,今日头条次之,而一点资讯在用户兴趣和信息多样性之间的平衡上做得最为出色。三家客户端虽然都采用了个性化信息推荐系统,但侧重点各异。例如,与今日头条“重推荐轻定制”的思路不同,一点资讯创始人之一郑朝晖强调要“结合搜索与推荐,走一条中间道路,让用户半主动半被动”[11]。

不同的理念将导致不同的实践。脸书创始人马克·扎克伯格曾说,“比起非洲那些挣扎在死亡线上的人们,此刻你前院奄奄一息的松鼠可能与你的兴趣更加‘相关’”[3](P6)。在这种理念的指导下,资讯的重要性必然让位于相关性,而公共利益必然让位于个人兴趣。本研究所凸显的客户端对用户兴趣的一味迎合,及伴随而来的重大新闻事件的弱化,打造的是一个舒适的、无需加以深度思考的信息环境。尽管用户获取新闻资讯的渠道多样,信息窄化可以通过多个渠道间的互补而得以改善,然而已有研究显示,逾九成用户每日仅打开一款新闻客户端[12],单个平台的信息窄化问题仍是值得我们关注的。

中国互联网络信息中心(CNNIC)在第37次《中国互联网络发展状况统计报告》中预测,“网络新闻资讯市场将朝着‘资深编辑’+‘智能算法’相互融合的方向发展”。随着把关权力从人工向算法让度,西方学界已开始呼吁相关规则规范的建立,这都需要学界进一步的考察和审视。

 

 

参考文献:

[1] Negroponte, N. Being Digital[M]. New York: Alfred A. Knopf, 1995.

[2] The New York Times. Innovation Report [EB/OL]. 2014, retrieved from www.presscouncil.org.au/uploads/52321/ufiles/The_New_York_Times_Innovation_Report_-_March_2014.pdf.

[3] Pariser, E. The Filter Bubble: What the Internet Is Hiding from You[M]. New York: the Penguin Press, 2011.  

[4] Thurman, N. & Schifferes, S. The Future of Personalisation at News Websites: Lessons from a Longitudinal Study[J]. Journalism Studies, 2012, (5-6).

[5] 陈力丹. 新媒体发展趋势与悖论:带来便捷同时也产生新问题[N].人民日报, 2015-10-11.

[6] Tufekci, Z. The year we get creeped out by algorithms [EB/OL]. 2014, retrieved from

http://www.niemanlab.org/2014/12/the-year-we-get-creeped-out-by-algorithms/

[7] Luca, M., Kleinberg, J. & Mullainathan, S. Algorithms Need Managers, Too [J]. Harvard Business Review, 2016, (January-February).

[8] 张一鸣. 机器替代编辑?[J]. 传媒评论, 2014, (3).

[9] Flaxman, S., Goel, S. & Rao J.M. Filter bubbles, echo chambers, and online news consumption[J]. Public Opinion Quarterly, 2016, (80).

[10] Thurman, N. Making ‘The Daily Me’: Technology, economics and habit in the mainstream assimilation of personalized news[J]. Journalism, 2011, (4).

[11] 程 征,万小广. IT公司如何“玩转”新闻客户端?——对话“一点资讯”及其美国关联公司创始人郑朝晖[J].中国记者, 2015, (6).

[12] Trustdata. 2015年中国移动互联网行业发展分析报告[EB/OL], 2015, retrieved from http://www.itrustdata.cn/#publish