一次极端的内容试验:推荐算法如何探寻我们的兴趣边界

整个世界其实一直在滚滚向着多元化的一面发展,用户和内容在多元化,算法其实也在多元化。

图片来源@视觉中国

图片来源@视觉中国

文|柳胖胖

用算法进行兴趣推荐这件事,一直受到诸多争议,它到底是让我们的内容环境更闭塞,还是更多元?机器确实让推荐和送达更容易发生,但我们比以前懂了更多吗?信息茧房真的存在吗?这个世界本身是否就像是一套算法,只提供给你需要的东西,而这套算法本身是否也在进化?

新闻实验室的方可成老师在系统性地阅读了近年来发表在国外一流学术期刊上的研究后发现:使用社交媒体和算法推荐App的人,并没有明显出现视野变窄的现象,大多数人阅读的内容依然有相当的多样性。

“研究者们选取了21个月的数据。他们将用户分为两组,一组是根据算法推荐选择电影观看的,叫做“跟随组”;另一组是不理会算法推荐的电影,叫做“不理会组”。他们发现:算法向“跟随组”推荐的电影,一直要比向“不理会组”推荐的电影更加多元化。

也就是说,根据算法的推荐选择电影,然后进行打分,其实会让算法更好地学习到你的喜好,并且给你推荐更多样的片子;而如果不根据算法的推荐来看电影和打分,反而会让算法给你推荐更窄的片子。

在不使用算法推荐的情况下,用户的视野反而变窄得更快。”

学术的研究结果当然值得参考,不过,如果是针对一个非常极端的内容消费用户,推荐算法又会带给他什么呢?

基于一个严谨的产品工作者的好奇心和动手欲,以及对这些问题的困惑,我买了一个新手机号,找了一台没有装过今日头条的廉价安卓测试机,开始了我的“反人类”探索之旅。

我的思路大概是这样的:在今日头条上只关注一个从体量上来说极其小众的内容领域,逐步成为它的资深内容消费者,然后观察在这个过程中,头条的算法会如何投喂我在这个兴趣领域的偏好,以及最重要的,最终头条是否会用这个领域的内容完全淹没我,让我只能看到这个领域的内容。

在第一次打开头条的时候,我是一个空白未登录的状态,还没有任何操作行为或关注任何账号,头条推荐页给我的内容也是比较随机的,相对以社会新闻和热点内容为主,其他类内容随机分布各一条。

所以,我先注册登录了一下,然后在推荐内容的“更多”里,我忽略了头条置顶给我推荐的娱乐,健康,科技,旅游和星座五大分类,而是直接把列表拉到了最下方,关注了最小众的“收藏”领域。

这个内容领域主要包含的就是文物和古玩类的内容,包括诸如字画、钱币和邮票等等之类的都算,而我个人对这个领域基本属于一无所知的状态。不过为了把“反人类”做到极致,我还更进一步一并关注了头条默认推荐给我的20个收藏类的内容创作账号。

关注完后20人,我还做了一件事,就是把收藏标签移到了最靠近推荐标签的位置,这样点击标签和阅读起来最方便,并且理论上,这也应该增强了系统判断给我推荐收藏类内容的权重。

今日头条App里默认进入的推荐页,前三位一般被国家重要新闻给占据了,2条是默认置顶,1条是人民网这样的官媒发布的热点新闻,从位置上来说,从第四条开始才算是经过算法推荐展现给你看的内容。

在第一次的刷新中,头条似乎还没有给我打上很强的"收藏爱好者“的标签,整个前10条就一条和收藏相关的,剩下9条里,除了两条社会新闻两条娱乐新闻,其它五类内容各一条。

在我第二次的刷新中,结果依然差不多,收藏只有一条,社会娱乐两条,其它随机的五类内容(与第一次的不同)各一条。

第三遍还是如此。

我判断头条并不因为我只是关注了一堆收藏类账号,就判断我只对收藏类的内容感兴趣了,因为我每次只是在推荐流里刷下来看标题,还没有跟任何的收藏文章之间产生互动(转评赞),也没有和其他类的内容有过互动,所以我的推荐流里一直保持了这样的比例:10%的收藏类内容+不断更换的其它类内容。

不过虽然内容流里收藏内容不多,但是在“他们也在用头条的”横向推人的流里,出现了这么一个情况,左右滑动的区域内一共可以显示10个账号,其中有9个是收藏类账号。

从这里也可以看出,对于荐人和荐内容,头条可能是采用分开的两套策略。我猜测,账号推荐上,头条希望快速收拢以获取你的关注关系,所以直接给你推已经关注过的同类账号,但内容推荐上,头条需要你进一步有更多反馈数据后,才会逐步让某一类内容更多占据你的推荐流。

于是从新的一次下拉刷新开始,我做了这么一件事:对算法在推荐流里给我的每一条收藏类内容,都点击进入文章,慢慢再慢慢地下拉到底部(当然我一个字也没看进去),然后点赞,点收藏,评论(一般就几个字:真棒,好喜欢,不错,之类的)。

大概从第五次刷新开始,收藏类内容的比例终于开始变多(我为什么要说终于),同时,推荐流里出现我未关注的收藏类账号发的内容,我会在内容互动后一并关注作者。

大概从第8次开始,收藏类内容达到了30%的比例,而同时推荐流里还开始出现人文和历史类的内容。

我判断这两类内容会出现,是基于算法的“协同过滤”,因为想精通收藏的领域背后需要了解文化和历史类的知识,这样才有助于判断各种文物和古玩的价值,所以一个“收藏爱好者”必然也得看文化和历史的内容。

解释一下:常见的协同过滤算法有两种,一种是基于用户的(user-based),也即计算用户之间的相似性,如果A和B的兴趣相近,那么A喜欢的电影,B也很有可能喜欢。另一种是基于物品的(item-based),也即计算物品之间的相似性,如果电影C和电影D很相似,那么喜欢电影C的人,可能也会喜欢电影D。

这里可以看出,尽管收藏类内容如此小众,但推荐算法依然找到了一批和我类似的“收藏爱好者”,并把他们同样爱看的“人文和历史”内容推到了我的面前(尽管比例很小,只有各一条)。

另外说一句,虽然关注了收藏的人,很大概率会关注文化和历史类的内容,但反之貌似大概率未必,文化和历史爱好者未必对古玩钱币什么的有兴趣。

但是对于机器算法来说,更好的推荐策略肯定是,给一个对文化和历史有兴趣标签的用户在推荐流里偶尔夹杂一条收藏类内容,视乎其反馈来决定是否推荐更多。

我在之前刷新过程中也发现,头条貌似会留一部分比例的流量和位置来探索用户的兴趣,推荐一些算法模型还不确认用户是不是感兴趣,得在用户有了反馈(比如完全不看一刷而过)后继续下一步的探索。

说回我的实验,我在刷新后“对每条收藏类内容给予重度反馈然后忽略其它一切内容”的行为很快获得了算法的高度重视,收藏类内容从比例来看快速升高,最多的时候达到了每10条里有6条收藏强相关的内容,大概1-2条人文或者历史的内容,剩下2条还是社会热点和娱乐新闻。

而且一般在前三条里,必有一条是直接关注账号发的收藏内容,剩下两条可能是相关人文历史领域的内容或者还未关注的账号发的收藏类内容。

最后,我把这个“极端收藏爱好者”的身份坚持了两周左右,每天重复十几次到数十次不等的刷新,然后只对收藏类内容进行点击阅读、评论、点赞、收藏和关注。

不过,最终算法给我的推荐比例却没有继续增加,前10条里,除了广告比例提高(可能是觉得老用户更能忍受?)之外,最多的时候还是5-6条收藏类相关内容,少的时候2-4条。

其中,必有2条以上是收藏类强相关的内容(直接探讨收藏物本身),1-2两条收藏弱相关的文章(或我关注的收藏领域账号发布的其它类内容),以及1-2条文化和历史强相关内容,而剩下还有4-6条,则是非收藏相关的内容。

看起来,推荐算法并不会出现10条里9条或全部都是收藏类内容的情况。经过这个十分极端(真实用户不可能只在新闻资讯App里盯着收藏内容不放)但其实并不麻烦的实验之后,我整体的感受有以下几点:

1、推荐算法在做的并不是以某一条内容去压中你的兴趣,而是以“组”为单位(10-20条)来测试你(身份标签)、你可能会喜欢的内容(兴趣标签)和你当下的状态(环境标签),命不命中是一个概率游戏;因为要条条命中、甚至单条命中其实很困难,但以组为单位去看压中过(1-2条)的概率,很有可能在90%以上。

2、所以纯以兴趣推荐为基础的资讯产品,最难的是用户前三次使用的时候,通常会流失率很高且印象很差,后面基于用户在内容消费上的需求和行为数据(包括主动的搜索等),使用上大概率会越来越顺。

3、资讯推荐类产品没可能最终只提供特定某一类内容给你看,因为这本质并不利于它自己的日活和时长,当你的今日头条完全变成“收藏头条”后,也是一个用户离开的时候。

4、这就像没有一个商场的经理,希望顾客每一次来到商场都只关注同一类别的商品。商场经理都希望顾客关注尽可能多的产品品类,资讯产品也希望用户尽可能的拓展自己的兴趣,这样才能留住更多的用户和更长的时长。

比如一个喜欢鞋子的用户,假如每次来商场都能快速买到自己喜欢的鞋子,买到就立马走人,那么他的单次消费当然很开心,但最终用户会减少来这个商场的消费次数包括每次来商场逛的“用户时长”,除非他又产生了买鞋子的需求。要把用户长期留存下来,就要展现和提供更多的选择,让他能在商场里也完成衣服、饮食、看电影这些消费。

5、要注意的是,传统上我们经常提到的“信息茧房”现在还并不是一种理论(theory),而是一种假设(hypothesis),至今仍未得到数据量化和案例的证明。

学术上更常见的是概念是“信息回音室(echo chamber)”和“过滤气泡(filter bubble)”,这两个理论大概都是在说人们在某些社交和新闻类产品里更容易听到回声和被过滤的信息,但这还不是类似茧房的完全束缚,也不代表“一个人的信息获取不再多元”或“意见被单一来源的信息左右”。

6、相对算法推荐,过去报纸、杂志和门户网站更有可能造成“信息茧房”一些,因为他们的内容本质上是由一群天天泡在一起相互影响的编辑们推荐给你的。

而朋友圈的信息可能是最容易造成“信息茧房”的,前提是你只通过朋友来获得资讯和看法,但这个现象本质上这也只能算是“社交偏食”而已,自古以来人总倾向于和自己喜欢的人多打交道和聊天。

7、从认知心理学的角度来说,人类大众一直难以避免的是“确认偏见”(confirmation bias),也即更愿意相信自己已经认同的内容。如果你只和自己聊得来的人交朋友和聊天,且只看自己认同的内容,坚持相当长一段时间后(封闭环境不被打破),那么他还真有可能无限接近信息茧房状态,只不过这个茧房是一种作茧自缚。但这个时候,推荐算法反而是可以帮你进行茧房穿透的武器之一,并对抗因为年岁增长而导致的好奇心的衰减。

比如在我作为一个“极致的收藏爱好者”的数据反馈之下,算法并未给我推的全是收藏类内容,还是保持了社会热点新闻的比例,然后渐渐为我找到了文化和历史内容,并在后期持续测试我的兴趣边界,不断找到了可能和我作为一个“收藏重度爱好者的用户画像”相匹配的内容(对收集有历史价值的物品、及其相关交易极度感兴趣、大概率是男性、注重传统文化、年龄在估计在40岁以上),给我推荐了财经、科学、钓鱼和养生类相关的内容。

8、文初提到的方可成的学术研究里,还说到另一个原因解释了人们为什么会对“信息茧房”信以为真,那是因为我们的“心口不一”:人们会向研究人员过度报告自己常看的一些媒体(通常是和自己的态度相近的媒体),而没有报告另一些自己也确实看过的媒体(和自己的意见相反的媒体)。

比如你是一个美国政治自由派,你平常可能既看自由派的媒体,也接触到了保守派的媒体,但是在向研究人员报告自己的媒体消费情况时,你只报告了自由派媒体,而隐藏了自己消费的保守派媒体。

人们喜欢宣称和坚持自己的人设,因此有时很难正确回忆自己的行为,造成了类似“幸存者偏差“的效应。但整个世界其实一直在滚滚向着多元化的一面发展,用户和内容在多元化,算法其实也在多元化。(本文首发钛媒体)

本文系作者 柳胖胖 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
  • 音乐也是,在算法的推荐下,大多数人相比之前更喜欢并擅长主动寻找新的音乐。

    回复 2019.07.15 · via pc
  • 分析思路很清晰

    回复 2019.07.15 · via android
  • 作者是否忽略了一点:你快速翻越和刷新文章,而没有认真读文章,算法是否会认为你是一个“伪收藏爱好者”? 或者是否再尝试去北京潘家园市场,看下那些收藏爱好者的手机里面的今日头条。

    回复 2019.07.16 · via android
  • 既然这样,多一个头条山头干吗?

    回复 2019.07.15 · via android

快报

更多

22:01

2023年全国演出市场总体经济规模达739.94亿元

22:00

河南:目标到2027年工业、农业、建筑、交通运输、医疗等领域设备投资规模较2023年增长25%以上

21:58

德汽车业:欧盟若对中国电动汽车加征关税将损害自身利益

21:57

现货白银短线下挫近0.3美元,现报28.06美元/盎司

21:55

欧洲央行行长拉加德:除非有重大意外,否则欧洲央行将很快降息

21:54

证监会:分红不达标实施ST针对的是有盈利的企业,研发投入大的企业即使分红不满足要求也不会被实施ST

21:49

德意志银行将年底黄金价格预测修正为每盎司2400美元,2025年12月的预测为每盎司2600美元

21:48

纳斯达克中国金龙指数跌1.9%

21:45

瑞银跌1.4%,资本金要求或增加150亿至250亿美元

21:44

摩根大通美国国债客户净多头升至三周最高水平

21:43

微软支持的Rubrik寻求通过IPO筹资至多7.13亿美元

21:42

英国富时100指数下跌2%至7805.72点

21:38

证监会:沪深两市明年适用组合财务指标触及退市的公司家数预计在30家左右

21:38

证监会:市场有观点认为“本次退市规则修改主要针对小盘股” 这纯属误读

21:37

证监会:公司如仅因分红不达标被ST并不会导致退市

21:36

一季度国民经济运行情况一览:GDP同比增长5.3%,规模以上工业增加值同比增长6.1%

21:35

特斯拉美股跌超3%,市值跌破5000亿美元

21:32

美股开盘:三大指数涨跌不一,联合健康涨逾7%

21:30

国信证券:2023年净利润同比增5.57%,拟10派2.7元

21:27

交通运输部部长李小鹏会见德国联邦数字化和交通部部长

4

扫描下载App