【新旧约全书】Holy Bible, Chinese Union Version (GB), Textfile 20010201.

我与你不一样的美国生活

10年前来美国,去了一个缅因的乡村高中。这是一个完完全全按照我自己的意愿选的地方。除了学校质量,AP课等等常见的中国人的硬性要求,我额外加了两条:1.要在北方,冬天下大雪能下一米深的那种地方。2.要在村里,越偏僻越好,最好人比动物还少的那种。结果真还让我找到了那么一个学校,家里也...

2023年8月17日星期四

大数据与算法:Netflix们是如何比我更早知道我的性取向的?

 

Ellie House

图像加注文字,

BBC记者艾莉·豪斯

BBC记者艾莉·豪斯(Ellie House)出柜后,发现Netflix似乎早已知晓此事。这是怎么发生的?

Short presentational grey line

我在大学二年级时意识到自己是双性恋,但科技巨头企业似乎在此之前几个月就已经弄明白了。

在那之前,我有过一个长期男朋友,并且一直认为自己是直的。说实话,那时约会并不是我的优先项。

然而,就是那段时间我看了很多Netflix影片,而且我越来越多地收到包含女同性恋情节或者双性恋角色的电视剧推送。

这些电视剧都是那些和我年龄相仿、背景相似、观影历史相似的朋友们没有被推送的,甚至连听都没听说过。

其中一部特显眼的剧叫做《情牵你我她》(You Me Her),讲述了一对城郊的已婚夫妇如何接纳第三者进入他们的关系。这部剧充满了非异性恋情节和双性恋角色,被形容为电视界的“第一部多性别浪漫(polyromantic)喜剧”。

Ellie House looking at Neflix

不单是Netflix。我很快就在其它好几个平台上也看到了类似的推送。Spotify向我推荐了一张他们称之为“莎孚式”(sapphic)的歌单——这个字眼是用来形容喜爱女性的女性。

几个月后,在TikTok上,我开始在我的动态中看到来自双性恋创作者的视频。

又过了几个月后,我从另一方面意识到,我自己是双性恋。这些科技平台到底发现到了哪些我自己没有注意到的迹象呢?

当用户遇见内容

Netflix在全球有2.22亿用户,有数以千计的电影和剧集供用户观看,类别无穷无尽。但是,每个单独用户平均只会在一个月内观看六个不同类别的内容

为了向人们展示平台认为他们会想看的内容,Netflix使用了一个强大的推荐系统。这个算法网络帮助决定将哪些视频、图片和预告片摆放在用户的首页上。

例如,《情牵你我她》被标记为类别码“100010”——显示在人眼前的标签则是“LGBTQ+故事”。

推送系统的目标是将使用平台的人与内容相匹配。

这个数字媒人会收集两边的信息并建立联系。比如一首歌的类型、一部电影所探讨的主题、电视剧中的演员,所有这些都可以被标记。在此基础上,算法会预测出一个人最有可能被什么内容吸引。

“大数据就像一座巨大的山脉,”Netflix的前高管托德·耶林(Todd Yellin)在网站“Future of StoryTelling”上的一段视频中说道,“借助成熟的机器学习技术,我们试图找出哪些标签能起作用。”

Ellie House checking her data

但这些平台对用户的了解有多少,以及它们是如何了解的呢?

根据英国的数据隐私法规,个人有权知道一个机构如何掌握关于他们的数据。许多流媒体和社交媒体公司都已经为用户创建了一个自动化系统,来请求获得这些信息。

我从八个最大的平台上下载了自己的全部信息。脸书(Facebook)一直追踪我访问过的其它网站,包括一款语言学习工具和酒店预订网站。它甚至有我家地址,存放在一个名为“位置”的文件夹中。

Instagram列出了300多个它认为我会感兴趣的不同主题,用于个性化广告。

Netflix向我发送了一份详细记录我观看过的每条预告片和节目的电子表格——什么时候、在哪种设备上观看,以及是自动播放还是我自己选择点击的。

没有证据表明这些平台标记过任何与我的性取向有关的内容。Spotify在给BBC的一份声明中表示:“我们的隐私政策概括划定了Spotify收集用户数据的范围,其中不包括性取向。此外,我们的运算法不会根据用户听音乐的偏好来预测性取向。”

其它平台也有类似的政策。Netflix告诉我,比起年龄或性别等人口数据,用户观看什么内容,以及如何与应用程式进行互动,是判断他们口味的更好指标。

重点不在看什么,而在如何看

剑桥大学的运算化社会心理学博士生格雷格·塞拉皮奥-加西亚(Greg Serapio-Garcia)表示:“没有人明白地告诉Netflix,他们是同性恋”,但是平台可以观察那些喜欢“非异性恋内容”的用户。

用户不一定要曾经观看过被标记为LGBT+的内容,才会接收到这些推送。推送系统会比这更加深入。

根据格雷格的说法,一种可能性是,观看某些并非专门涉及LGBT+的电影和电视剧也会帮助算法预测“你喜欢非异性恋内容的倾向”。

一个人看什么,只是运算方程式的一部分;很多时候,一个人如何使用平台更加能说明问题。

Presentational grey line

更多关于科技与生活的报道:

Presentational grey line

其他细节也可以用来对用户进行预测——比如,他们连续观看内容的时间比例,或者他们是否看完片尾字幕。

格雷格说,这些习惯本身可能并不意味着什么,但是数以百万计用户综合起来,它就可以用来作出“非常具体的预测”。

于是,Netflix的运算法在预测我对LGBT+情节的兴趣时,或许并不仅仅是基于我过去观看过的内容,它还会关注我何时点开它,甚至是我在哪种设备上观看,以及何时观看。

对我来说,这只是关乎好奇心,但是格雷格认为,在同性恋行为非法的国家,这有可能给人们带来潜在危险。

在与世界各地的LGBT+人士交谈时,我听到了彼此矛盾的讯息。一方面,他们常常会喜欢流媒体网站上推荐的内容——甚至可能觉得这是在解放他们。

但是另一方面,他们感到担心。

“我觉得这是对我们隐私的侵犯,”一位男同性恋人士告诉我(出于他的安全考虑,我们保持匿名)。

“它给了你更多认知,了解在自由的情况下,你的生活会是怎样的,那种感觉很美好,”但是,他补充说,“算法确实让我有一点害怕。”

没有评论:

发表评论