【好想讲英文】暑假不论好玩还是无聊、重修还是延毕,各种情况都

暑假结束了,回到学校要聊什幺?这集的好想讲英文 Albert & David带你走完四个场景,还提供

2020-06-12技术评论

131浏览

什幺都不用做,一直看就对了!Netflix怎幺打造世界上最精


什幺都不用做,一直看就对了!Netflix怎幺打造世界上最精
〉〉一直看一直看就对了!Netflix 怎幺打造世界上最精準的推荐引擎?用科技找出顾客喜欢的电影类型

一九九九年,包括哈斯汀在内、创办网飞的软体工程师打算建立一个推荐引擎时,刚开始的方法相当幼稚,是透过共同属性,即类型、演员、导演、背景、喜剧或悲剧,来将电影分类。随着电影库存增加,这种方法被证明既繁琐又不精确,因为无论赋予每部电影多少属性,都无法判断《麻雀变凤凰》和《美国舞男》的差别所在。这两部电影都由李察.吉尔主演,都和卖春有关,也同样以美国大城市做为背景,但是两者不可能吸引到同一批观众。

早期的推荐引擎无法进行预测。广为人知的一次失误是,沃尔玛网站推荐电影给寻找「黑人历史月」相关电影的购物者,结果推荐的竟然是《决战猩球》,该公司不得不发表道歉声明,并且终止搜寻引擎。

接下来,网飞软体工程师转向一个「最接近」的演算法,这种演算法主要是根据顾客的电影爱好来分组,而不是将影片的关係相互串连。

到了网飞奖公布时,订户已经对六万部电影与电视节目进行十亿次评分,这是一个丰富的资料集,只是 Cinematch 未能探究到其中微妙之处。

「贝尔科」及其他团队从零开始,写出各自的推荐演算法,而且他们在短短几个月内,就经历网飞花了好几年时间才度过的学习曲线,之后更加以超越。他们建立的演算法,发现了庞大的资料集中沃林斯基、贝尔及科伦完全陌生的领域。演算法分析根据订户评分建立的模式,为每部影片指派专属的「描述子」1,这些描述子比导演、演员和类型等标籤更丰富也更精确,对于人类思维却没有实质意义。

例如,贝尔注意到,这个演算法「学习」到:喜欢伍迪.艾伦电影的订户,往往只关心他创作的特定类型电影,因此不会再推荐他导演的其他作品。

第二年,比赛的进展趋缓,尤其是「贝尔科」在网飞奖规则要求的一篇论文中,不小心洩露解决方案,只能眼睁睁看着别人藉助他们的方法逐渐逼近。贝尔科的进度在 Cinematch 的八.六%改进率上停滞不前。

第二年过了将近一半,科伦在雅虎的以色列研究中心找到工作,他不确定自己未来的发展方向,只好在离开前全力解决这个难题。他们的发展动能,时而缓慢增加○.五个百分点,时而慢慢提升○.一个百分点,于是贝尔和沃林斯基转而关注排行榜,寻找能带领他们走出低潮的新血。

一个被称为「大混沌」的新团队,由两个年轻的奥地利数学家组成,根据「贝尔科」在第一年的成果为基础,排名正在飞快上升,他们引起贝尔和沃林斯基的注意。在一场为了观察双方对问题的解决与个性是否吻合的科学「相亲」中,贝尔向「安德瑞斯.托雪与麦可.亚赫里尔推荐研究」这个团队发送电子邮件,探讨合作的可能性。在一连串的电子邮件后,「贝尔科」团队确信托雪和亚赫里尔会坦诚以待,于是双方在跨越大西洋的电话中同意联手,成为「大混沌中的贝尔科」团队。

他们接着开始寻找会影响人们用特定方式进行电影评分的环境与心理因素。订户在週末评分时,会比平时宽容还是更严苛?一次为很多部电影打分数,会有什幺后果?人们是否会根据心情而给出不同的评分,如果是的话,又要如何加以量化?严苛或宽容的个人性格,是否会随着时间产生变化,如果是的话,变化的方式与原因又会是什幺?

每个问题都变成跟自身相关的一个有待测试的方程式,在结果一致且相关的情况下,这个方程式会被併入构成制胜公式的方程组中。

由于对 Cinematch 的改进,只增加了令人痛苦不堪的○.五和○.一个百分点,有少部分的电影仍然难以分类,并在第二年成为横亘在网飞奖参赛选手及一百万美元支付日之间的主要障碍。这些电影通常具有讽刺性或争议性,到底算是杰作还是垃圾,观众与影评人有截然不同的看法。

这类电影的代表性作品,是独立製作的荒诞片《拿破仑炸药》,以及具有政治倾向的电影,如麦可.摩尔执导的纪录片《华氏九一一》,讲述针对纽约和华盛顿的恐怖攻击,还有第二次伊拉克战争。为《心灵侦探社》、《爱情不用翻译》、《海海人生》和《受难记:最后的激情》等类的电影评分,当存在风险时,对于评分的众多订户会站在哪一方的预测能力就会下降,因为之前的评分并不会呈现人们对这类电影的感受。

贝尔推论,《拿破仑炸药》问题的解决方案,不仅在于找到近似的电影,还要在不够了解某个订户的情况下,让演算法全部进行预测。这样的结果,可能会形成一个这样的方程式—忽略了那些评分过低,或者对某类型电影评分太高,或是少数评分一直忽高忽低的订户。

儘管第二年有了开创性见解,但团队也只在前一年的进展基础上勉强提高了一%。「大混沌中的贝尔科」再次获得五万美元的进步奖,他们拿到的奖项越来越多,还包括前一年赢得、放在美国 AT&T 香侬实验室大厅的好莱坞星光大道之星的俗气複製品。

网飞的贝内特,很怀疑是否有团队能得到百万大奖。比赛在同年一月再次隆重启动。随着各团队为了赢得大奖,拚命拉近与「大混沌中的贝尔科」成果相差不到一%的差距,导致排行榜上竞争激烈。

各团队开始大规模结合,希望结合彼此的方法,有助于跨越最后几个千分点的差距,超越一○%的临界值。「大混沌中的贝尔科」也开始寻找新思维,他们找到两个法裔加拿大软体程式设计师马丁.沙贝尔与马丁.皮奥特强大得多。」沙贝尔说。

他们的创造力,让这个现在称为「贝尔科的实用主义混沌」联合团队的改进速度,提高了关键性的○.六五%,让他们得以在二○○九年六月二十六日,突破一○% 这个临界值。

按照网飞奖的规则,在为期三十天的最后挑战期,参赛团队可以挑战贝尔科可能胜出的提案— 这也让该团队的所有人伤透脑筋。几个名列前茅的团队结合为「大合唱」团队,并于二○○九年七月二十五日,提交一个比贝尔科领先○.○四%的解决方案。

在竞赛结束前手忙脚乱的二十四小时,科伦和大混沌团队持续保持联络,努力从方程组中提高○.一或○.二个百分点的预测能力。他们交出了最后、也是最好的解决方案,各自在四个国家等待竞赛落幕。二十分钟后,「大合唱」的结果,似乎比贝尔科领先了○.○一%。

比赛结束大约一个小时,网飞陷入沉寂。正在西雅图享受家族旅游的沃林斯基,每隔一段时间就会溜到旁边确认电子邮件,没想到却一无所获。当初他们赢得两项进步奖时,网飞在数分钟内就会发通知。

心情沮丧的沃林斯基,与回到纽泽西州的贝尔及其他团队成员交换意见,决定要把手机关掉。只是,他还是忍不住点选了「重新整理」键,电子邮件下载时,他终于看到了网飞的讯息:他们赢了。

更先进的推荐系统诞生了

「贝尔科的实用主义混沌」团队成员第一次见面,是在纽约市四季饭店的记者会上接受哈斯汀颁发奖章,与会的有美国 AT&T 实验室主任、哈斯汀、网飞技术长杭特、「大合唱」成员,还有一群採访记者。

哈斯汀本来不想到纽约召开记者会,希望在洛斯加托斯举行,但是史瓦塞坚持这幺做。

史瓦塞知道,这个奖项及其将近三年来的争夺者,已经吸引全世界科学界与众多一般人的关注。他们的成就,值得透过全面性的正式典礼加以庆祝,仪式上要有演讲、颁发金牌奖章给优胜者,还要与记者完整对话。

典礼结束后,获胜团队召开技术简报会议,说明他们如何获胜。到场人数已经让史瓦塞非常兴奋,所有媒体几乎都愿意留下来,听取极其晦涩且长达一个小时的介绍,让他喜出望外。这场活动凸显出史瓦塞三年来在幕后所做的扎实工作,他激发了媒体对一场科学竞赛产生兴趣。为了庆祝自己当天成功製造头条新闻,他从四季饭店的转角处走出,独自享用价格不菲却平淡无奇的寿司晚餐—所有乐趣宣告结束,让他感到有点凄凉。

网飞奖的记者会,及其网路横幅广告、醒目的道具和高科技硬体,后来成为低调的网飞国际服务发表会的範本。

贝尔和沃林斯基并未留下这笔奖金,而是捐赠给各自想捐助的慈善机构。根据竞赛规则,美国 AT&T 授权网飞使用胜出的演算法,并应用到自己的 U-verse 电视服务中,以监测使用者的收视习惯,推荐他们可能喜欢的节目。

这次比赛打造出先进的推荐系统,能从行为线索中读取人们的电影喜好,也不再需要评分系统过多的输入资讯,特别是搭配一个影片串流应用程式时。例如,这个系统可以快速推测:特定订户在週间的某几个晚上看喜剧、在週末尽情欣赏以警察为主角的电视影集,或是在特定演员或场景出现时,倒带观看剧情的情况。

「我们在获取你的喜好资讯,而你什幺都不用做。」沃林斯基在比赛结束后这样告诉我。订户甚至不需要再为电影评分,因为植入机上盒或网飞网站的一个程式,就会监测他们观看的节目与电影,以及观看方式,进而分辨订户的选择是否值得记忆,以及如何在串流资料库提供的电影複製这个经验。如果演算法精确的机会比失误来得多,就具备了一个成功品牌的要素—消费者的信任。

Cinematch 演算法代表了行销和技术的紧密结合,赋予网飞如此非凡的成就。由于消费者在有限的 DVD 资料库中找到想要的东西,就会离开录影带门市,并且上网追随网飞。他们对网飞的信任,让公司得以将电影租片模式顺利转向影片串流,而这曾是许多企业惨遭滑铁卢的领域。

什幺都不用做,一直看就对了!Netflix怎幺打造世界上最精

相关文章