塑造生活的4种机器学习算法

软件变得越来越聪明。这是一个缓慢,不平衡的过程-但似乎也势不可挡。机器学习的艰辛问题一一落到了功能强大的新理论工具上,使我们能够构建可以做一些真正令人印象深刻的事情的软件。

诸如无人驾驶汽车之类的某些应用程序已经使用了几年时间关。但是,您可能没有意识到,机器学习已经在您身边,并且可以对您的生活产生令人惊讶的影响。不相信我吗?您可能会感到惊讶。

让我们从一个明显的例子开始。

内容推荐

当您浏览Spotify或Netflix或亚马逊的Kindle Store时,机器学习算法在看着你。这是他们的工作-他们需要信息为您提供建议,这是一种无处不在的机器学习技术,以至于您可能从未想过。

无处不在-很有可能,您消耗的大多数媒体这些算法已经为您选择了最近几年。

如果考虑一下,这种建议似乎是不可能的。计算机程序如何知道您会喜欢 The West Wing ?看了吗?马丁·辛(Martin Sheen)对巴特利特(Bartlett)总统的细微描写是否具有人性?笑话了吗?难道Janel Moloney会受到影响吗?

事实证明,这些算法完全不具备这些功能。相反,他们完全基于使用对内容进行排名。这些算法会忽略内容的实质,而将重点放在什么样的人喜欢什么,以及他们喜欢什么其他东西上。

By looking at what you already like, the algorithm can figure out which of its learned stereotypes you most resemble, and makes very accurate guesses about your tastes. Do you like The Daily Show, Cabin in the Woods, and House of Cards? Well, an awful large proportion of the people in that category like The West Wing. Odds are, you will too.

Interestingly, this previously-universal approach is starting to change, as we reach the limit of what you can figure out from usage patterns. There are real limits to what you can do with this kind of algorithm. Just for starters — how do you rank new content that has no views yet?

还有回报递减的问题。 Netflix擅长推荐,但使用现有技术并不会变得更好。 2009年,Netflix进行了100万美元的竞争,以寻找其推荐算法的高级版本,而获胜者仅将推荐提高了10%。从那时起,改进幅度甚至很小。在某个时候,要做得更好的唯一方法是实际教会计算机理解艺术。

所以,这就是科技公司正在做的事情。

去年,一个Spotify实习生名为Sander Dieleman的他们的数据库应用了一种强大的机器学习技术,称为“深度学习",使程序可以学习分析音乐。神经网络会自动识别出音乐中的独特模式,而只使用原始音频数据。

一个低级神经元仅响应颤音唱歌而发射。在网络中更深的是一个神经元,它学会了识别基督教岩石。另一个因芯片音调和8位音乐而开除。另一只只为阿明·范·布伦(Armin Van Buren)开除了。许多其他人都没有名字,但仍然表达了音乐的一些有意义的性质。 ,有关此的博客文章非常有趣-请继续阅读。)

所有这些功能共同为推荐提供了更丰富的依据,因为该系统不仅可以推荐其他人喜欢的歌曲,还可以通过推荐他们来推荐歌曲它们的实际抽象属性。 Spotify尚未将其推广给消费者,但这只是时间问题。目前,要充分利用Spotify需要一些特定的技巧和专有技术。将来,它可能会自动发生。

对于电影来说,是否可以这样做?

这并非不可能。 Google已经有一种算法,可以很好地理解照片,以相当准确的程度用英语描述照片。谷歌研究员杰弗里·欣顿(Geoffrey Hinton)被称为“神经网络之父",他在Reddit AMA中表示,如果我们没有能够描述五年内电影事件的算法,他将感到失望。这种分析能力将是Netflix可用于提出更明智的电影推荐的大量附加信息。

高频交易

我们要研究的另一个领域经常不考虑算法交易。 2012年,所有股票市场交易的一半是通过计算机程序进行的。为什么?因为人类很慢。市场事件可能发生在毫秒级的时间范围内。人类甚至无法解释快速而少的信息。

高频交易将这些财务决策置于可以预测股票行为并据此进行买卖的计算机算法的手中。尽管他们缺乏交易员的判断力,但他们的速度使他们获得了对人类来说太快的机会。

算法交易以各种不同的方式影响您的财务生活。您的投资存在于几乎可以通过算法解决的市场中。它们以好的和坏的方式改变市场的动态。它们提供了更多的流动性和缓冲波动性,但同时也带来了一定的风险。

算法交易引入了全新的金融犯罪。 2010年,一个使用大量自动化算法来企图非法操纵市场的交易者意外地引发了数万亿美元的市场崩盘-股市在几分钟之内下跌了约9%。

具有讽刺意味的是,崩溃是由于合法的交易算法抛售头寸以应对跌势而加剧的。因为他们中的许多人当时都使用类似的算法,所以他们彼此依赖,形成了一个负反馈回路。尽管市场很快恢复,但惊人的波动表明我们对这些算法的控制程度是多少。

广告

广告很难。消费者善变,需要行贿,受宠若惊,或以其他方式操纵他们购买产品。当您必须与他人进行大规模交流时,有效地操纵他人是有局限性的。人们是不同的,相同的产品和消息不会吸引所有人。

不用说,互联网和计算机的存在从根本上改变了广告主的游戏方式。现在,广告商可以将消息精确地定向到特定的人,从而准确地确定他们的需求。为此,他们依靠机器学习算法来查看某人的浏览和购买习惯,并推断出他们将来可能会购买什么。

这些算法的强大功能被证明具有鲜明的效果在这起臭名昭著的案件中,塔吉特(Target)统计学家安德鲁·波尔(Andrew Pole)与他人分享了一起情况,塔吉特(Target)经理遭到一名愤怒的父亲的殴打,他抱怨说他的十几岁的女儿正被送去为孕妇设计的优惠券小册子。经理道歉,父亲离开了。经理打电话跟进时,他惊讶地听到父亲的道歉,因为他发现Target的机器学习软件是正确的:他的女儿怀孕了。

这是事件之一,据Pole说,导致Target开始隐瞒其机器学习算法的有效性。普尔认为,

“对于遵守所有隐私法,我们非常保守。但是,即使您遵守法律,也可以做一些让人不安的事情。 […]然后,我们开始将所有这些广告混合在一起,因为我们知道孕妇永远不会购买,所以婴儿广告看起来很随意。 […]我们发现,只要孕妇认为自己没有受到监视,她就会使用优惠券。她只是以为她街区的其他人都收到了相同的尿布和婴儿床邮件。只要不吓到她,它就可以工作。"

换句话说,定位算法是如此强大,Target必须主动隐藏其准确性,以免吓到客户。这些算法可以对我们购买的商品产生强大的影响,并且(当正确使用时)它们是完全不可见的。

网络排名

我们一直在听到有关“趋势",“爆发"或“病毒式传播:Google,Reddit,Twitter,Tumblr和Facebook。这些网站中的大多数都使用机器学习算法的变体来确定您做什么和看不到,并且这些算法对哪些故事“传播"和哪些故事没有影响。

对于大多数这些网站,他们用来对内容进行排名的算法都是专有的–商业秘密。

对于Reddit而言,用于控制将哪些帖子发布到首页的算法非常复杂,试图使游戏变得更加困难的极不成功的尝试。 Twitter和Google也是如此。所有这些都有点令人震惊,因为这些东西可能起着很大的作用。

根据心理学家罗杰·爱泼斯坦(Roger Epstein)的说法,Google对Pagerank算法的选择可以单方面决定全球四分之一以上总统选举的结果。这是一件软件的全部功能。

学习热爱算法

摆脱所有这些的教训是'恐慌。我们已经将权力让给机器人已有一段时间了-除了少数例外,世界似乎仍然运转良好。

但是,目前几乎没有理由储备罐头食品和shot弹枪。

了解这些算法对您生活的影响程度确实值得。他们代表谁的利益?您的选择自由吗?

您如何看待?该软件令人毛骨悚然吗?有趣?在评论中让我们知道!

图片来源:通过Shutterstock的木偶姿势,通过Shutterstock的机械臂

标签: 人工智能 技术