为什么机器学习如此成功?
虽然机器学习并不是一项新技术,但近年来对该领域的兴趣激增。
这种复苏是在一系列突破之后出现的,深度学习在语音和语言识别以及计算机视觉等领域的准确性方面创造了新的记录。
使这些成功成为可能的主要因素有两个:一是可用于训练机器学习系统的大量图像、语音、视频和文本。
但更重要的是大量并行处理能力的出现,这得益于现代图形处理单元 (GPU),这些单元可以聚集在一起形成机器学习的强大动力。
今天,任何有互联网连接的人都可以通过亚马逊、谷歌和微软等公司提供的云服务,使用这些集群来训练机器学习模型。
随着机器学习的普及,公司现在正在创建专门用于运行和训练机器学习模型的硬件。这些定制芯片之一的一个例子是谷歌的张量处理单元 (TPU),它加快了使用谷歌的 TensorFlow 软件库构建的机器学习模型从数据中推断信息的速度,以及这些模型的速度受过训练。
这些芯片不仅用于为 Google DeepMind 和 Google Brain 训练模型,还用于支持 Google Translate 和 Google Photo 中的图像识别的模型,以及允许公众使用Google 的 TensorFlow Research Cloud构建机器学习模型的服务. 这些芯片的第三代于 2018 年 5 月在谷歌的 I/O 大会上亮相,此后被打包成称为 pods 的机器学习强国,每秒可执行超过十万万亿次浮点运算(100 petaflops) .
2020 年,谷歌表示其第四代 TPU 在 MLPerf 中比上一代 TPU 快 2.7 倍,MLPerf是衡量系统使用经过训练的 ML 模型进行推理的速度的基准。这些正在进行的 TPU 升级使谷歌能够改进其建立在机器学习模型之上的服务,例如 将训练谷歌翻译中使用的模型所需的时间减半。
随着硬件变得越来越专业化和机器学习软件框架的完善,在消费级手机和计算机上执行机器学习任务变得越来越普遍,而不是在云数据中心。2018 年夏天,谷歌通过将 59 种语言的本地神经机器翻译推广到适用于 iOS 和 Android 的谷歌翻译应用程序,朝着在离线手机上提供与在线提供相同质量的自动翻译迈出了一步。
机器学习有什么用?
机器学习系统在我们身边随处可见,如今已成为现代互联网的基石。
机器学习系统用于推荐您接下来可能想在亚马逊上购买的产品或您可能想在 Netflix 上观看的视频。
每次 Google 搜索都使用多个机器学习系统,通过了解查询中的语言来个性化您的结果,因此搜索“bass”的钓鱼爱好者不会被有关吉他的结果淹没。同样,Gmail 的垃圾邮件和网络钓鱼识别系统使用经过机器学习训练的模型来防止您的收件箱中出现流氓邮件。
机器学习力量最明显的展示之一是虚拟助手,例如 Apple 的 Siri、亚马逊的 Alexa、Google Assistant 和 Microsoft Cortana。
每个人都严重依赖机器学习来支持他们的语音识别和理解自然语言的能力,并且需要一个庞大的语料库来回答查询。
但是除了机器学习的这些非常明显的表现之外,系统开始在几乎每个行业中找到用途。这些开发包括:无人驾驶汽车、无人机和送货机器人的计算机视觉;聊天机器人和服务机器人的语音和语言识别和合成;在中国等国家用于监控的面部识别;帮助放射科医生从 X 射线中挑选出肿瘤,帮助研究人员发现与疾病相关的基因序列,并识别可能导致医疗保健中更有效药物的分子;允许通过分析物联网传感器数据对基础设施进行预测性维护;支持使无收银员 Amazon Go 超市成为可能的计算机视觉,为商务会议提供相当准确的语音转录和翻译——这个例子不胜枚举。
2020 年,OpenAI 的 GPT-3(生成式预训练 Transformer 3)因其能够像人类一样写作,几乎涵盖您能想到的任何主题而成为头条新闻。
GPT-3 是一个神经网络,它在开放网络上的数十亿篇英语文章上进行了训练,可以根据文本提示生成文章和答案。虽然乍一看 通常很难区分 GPT-3 和人类生成的文本,但仔细检查 系统的产品并不总是经得起审查。
深度学习最终可以为可以直接向人类学习的机器人铺平道路,英伟达的研究人员创建了一个深度学习系统,旨在教机器人如何执行任务,只需观察人类正在执行的工作.