Uploads%2farticles%2f11083%2fmachinelearning
|
2016-09-08

机器学习与预测分析:未来企业提升竞争优势的利器

编者按:本文由 Rocket Café 火箭科技评论授权深圳湾发布,本文作者 Ronald van Loon,获 Onalytica、Data Science Central, Klout, Dataconomy 等网站列为全球在资料科学、大数据、预测分析、以及商业智慧等领域最具影响力的专家之一,作品散见于经济学人、Datafloq 、Data Science Central 等专业媒体。Rocket Café 已获得作者亲自授权编译作品。

对于想在现今市场上占一席之地的企业而言,预测资料分析(Predictive data analytics)与机器学习(machine learning)都将是不可或缺的能力;正确的机器学习策略,将有助于企业在竞争中取得领先、降低成本、进而成功达到目标。

在这两方面取得优势的前提包括:

大数据

首先是有效的大数据分析;所谓大数据,指的是分析极为大量的相关资料,并从其中找出行为模式或趋势,以便让企业改善与顾客之间的关系、并且提升产和效率。

快速的资料分析

以即时方式进行大数据分析,有助于预先锁定并解决顾客关系、信息安全、以及其他多种问题。

此外,如果结合大数据方法、快速资料分析、以及人工智能技术,将能更进一步应对各种挑战、甚至预测并阻绝可能发生的错误。

机器学习

那么,所谓「机器学习」又是什么、对企业又有什么好处呢?

机器学习是人工智能之中的一门学问,它让电脑即使没有大量预先写好的程式,也能具备学习能力;也就是说,电脑可以透过累积「经验」、以及自动搜寻资料,来发掘出事物的进行模式与趋势。过去,电脑只能将这些分析后的信息提供给人类,由人类来解读和运用;但现在电脑自己也可以使用这些分析结果,来改变本身的行为。

那么,这一点对企业有什么用处?

机器学习可以运用在诸如医疗、汽车、金融服务、云端运算、以及其他许多产业之中,让相关的企业和专业人士得以提升下列这些工作的效率和品质:

  • 影像分类与内容侦测
  • 诈骗侦测
  • 脸部侦测与辨识
  • 影像辨识与标示
  • 大数据模式侦测
  • 网络入侵侦测
  • 特定目标广告
  • 游戏
  • 支票处理
  • 电脑伺服器监控

在以上这些领域的原始资料中,无论规模大小,其实都隐藏了许多不同的模式与深度信息;而企业组织如果能善用机器学习功能,就可以更快的找到未来的趋势和行为模式,并且运用在许多研究上,例如:

  • 基因定序
  • 汽车行车安全
  • 石油矿藏探勘

举例来说,英特尔(Intel)近年来开发了不少函式库和参考架构,希望能扩大机器学习的应用、并且让企业组织从中获得效益方面的提升。根据最近由 Bain 顾问公司进行的研究结果显示,采用机器学习和分析技术的企业:

  • 以资料分析结果作为基础的决策,可增加为 2 倍
  • 决策速度比竞争对手更快的机率,可提升为 5 倍
  • 上述决策的执行速度,可加快为原来的 3 倍
  • 获得理想财务回报的机会,增加为原来的 2 倍

· 机器学习能带给企业更多竞争优势

预测资料分析与机器学习的背景

我们可以说,机器学习是资料分析方法的形式之一;但它的起源在哪里?又是如何发展成现在的样子?

过去几十年来,信息科技有着爆炸性的成长;1995 年,资料储存的成本是每 GB 高达 1,000 美元,但 2014 年已经掉到 0.03 美元。也因为如此,资料科学家可以用更低的成本,来处理更多的信息;同时,神经网路科技的发展,也让资料分析和模型处理的精准度得以更高。

如同前面提到的,资料与分析方法的结合,可以为企业带来更多机会;目前机器学习技术已经逐渐进入主流,而下一步的发展,则是比过去的分析方法更上一层、也更强大的预测分析能力。

预测分析的发展路径

预测分析能力让企业不仅可以知道「刚刚发生什么事」,还可以知道「之后会发生什么事」。

机器学习是预测分析的一部分,其中又包含「深度学习」、统计、以及其他的机器学习技术;在深度学习方面,其中有许多不同层次的演算法,让机器能够循序学习不同复杂程度的资料处理问题。在统计和其他机器学习技术方面,则有其他的相关演算法,来协助机器经由范例资料来获得学习和预估的能力。

基本上,机器学习技术是以一组(或多组)资料来建立数学模型,进而用模型来训练电脑的分析能力;然后这些电脑再藉由分析更多资料来进行预测、并且评估预测的结果。

那么,有哪些场合是适用机器学习技术的地方呢?

在许多领域中,机器学习都​​可以为使用者带来竞争优势;明显的例子如:

  • 还没有人类专家的领域:例如最近对于冥王星的研究,有很大部分就依赖机器学习的成果;因为目前在这方面还没有真正的人类专家。
  • 人类无法自己解释的能力或专长:我们是如何辨识另外一个人的声音的?声音辨识是一门很深的学问,但因为辨识声音牵涉太多因素,连我们自己都说不清楚是怎么辨认出别人的声音。
  • 解决方法一直在改变的问题:在高速公路上,前一秒交通顺畅,但下一秒就出了车祸,把整条路都塞住;所谓的「最佳路线」随时都跟着周遭的状况一直在改变。
  • 每个案例都不同的解决方法:对于医师来说,每个病例都是独一无二的;每位病人会过敏的药物、症状、家庭病史都不同,治疗的方法也都必须依照个别状况来下判断。

这些只是机器学习诸多运用方式中的一些案例。

事实上,不仅对机器学习的需求正在增加,甚至已经有了一个以未来机器学习软体为核心的生态系正在持续发展,让企业组织可以享受到来自即时预测分析的效益。

· 正在逐渐演进之中的机器学习软体生态系。

在这个生态系中,英特尔已经建构了一个最广为使用的机器学习平台;其中使用的「Xeon」与「Xeon Phi」则是目前在大多数机器学习架构之中,最具成本效益的处理器。

导入机器学习的最大挑战

企业在导入机器学习工具、以期能享受预测分析优点的过程中,必须克服以下的几个障碍:

  • 了解究竟需要多少资料;
  • 导入并使用目前的资料集;
  • 聘用资料科学家,以订定最理想的机器学习策略;
  • 了解新架构的潜在需求、或是直接使用目前的架构。

如果能订定适当的机器学习策略,其实导入的障碍并不算太高;而且,如果考虑到它能降低的成本、以及提高的效率,就会发现其实不需要太长的时间就可以回本。

此外,领导厂商也正在协助建立一个容纳开发者和资料科学家的社群,以供不同领域的人士交换关于资料分析的观念。透过这些信息的交换,企业将能更加了解预测分析和机器学习的无穷潜力、并且从运用这些技术之中获益。

Back to top btn