为什么人工智能这么「蠢」，我们还常为它欢欣鼓舞？

Uploads%2farticles%2f10679%2f07artificial master675

2016-03-07

人工智能的每一次小的进步都值得庆贺，虽然我们都无法确定这算不算是进步。

Richard Socher 在等待自己的人工智能程序回答问题时很紧张。问题很简单：「这个网球选手戴帽子了吗？」电脑屏幕上「正在处理」的字样让人感觉时间就此停滞了，怀疑是不是死机了。然后程序给出了一个人类瞬间就能给出的答案：「戴了。」

Socher 握紧拳头，以此庆祝这一小小的胜利，他是 MetaMind 公司的创始人。MetaMind 是硅谷众多推行模式识别软件的公司之一，它们会与日益庞大的数据结合，振兴人工智能领域。公司成立于2014年，并在当年获得了 800 万美元的融资，投资人包括Salesforce 的 CEO Marc Benioff 和知名风投 Khosla Venture。

人工智能的一小步

计算机在识别图片中的物体，将人类声音转换为自然语言上，已经做得很不错了，但它在模拟人类思维进行推理上，还是跌跌撞撞。不过许机器智能软件都在采用深度学习或深度神经网络技术，逐渐让机器像人类一样解决问题。

现在，这家公司想解决人工智能软件所面临的最严峻的挑战之一。上周 MetaMind 发表了一篇论文，公布了它们在人工智能软件上的新进展。他们的软件能回答与文本文件及数字图片内容有关的问题。他们的研究很重要，因为它表明在开发能与人类进行对话互动的机器上，我们又进步了一些。

MetaMind 使用了一种名为动态记忆网络的方法，能同时处理声音，视觉和文字信息。它的软件也证明，神经网络软件技术越来越进步，拥有了记住语句序列，并专注在图片的一部分上的能力。在回答「猫尾的皮毛是什么图案？」这样的问题，程序需要只注意图片中的猫尾，并给出相应的答案。

MetaMind 的技术可用在自动客户支持等商业领域，比如，保险公司可以用它回复那些有照片附件的邮件，照片中往往会是汽车或其它财产损失的图片，是提供回复的基础。

进步的标准是什么？

当然，相比人类，这些系统还是差得远。有些团队在离散问题上取得过一些进步，但接近人类理解和推理水平的一般系统还没开发出来。

五年前，IBM 的 Watson 在问答节目「Jeopardy!」中战胜了人类，让人又苦恼又惊喜。近两年，类似的人工智能也越来越多，比如已经入驻微信的微软「小冰」，它能在许多话题上与用户进行会话。为了让小冰看起来像真人，微软以社交网站的内容为基础，开发了一个大型人类问答互动库，也正是它使得程序能令人信服地回答用户输入的问题。

2014年，Google、斯坦福等研究机构的计算机科学家在「场景理解」上取得了重大进展。他们开发的系统在组合不同类型的深度神经网络程序的输出结果后，能理解并用自然语言描述场景或图片。这些程序会用人类事先描述过的图片进行训练，然后它们就能应对新图片，用自然语言描述它。还有就是前不久，自然杂志以封面文章形式介绍， Google 旗下 DeepMind 开发的人工智能 AlphaGo，击败了欧洲围棋冠军樊麾，并将在本周和世界冠军李世乭对战。

像 MetaMind 这样的初创公司，微软、Google 这样的科技巨头，以及其它一些科研机构都在逐渐取得人工智能方式的进展，但即便只是机器视觉，也还是一个尚未完全解决的问题，就像与小冰的对话越多，就越能发现「她」并不是真正的人类。

而另一方面，关于什么是最好的技术方法，以及如何来衡量人工智能的进步，这在研究社区都是悬而未决的问题。艾伦人工智能研究所主管 Oren Etzioni 就认为，MetaMind 所用的数据集并不理想。Etzioni 正在开发的软件主要用来回答标准化的科学测试问题。

根据连线的报道，Etzioni 最近举行了一场比赛，邀请了 800 个人工智能团队参加美国中学生的科学测试，结果显示即使最好的团队，也只能答对 60% 的问题。这是因为，科学测试涉及到自然语言处、推理和对概念的理解，这些都是更为复杂的挑战，人工智能还无法胜任。

这也是为什么，Socher 会在自己的程序答对一个简单问题时，如此激动的原因。人工智能的每一次小的进步都值得庆贺，虽然我们都无法确定这算不算是进步。