Uploads%2farticles%2f10679%2f07artificial master675
|
2016-03-07

为什么人工智能这么「蠢」,我们还常为它欢欣鼓舞?

Richard Socher 在等待自己的人工智能程序回答问题时很紧张。问题很简单:「这个网球选手戴帽子了吗?」电脑屏幕上「正在处理」的字样让人感觉时间就此停滞了,怀疑是不是死机了。然后程序给出了一个人类瞬间就能给出的答案:「戴了。」

Socher 握紧拳头,以此庆祝这一小小的胜利,他是 MetaMind 公司的创始人。MetaMind 是硅谷众多推行模式识别软件的公司之一,它们会与日益庞大的数据结合,振兴人工智能领域。公司成立于2014年,并在当年获得了 800 万美元的融资,投资人包括Salesforce 的 CEO Marc Benioff 和知名风投 Khosla Venture。

人工智能的一小步

计算机在识别图片中的物体,将人类声音转换为自然语言上,已经做得很不错了,但它在模拟人类思维进行推理上,还是跌跌撞撞。不过许机器智能软件都在采用深度学习或深度神经网络技术,逐渐让机器像人类一样解决问题。

现在,这家公司想解决人工智能软件所面临的最严峻的挑战之一。上周 MetaMind 发表了一篇论文,公布了它们在人工智能软件上的新进展。他们的软件能回答与文本文件及数字图片内容有关的问题。他们的研究很重要,因为它表明在开发能与人类进行对话互动的机器上,我们又进步了一些。

MetaMind 使用了一种名为动态记忆网络的方法,能同时处理声音,视觉和文字信息。它的软件也证明,神经网络软件技术越来越进步,拥有了记住语句序列,并专注在图片的一部分上的能力。在回答「猫尾的皮毛是什么图案?」这样的问题,程序需要只注意图片中的猫尾,并给出相应的答案。

MetaMind 的技术可用在自动客户支持等商业领域,比如,保险公司可以用它回复那些有照片附件的邮件,照片中往往会是汽车或其它财产损失的图片,是提供回复的基础。

图片来自 wired

进步的标准是什么?

当然,相比人类,这些系统还是差得远。有些团队在离散问题上取得过一些进步,但接近人类理解和推理水平的一般系统还没开发出来。

五年前,IBM 的 Watson 在问答节目「Jeopardy!」中战胜了人类,让人又苦恼又惊喜。近两年,类似的人工智能也越来越多,比如已经入驻微信的微软「小冰」,它能在许多话题上与用户进行会话。为了让小冰看起来像真人,微软以社交网站的内容为基础,开发了一个大型人类问答互动库,也正是它使得程序能令人信服地回答用户输入的问题。

2014年,Google、斯坦福等研究机构的计算机科学家在「场景理解」上取得了重大进展。他们开发的系统在组合不同类型的深度神经网络程序的输出结果后,能理解并用自然语言描述场景或图片。这些程序会用人类事先描述过的图片进行训练,然后它们就能应对新图片,用自然语言描述它。还有就是前不久,自然杂志以封面文章形式介绍, Google 旗下 DeepMind 开发的人工智能 AlphaGo,击败了欧洲围棋冠军樊麾,并将在本周和世界冠军李世乭对战。

像 MetaMind 这样的初创公司,微软、Google 这样的科技巨头,以及其它一些科研机构都在逐渐取得人工智能方式的进展,但即便只是机器视觉,也还是一个尚未完全解决的问题,就像与小冰的对话越多,就越能发现「她」并不是真正的人类。

而另一方面,关于什么是最好的技术方法,以及如何来衡量人工智能的进步,这在研究社区都是悬而未决的问题。艾伦人工智能研究所主管 Oren Etzioni 就认为,MetaMind 所用的数据集并不理想。Etzioni 正在开发的软件主要用来回答标准化的科学测试问题。

根据连线的报道,Etzioni 最近举行了一场比赛,邀请了 800 个人工智能团队参加美国中学生的科学测试,结果显示即使最好的团队,也只能答对 60% 的问题。这是因为,科学测试涉及到自然语言处、推理和对概念的理解,这些都是更为复杂的挑战,人工智能还无法胜任。

这也是为什么,Socher 会在自己的程序答对一个简单问题时,如此激动的原因。人工智能的每一次小的进步都值得庆贺,虽然我们都无法确定这算不算是进步。

题图来自 nytimes,人物为 Richard Socher
转载、采访、投稿、团队报道联系公众号:shenzhenware
版权声明:本文系深圳湾编辑创作发布,转载请注明来自深圳湾,并标明网站地址 shenzhenware.com


>>
Back to top btn