Uploads%2farticles%2f11092%2fnao
|
2016-09-14

创业做人工大脑,20 年的经验积累是成功的重要因素|连线湾星人

在张胜看来,强人工智能并没有捷径,而是一点点解决问题长期积累的过程。

「创业是水到渠成,多年的经验积累让灵聚在大方向和决策上没有走过大的弯路」

2013 年 40 岁的他再创业,成立灵聚信息科技(以下简称灵聚),2016 年灵聚将发布灵聚人工大脑 4.0 版,也将是灵聚人工大脑步入强人工智能阶段的奠基之作。目前灵聚的技术及产品已经实现销售收入,且在部分月份产生盈利。2016 年 8 月,灵聚已完成 A 轮融资,据了解,这笔资金将主要用于加强灵聚的研发、市场和生态链建设和布局。

灵聚致力于研发具有学习人类知识、思维能力、自然语言交互能力和主动服务能力的商用级通用核心技术――灵聚人工大脑。为服务机器人及智能设备提供核心的人工智能服务与技术支持,所有语义场景由人工大脑自动判断并直接输出最终结果。它是由灵聚自主研发的、具有全部知识产权的智能交互与机器思维技术。

深圳湾:请简单介绍一下自己吧。

张胜:我叫张胜,广州灵聚信息科技有限公司创始人兼 CEO、广东省游戏产业协会秘书长。文化部游戏内容评审专家,中国传媒大学及中国美术学院游戏专业客座教授。长期专注于中国强人工智能实用技术探索者、中国游戏问题。

曾长期担任中国软件行业协会游戏软件分会常务副秘书长一职,以及赛迪集团软件世界杂志社常务副社长兼总编辑、赛迪网副总裁、中国电脑教育报社副社长兼高级副总编辑,工信部中国电子信息产业发展研究院团委副书记等职。曾在 1997 年至 1999 年任《微型计算机》杂志编辑,并于 1999 年 5 月创办《电脑自做 PCDIY》杂志,该杂志创造了国内科技期刊创办 6 个月销量即超过 7 万/期的记录。是中国最早倡导电脑 DIY 理念的人之一。

2013 年 6 月在广州成立灵聚信息科技有限公司,专注于人工智能领域的研究和创新,自主研发多项独创技术,8 月份推出「灵聚人工大脑」。

深圳湾:早就听说这是一个草根技术达人团队,可以介绍一下你们的团队,以及你们的核心技术能力吗?

张胜:公司属于典型的老中青三代结合,两个 70 后以及一群 80 后、90 后。从创办到现在三年半以来,公司一直保持 9 个人,没有人员变动,这也是我们可以持续稳定提升产品能力的一个重要原因吧。目前比较多做语音和语义的,但我们自主研发了语义、知识图谱和核心算法,这也是我们核心技术的三剑客,我们对这三个部分采用螺旋巡回升级的方法,在架构上充分发挥了两个 70 后的经验优势和对哲学的理解,因此在某些方面处于领先水平。

深圳湾:人工大脑和其它自然语音交互系统区别在哪?未来人工大脑在人工智能领域还会有什么样的创新和突破?

张胜:人工大脑是一个完整的系统,语音、视觉、灯光、传感器、控制器、屏幕等等都只是它的输入输出方式。就灵聚人工大脑而言,语义分析、知识图谱和核心思维算法群是三大核心部分,这三个部分通过灵聚自己研发的框架完美协作。目前灵聚人工大脑(智能云)的接入接口是唯一的,不再是以一个语义场景一个接口,一段文字或指令字符串送入智能云接口的方式,灵聚人工大脑会自动分析场景,并启用相应逻辑调用对应的知识进行计算。灵聚智能云输出的是最终结果,而不是语义分析后的半成品,当然,对于控制指令和有 UI 需求的开发者来说,还需要对输出结果进行相应的开发。 

目前语义分析技术依然有很多短板亟待解决,深度学习及本地学习方面还需要进一步加强,主动思考能力也需要寻求突破。灵聚近期将为机器人和玩具产品提供第一代本地学习能力,也就是说,用户可以调教自己的机器人或玩具如何回答某个问题,或者随意修改控制指令,后续还会有持续的迭代。

深圳湾:关于强人工智能并非一蹴而就的问题,你如何理解?您对目前市场上的人工智能产品,有何评价?他们中做的最好的,会需要走多长的路,才能真正解决问题?

张胜:在过去几十年,人工智能技术已经火热过几轮了,而到了这一轮,有互联网作为坚实的数据基础,并且有强大的 CPU 作为应用基础,算法关键其实也不关键。

对于人工智能而言,任何一个单一的算法都无法解决复杂的实际问题。今年 AlphaGO 的胜利,既是算法的卓越展现,更是 CPU/GPU 性能的出色表现。总体而言,本轮人工智能技术整体还处于初级阶段,软硬件和算法都需要不断迭代和寻求突破,这个时间难以预料。

在每一次的突破后,我们都会发现,亟待解决的问题并没有减少,反而更多了。当人机智能交互技术取得突破后,我们发现麦克风成为了最大的障碍,解决了远场识别却又解决不了展会现场的降噪问题。好在现在通过大家的努力,我们可以利用有限的技术实现在商用需求下的一些功能,解决一点现实的问题,这就是进步,积跬步以至千里 。

在现阶段,声纹识别和机器视觉技术尚未达到快速、高效的效果,我认为,用情感作为宣传重点是不明智的。灵聚智能云的平均响应时间是 20ms,再加上正常的网络延迟,一般一个问题在 1 秒内就得到答复了。而视觉和声纹识别根本无法快速反馈识别结果,这将大大影响实际商用时的效果。语音技术中对语气语调的识别和具有人情味的语音合成技术尚没有商用化的成熟技术。人和人之间的交流有三个途径:语言文字,语气语调和动作表情,其中语言文字只传递约 7% 的信息量。如何通过这 7% 的手段传递情感?这本身就是个伪命题。

深圳湾:市面上很多机器人都带有一个屏幕,就像个带了机器人外壳的智能手机,你们提倡无屏化交互如何体现优势?会不会反而是少了人机交互的方式?

张胜:其实是为这些设备多了一种重要的交互方式。在创业筹备期,我们认为,今后三年将会迎来机器人的时代,而无论机器人应该具备屏幕,还是将人限制在机器人身边,都是不符合真实使用场景的,而是需要将人的双手和双眼彻底解放,不仅如此,还需要从整体架构上解决智能的问题,彻底摆脱语音命令式的交互体验。

 目前灵聚人工大脑的控制命令已不再是简单的语音语义方式,基于传统语义接口技术研发的产品已经无法满足高智能产品的指令需要,灵聚人工大脑实际上已经能提供基于上下文、多轮交互和智能场景的命令模式,能为产品提供前沿的用户体验。 例如:用户直接说:「播放下一个」、「继续」或「换一个」等指令,灵聚人工大脑会自动根据场景和上下文,知道用户的意图是要播放下一个、继续播放或换一个「电影」、「电视剧」、「照片」还是「音乐」,并将分析后的动作指令发给应用接口进行执行。 

需要特别强调的是,无屏化交互不是不要屏幕,而是不依赖屏幕,给使用者充分的自由。近期灵聚为机器人 NAO 升级的新功能就包括了机器人自动播放和讲解 PPT,期间可以随时打断提问后再继续,更重要的是,用户可以自定义使用这个功能,无需任何技术背景。

深圳湾:与其他人工智能引擎所走的通用化解决方案的路线不同,灵聚人工智能引擎则根据用户需求提供定制化的「操作系统」,通过聚焦一个又一个实用场景,在落地的过程中完成变现和复制。 两者分别有哪些技术难点?灵聚又有哪些相关的核心技术?

张胜:灵聚人工大脑的核心技术走的是通用化路线,实际上这恰恰是最难的,因此有一些友商认为灵聚太牛(疯)了。确实,我们选择了一条最难走的路,难得的是我们坚持了三年多,走出了自己的路。正因为是通用核心技术,在最后落地应用的时候,就需要做个性化定制,才能实现最佳的效果。

在现在人工智能技术的发展阶段,想靠几个算法就一劳永逸的做法是不切实际的。目前在应用层面上,并没有完善的通用技术,通用的结果可能会导致产品经理各种别扭和用户体验不佳,能通用的是核心技术。我现在常对合作伙伴说,只要你的想法没有违反自身硬件的物理规则,大胆参照科幻片和用户需求设想功能,我们大约可以帮你实现 70% 。 

深圳湾:再谈谈场景化吧。

张胜:学英语的时候都会有 XX 场景对话联系,比如购物或者商务等,其实在为人类服务时,人工大脑也需要场景的概念。其一,在不同的场景下,其实是有通常意义下可穷举的需求,便于产品经理规划和设计产品,也便于在现有技术下有针对性的完成具有商用价值的产品;其二,语言和行为都具有场景属性,比如基于不同的上下文,即使是同一词汇,用户的意图也是不一样的,在不同的场合,同样的命令词的目的也是不一样的。这里只是简单说说。

深圳湾:灵聚人工大脑(机器人小灵)目前应用最多的是在哪个领域或者行业?主要都是作为企业客服用吗?

张胜:目前使用灵聚人工大脑的机器人、玩具、智能家居产品已经或即将上市。软银公司目前唯一对外推荐的机器人 NAO 的商用化解决方案就是灵聚的,现在可以通过软银的代理商购买到灵聚人工大脑 NAO 套件。灵聚人工大脑实际上是通用技术,随着开放平台上线(预计年底),将会为所有开发者和生产者提供服务。目前灵聚的技术还没有用于专业客服领域,正在攻克这一领域的几个关键痛点,比如现在 Q 需要人工穷举。当我们能实现更好更智能的用户体验时,我们将会为硬件机器人和软件机器人同时提供专业客服能力。

深圳湾:可以介绍一下你们的合作案例吗?

张胜:灵聚人工大脑 + NAO 的组合我们称之为「机器人小灵」,目前已经被应用于银行(大堂经理助理)、学校(助教)、主持人(电视节目及活动开幕式)、智慧展厅(讲解员及活动主持人)等。 某玩具 ODM 商采用灵聚人工大脑的玩具已经批量供货。应用于智能家居方面,某著名企业的产品近期将会面世。更多的机器人正在采用灵聚人工大脑进行研发,而灵聚也在为优秀的机器人进行主动定制。机器人小灵除了 NAO 之外,还会有更多的「身体」,不久也将陆续和大家见面。

深圳湾:目前很多人聚焦在机器人的大脑的研究上,试图让机器人更聪明(虽然他们离人的智慧还相差甚远),相较于机器人肢体动能的研究上,您认为机器人大脑的研究发展速度更快呢?还是机器人肢体的研究发展速度更快?

张胜:软件的迭代成本比硬件低得多,测试和调试也灵活得多,所以人工大脑的发展速度理论上会比硬件肢体的速度快。但也不排除某个问题会困扰整个人工大脑研究者若干年的情况。总之,人工智能技术是一个系统工程,单一技术的突飞猛进并无实际价值。从我们的实践中看,开发人工大脑也不是单一的程序开发,其中需要具备哲学、心理学、语言学和教育学等方面的综合知识,程序和算法只是实现的手段。

深圳湾:下一代的新品会是什么?拿了融资后下一步的发展计划?

张胜:我们计划下个月发布灵聚人工大脑 4.0,将会有一些首次面世的新技术和性能,我们内部将其定位为灵聚步入强人工智能阶段的奠基之作。接下来我们会继续提升核心技术研发力量,完善在应用层对各个研发者的支持,同时也希望与深圳湾等优秀的平台合作,让更多的企业了解到灵聚的技术,希望通过大家的测评和指正能进一步完善灵聚的技术与服务。

原本今年我们有望盈利,融资到位后,我们调整了策略,不急于盈利,而是先让更多的产品用到灵聚的技术,所以目前我们有一系列优惠政策,包括调整了没有竞品的灵聚人工大脑 NAO 套件的价格。

以上内容,由深圳湾(微信公众号 ID:shenzhenware)根据「连线湾星人」活动的用户互动整理,转载请注明出处。

很多问题,TA 只在这个时候回答你——「连线湾星人」。每周四晚 8 点,和 100 个机器人的爸爸们对话,聊聊关于机器人产品、技术、团队、商业、创新的故事。点击这里查看最新活动预告。希望成为「连线湾星人」做客嘉宾,分享你的机器人故事,请加深圳湾 AI 机器人小炫(微信号:warexx)。

责任编辑:杨小蓝

内容来源:深圳湾

>>
Back to top btn