动态 | 深圳湾

我也来发布一条动态

郑锐彬

郑锐彬

兼职产品的设计

2016-08-25

雷子，你好，我对行为识别有两个疑问，想跟你交流一下。

第一：对于手势动作的识别（ReadHand），你是怎么解决多角度的识别？
目前手势识别的应用场景停留在简单交互的控制上，比如体感游戏、非触屏幕，这类场景由于限制了用户与摄像头之间的距离、角度，因此识别率非常之高，当然算法模型也就可以仅根据这类场景的样本进行训练。但如果打破这个限制，当手势与摄像头的环境变得无法控制时，同个一个定义手势，就会出现无数个视觉样本，这个时候还有可能建立起有效的训练模型吗。

第二：在人工智能的憧憬上，我比较向往电影《Her》中的OS系统，即能处理程序化的事务，也能读懂人类的心理情绪。在识别情绪上，阅面有脸部识别(ReadFace)，可以通过摄像头实时的识别人脸的情绪变化。但计算机读懂的只是一个情绪模型的置信值，计算机并不能懂人心情的缘由，因此无法精准的给出正确的反馈。我觉得这是人工智能目前遇到最大的瓶颈，不知道雷子博士对此有什么好的想法。

感谢！

来自活动: 如何给机器一双「阅面」识人的眼睛，在线对话阅面科技创始人｜连线湾星人

共 10 评论

深圳湾的炫姐姐

深圳湾的炫姐姐 10 年前

1 楼

两个问题可以拆开问哈

回复

左孝放

左孝放 10 年前

2 楼

郑总，您好！第二个问题深有同感。基于人类行为的识别，目前视觉识别技术再先进也无法满足我们人类自身思维的感知能力，我在开发人体生理信息识别方面的算法，假如能把当时人体生理信息活动的状态也置于算法库里面结合，基于个体的大数据算法分析，让机器了解个体的行为、情绪、简单思维是否有可能呢？

回复

雷子 10 年前

3 楼

关于手势识别，主流有2D和3D的方案，除了VR和AR中一些需要精确捕捉手部关节运动的应用，其他手势都可以使用2D来做。

回复

雷子 10 年前

4 楼

2D的数据量比较大，对深度学习尤其适用。影响手势识别角度的最关键的是手部检测，也就是把手从图片中检测出来。

回复

雷子 10 年前

5 楼

在样本量够的情况下，目前深度学习是有能力构建非常鲁邦的多角度手部检测模型的。

回复

雷子 10 年前

6 楼

以前3D的方法在手部检测方面比2D有明显优势，但在深度学习和大样本的情况下，这种优势正在消失。

回复

雷子 10 年前

7 楼

下面是关于第二个问题的回答

回复

雷子 10 年前

8 楼

关于表情识别，目前之所以表情识别是人脸中最难的问题。原因主要是一方面主要是因为数据的不一致，人类在某种情感上较难建立标准的定义；

回复

雷子 10 年前

9 楼

另外一方面就像你所说，机器不太能理解面部表情潜在的心情缘由。通过多模态的输入，比如结合体征特征，声音特征等对情绪进行建模，目前也有人在尝试，总体进展和实用性不大。

回复

雷子 10 年前

10 楼

人工智能目前的最大瓶颈其实是在模型本身，现在深度学习模型也只是对人脑的认知机制刻画了一个皮毛，对大脑认知结构的进一步心理学和生物学的认知，在未来会对AI带来本质的突破。

回复

Back to top btn