郑锐彬
郑锐彬

兼职产品的设计

雷子,你好,我对行为识别有两个疑问,想跟你交流一下。

第一:对于手势动作的识别(ReadHand),你是怎么解决多角度的识别?
目前手势识别的应用场景停留在简单交互的控制上,比如体感游戏、非触屏幕,这类场景由于限制了用户与摄像头之间的距离、角度,因此识别率非常之高,当然算法模型也就可以仅根据这类场景的样本进行训练。但如果打破这个限制,当手势与摄像头的环境变得无法控制时,同个一个定义手势,就会出现无数个视觉样本,这个时候还有可能建立起有效的训练模型吗。

第二:在人工智能的憧憬上,我比较向往电影《Her》中的OS系统,即能处理程序化的事务,也能读懂人类的心理情绪。在识别情绪上,阅面有脸部识别(ReadFace),可以通过摄像头实时的识别人脸的情绪变化。但计算机读懂的只是一个情绪模型的置信值,计算机并不能懂人心情的缘由,因此无法精准的给出正确的反馈。我觉得这是人工智能目前遇到最大的瓶颈,不知道雷子博士对此有什么好的想法。

感谢!

3
10 评论
深圳湾的炫姐姐
1 楼

两个问题可以拆开问哈

左孝放
左孝放 10 年前
2 楼

郑总,您好!第二个问题深有同感。基于人类 行为的识别,目前视觉识别技术再先进也无法满足我们人类自身思维的感知能力,我在开发人体生理信息识别方面的算法,假如能把当时人体生理信息活动的状态也置于算法库里面结合,基于个体的大数据算法分析,让机器了解个体的行为、情绪、简单思维 是否有可能呢?

雷子
雷子 10 年前
3 楼

关于手势识别,主流有2D和3D的方案,除了VR和AR中一些需要精确捕捉手部关节运动的应用,其他手势都可以使用2D来做。

雷子
雷子 10 年前
4 楼

2D的数据量比较大,对深度学习尤其适用。影响手势识别角度的最关键的是手部检测,也就是把手从图片中检测出来。

雷子
雷子 10 年前
5 楼

在样本量够的情况下,目前深度学习是有能力构建非常鲁邦的多角度手部检测模型的。

雷子
雷子 10 年前
6 楼

以前3D的方法在手部检测方面比2D有明显优势,但在深度学习和大样本的情况下,这种优势正在消失。

雷子
雷子 10 年前
7 楼

下面是关于第二个问题的回答

雷子
雷子 10 年前
8 楼

关于表情识别,目前之所以表情识别是人脸中最难的问题。原因主要是一方面主要是因为数据的不一致,人类在某种情感上较难建立标准的定义;

雷子
雷子 10 年前
9 楼

另外一方面就像你所说,机器不太能理解面部表情潜在的心情缘由。通过多模态的输入,比如结合体征特征,声音特征等对情绪进行建模,目前也有人在尝试,总体进展和实用性不大。

雷子
雷子 10 年前
10 楼

人工智能目前的最大瓶颈其实是在模型本身,现在深度学习模型也只是对人脑的认知机制刻画了一个皮毛,对大脑认知结构的进一步心理学和生物学的认知,在未来会对AI带来本质的突破。

Back to top btn