主题演讲2：有情感的人工智能

尊敬的用户您好，这是来自FT中文网的温馨提示：如您对更多FT中文网的内容感兴趣，请在苹果应用商店或谷歌应用市场搜索“FT中文网”，下载FT中文网的官方应用。

【Maja Pantic】：（翻译室没有声音）所以机器能够有能力去做相应的反应，我们也管它叫做人工智能，首先来看人脸的识别，其实我们也是看到，当你看到一些人的时候，你通过它脸部的一些特征来去识别它，同时要看到年龄、性别、是否长的很漂亮，甚至可以通过人脸一些特征判断一些它的特点。这里我们可以看到是我们自己大脑里面去识别的，可以看到它的态度，看到人的特征。

这是在人脑中来进行一个处理，我们可以看到这种人脸一个识别，它的意义是什么？我们完全可以用到知识，用到很多的方面。我们可以知道人们在反应中，尤其对各种刺激有不同的反应。

我们其实在这方面做了很长时间的学习和研究，我们也取得了一些进步，尤其就这个人脸识别方面。我们希望能够进行一个交换，例如说可以和车、机器人进行交互，任何一个机器人可以进行时时的交互。我们可以看到这些结果，它可能是相当的复杂。

正是我们目前做的这些工作，人的这些表征，我们其实过去二十年做这方面的研究，你可以看到我们有不同的方式可以做人脸的识别，最先进一个技术，我们能够去识别人们的人脸的图片。同时得到一些相应的信息，并且我们可以看到这样一个配比率可以达到98%。同时最难的是这样的行为模式，也就是说你通过识别人脸一些特征识别它的性格，这个是很难。你可以任何一个人脸的表述，可以知道它的喜好，我们怎么样人工智能提高这方面的准确率，这也是要求相应一个技术，你可以我们在这里，包括像一些面具的测试。我们可以看到有不同的结果反馈和不同的教会，有不同的特征去进行验证。

我们可以看到这里人脸识别（图片），首先你能够在屏幕中锁定这个人脸，你可以看到它的一些特征，尤其是显著特征。比如说我们可以看到像脸、眉毛、鼻子特征，我们可以看到其他的特征，如果想进入深入学习，你可以看到它的一些额外的细节的捕捉，你追踪所有的特征，你可以看到这些特征有什么变化，尤其做不同表情的时候，我们分类这些所有的表情的变数。

我们可以看到这些不同步骤，我们追踪了很长时间，这是不同的追踪器，这是最成功的应用。可以看到右边这块，通过追踪器，它能够在不同的光线下面，也能够去识别人类的表情。那么我们在左边这个角落，这个是非常受欢迎的，你可以看到它的应用很广泛。你可以看到最右边下面是我们最准确地一步，它现在也上市了。你可以看到它的追踪器和我们的摄影机是相连的，你可以用到很多方面。

那么，这样我们要把追踪谱或者这些变化把他们应用起来，我们喜欢的方法就是说，我们对他们的脸部肌肉进行捕捉，有43种动作单元，我们可以脸部肌肉可以生成42种动作，比如说额头上有一个长肌肉，你让中部激活，我们称为动作一，它会造成我们的眉毛上扬，实际上你对这个肌肉外部进行激活，你会看到你的外部眉毛上扬，把整个肌肉激活让你造成1+2这个动作。问题在于我们有一万多种表情，这是我们的面部表情，实际上每天用到上千种表情。比如说从一万到七千种表情，降到42个动作组合，实际上把这些动作，它的强弱程度加到系统当中去，我们就会生成复杂的系统。

比如说在每一个表情当中，我们都可以生成面部表情编码系统，这个是我们对表情自动识别系统隐性的方法。左边是动作一，它是针对内部眉毛，你看到在很多情况下，这种惊讶，或者是我们想强调的时候，我们可以用上内部眼毛的肌肉，还有下巴上扬，我们在怀疑的时候，欧洲人怀疑的时候会抬起下巴。另外是4号这个动作，这个就是皱毛，就是生气的时候有的表情，而且有压力，我们也会用眉毛动作表现出来。

我们用两种方法来识别自动表情识别系统，比如说通用型这种表达。我们有人类学家告诉我们，这个世界上每个人展现出同样的表情，而且另外一个人在全球都能普遍出表情，但是实际上有人说，在不同文化背景来的人，他们识别表情方式是不一样的。比如说拿南欧人，北欧人也有差异，更不用说亚洲人，欧洲人表情差异。我们常用的两种方法就是这个表情是正面的，还是负面的，另外一个维度它是否激动。

我们把这些表情放在维度上面，你可以看到多出这些表情，一般来说都是占了维度的四分之一。那么就是说生活当中，还是表现出各种各样的表情，但是你可以看到表情集中这里面的四分之一。

我们为了识别这些表情，我们需要用表情判断他们的行为。一个就是我们的这种兴趣的唤起，比如说当判断人们如何对一种故事作出反应的时候，我们会用这种兴趣表情来进行判断，你可以看到左边的视频，就是说我们可以时时去分析一种冲突，或者冲突的升级。在这里面我们有三个政客在讨论一个问题，他们都有自己很鲜明的观点，你可以看到一开始的时候，一个人在说话，后来他的声音越来越响，然后开始做一些表情，其他政客开始作出了反应，他们开始同时说话，一般来说这就是冲突很明显的表现。

实际上这里有很多的应用环境，一个非常成功的应用环境就是市场分析。比如说我们和一个公司合作了一个项目，这个想法就是用表情判断这个产品或者人们对这个产品的反应，就是说我们有这个大市场的分析，我们把这个产品呈现给不同的人，我们在观察这些人对产品的反应，一般来说80%情况下，一般来说他们就没有什么反应，但是在20%情况下，你会看到有一些反应。这些就是给我们带来好的销量这样一个机会。我看一下这里的20%的机会，这就是给我们带来销量的机会。

另外一个项目关于研究人们兴趣，我们在线上进行医生和病人之间一种远程的诊疗。他们讨论病人病情。因为这是我们的远程诊疗，我们用摄象头来拍病人的表情，也拍下病人额外的表情，比如说痛苦，女士可能是肩膀疼，医生问他，你能不能把胳膊抬起来，想看看肩膀多疼，他想这么做，我们就可以去平衡，我们可以测量痛苦的程度，还有就是抑郁症。西方国家有很严重的抑郁症的问题，尤其是老年当中，抑郁症甚至影响35%老年人口。还有更大问题是工作人口，在西方国家实际上给我们带来上千亿美金的损失。一般大家不愿意讨论自己的抑郁的病情。

比如说我们老年人口比较多，接下来二十年当中，老年人他们痴呆也是越来越严重，我们用这个系统帮助我们应对这些老年人的病情。我们想用对他们表情的判断他们的病情，这种判断比人类自己判断准的多。偶然差多在每一秒可以观察到18到20贞这样一些信号，很多是微妙的信号。我们通过微妙信号判断他们的抑郁，或者是痴呆病情。有时候看他们微笑的质量而不是数量，一般来说他们往往微笑完了之后，一般来说他们微笑面孔突然耷拉下来，我们就是用耷拉机会拿来分析他们的病情。实际上这种系统可以做到非常准确地判断。

说到对痴呆的判断，我们一般会观察他们眼睛的变化。我们人眼是观察不到细微信号。我们就是用摄象头来拍下人们眼部的变化。我们在每一秒可以观察到40贞微妙的信号，当然有的时候看网速。

你可以看到CBS在伦敦，这是我们另外做的工作，你可以看到我们之间分析他们脸部特征，我们研究他们的表情，我们可以看到他们在老年人家中，让他们照顾年幼的孩子，看到他们的反应，通过我们这样一个软件，可以客观分析他们的反应，同时通过这种客观的分析，我们让他们先去看，可以看到他们的结果，我们可以看到基本上，我们的准确率可以达到90%。这个是做了三个星期，我们可以看到两位年老人士他们的反应，我觉得他们的表情还是比较明显的。

你可以看到有一个是有抑郁症，另外个是没有的。你可以看到下面这位女士是有抑郁症？，上面这个是抑郁症吗？这两个女士哪一个有抑郁症？上面的女士反应比较消极，他们看有意思的影片，他们的表情告诉我们他们的状况。这是我们做的另外一个项目，这是关于发展孩子的艺术天赋，你可以看到鉴别特别特征和反应的时候，我们去分析，我们通过机器和软件能够去教他们，其实我们所有的软件是很稳定的。当我们看到这些孩子很开心的时候，尤其挥动他们的手的时候，他们就是表达他们很开心。我们可以看到他们很开心。这个时候表情是笑的，我们能够去强调它这样表贞的变化，像头的动作，或者眉毛的动作，都能够预测你的表情。这些表情是脸上各个部位共同去运作，不光眉毛能够表达一种表情，我们通过这些机器人就能够教这些孩子特定的表情和表述。

我们现在目前有不少项目，这个是来针对手机一些数据，你可以看到拿着手机做脸部的识别，我们还有不同的这些条件分析，你可以看到有反光，包括可能有一些噪音的数据。

这些都是很难的，我们希望解决这些问题。另外一个就是自动嘎是得应用。我们知道在特斯拉里面，实际上有很多外部的传感器，但是车内没有传感器，因为实际上我们想要至少要知道驾驶员是不是看着路，实际上我们目前内部并没有传感器能够捕捉到这些信息，去年特斯拉请我们给他们提供这样一种在车内使用的识别技术。这个是也是非常重要的。

就是基于摄象头这种咨询，我们可以用在很多环境下，比如说培训人们谈判技术，面试的时候也可以使用这样的技术，我们对会议进行分析，我们觉得这个报告很重要。就是亲密关系的识别或者友好关系的识别非常重要。我们知道75%病人，他们在投诉医生的时候主要是投诉医生对他们不够友好，因此这种和谐友好关系的识别也很重要。

【提问】：你的这个演讲非常有意思，作为一个外行，我特别喜欢看电视，我想起了电视《对我说谎》，我觉得这种识别技术很重要应用环节就是执法，警察想知道你是不是在说谎，或者说实话，这个会影响一些法律的问题，你们这个研究有没有达到这个层面，有没有考虑执法方面使用？

【嘉宾】：大家都想知道对方是不是在说谎，我们并没有这样的数据，我们也不会有这样的数据。问题在于人类，实际上专家可以判断对方是不是在说谎，它的判断准确率才是60%，还有就是生理层面，我们判断这个人是不是说谎话或者准确率，从生理层面才有70%，我不想在这个领域进行开发，因为准确率是不太高的。谢谢！

主题演讲2：有情感的人工智能

热门文章

相关话题

数百万劳动者陷入“竞业禁止”陷阱

面对俄罗斯威胁，波罗的海国家着手升级防御设施

Lex专栏：生成式人工智能到底有多“开放”？

乌克兰的防空困境显示了以色列面临的风险

富裕投资者在通胀风暴中扩大财富

Lex专栏：大学捐赠基金可能需要告别“耶鲁模式”