对话翁嘉颀:畅聊竹间智能情感计算技术与商业落地|CCF-GAIR2018:亚博APP手机版

亚博APP下载

亚博官方手机版-(公众号: ) 2018年全球人工智能和机器人峰会(CCF-GAIR )在深圳开会,峰会由中国计算机学会(CCF )主办,香港中文大学(深圳)主办,得到宝安区政府的大力指导,与国内人工智能CCF-GAIR 2018沿袭了前两次的产品线,包括一个主会场和11个专业球场(仿生机器人、机器人行业应用、计算机视觉、智能安全性、金融科技、智能驾驶、NLP、AI、AI芯片、IoT、 会后对翁嘉颉进行了一对一的采访。 竹间智能于2016年正式成立,主要进行文本分析、自然语义解读、情感计算。

竹间智能主要有两条产品线。 一个是类脑对话机器人,包括顾客支持机器人、购买机器人、金融机器人、营销机器人、个人助理、品牌IP机器人等。

一个是多模式情感识别系统,包括情感识别分析系统、面部表情识别系统、印象分析系统、广告效果分析系统、呼叫中心质量检测系统、授课情感分析系统等。 现在,很多实现交互式人工智能的公司都专注于文本,但竹间智能的多模式情感识别包括文本、语音、面部表情等多个模块。 这次采访翁嘉颉也主要围绕感情计算技术和商业化落地两个方面。 翁嘉颉显然,嵌入分为三个层次,最下层是自然语言处理,第二层是意图解读,第三层是解读背后的意思,现在行业还停留在前两个阶段,进行第三阶段不可避免的是感情计算。

感情计算的难题不仅是正确解读单一模式的感情,而且是在多个模式的感情发生冲突的情况下,正确判断哪个感情是现实的。 比如,一个人的声音感情高兴的时候,脸上的表情终究是生气的。 他是高兴还是生气? 更浪费的是,AI知道人的心情后,会有什么反应,如何向心情低沉的人请愿? 竹间智能以电影《Her》的智能机器人赛曼莎为模型,指出机器人能看到脸的表情,不能听到人类的对话,从一开始就致力于多模式感情的计算。

创始人简仁贤从一开始就不仅仅关注手机和扬声器上的智能语音助理,还关注卖场和零售等场景。 在这些场景中,只有文字和声音的交互太多,视觉似乎是必不可少的。 但是,现在除了零售场景,还需要寻找感情计算的落地场景,但是在家庭等很多个人场景中,机器人很难拒绝安装照相机。 翁嘉颉指出,现在的语文和文本技术需要特定领域的领导人解决问题。

所谓特定领域,可以预约酒店,参观餐厅,和人进行自然的对话。 而且,必须按照机器人的逻辑对人说话。

未来,每个人都有自己的智能助理,你的感情,你的意图,老板,你需要照顾日常生活。 每个企业都不存在顾客服务机器人,今后用户的智能助理和企业的顾客服务机器人工作的可能性很高。 在这些场景中,大公司和创业公司都有机会,没有能够解决问题的所有技术和场景。

以下采访了原文,展开了不改变本意的编辑和整理。
竹间智能现在管理什么样的工作? 进入竹间前你的工作经验怎么样? 翁嘉颉:我从1982年开始专门从事计算机,27年前就知道人工智能了。

当然,那个年代没有实现人工智能。 因为那时的人工智能已经走下坡路了。 当时做AI的人大部分都转到了搜索引擎。

因为搜索引擎和文本分析有一定的关系。 我在搜索引擎领域做了大约11年,这次回归人工智能。 这次AI不要再泡沫化了。

那是我知道有必要进入人类的生活。 我大约两年半前重新加入竹间智能,现在兼任公司CTO,管理技术部分,设计竹间现在的对话整体结构、模块的表现、模块的相互作用等,对外项目整体落地:能明确说有哪个模块吗? 翁嘉颉:聊天机器人大致分为三类,第一类是功能型机器人,可以像SIRI、微信语音助理一样,画布天气,画布股票,可以设置一些警告。 第二个是知识型。 陆奇在哪里工作? (这是仅次于昨天的消息,他再次参加做了很多)可以回答陆奇离开百度后,股票下跌了多少(三天内下跌到大约18点)。

三是闲谈,可以和人类进行感情对话,进行剧本式聊天。 如果你对机器人说你的爱,我们希望机器人如何恢复,如何控制整个对话语境的话题。 我管理的是整个对话的过程控制。 例如,如果用户说了一句话,机器人必须判断是继续执行任务,获得科学知识还是打开闲谈。

因为所有的模块都可以触摸。 这和搜索引擎一样。

百度的搜索引擎背后大约有300多个模块。 谷歌背后大约有500多个模块。 今天,只不过有300多个模块给出了答案。

答案出来后,怎么整合和排序答案? 第一页应该看什么,第二页应该看什么? 那个聊天机器人也是,聊天机器人更严格。 我听不懂一百个词,所以一句话也听不懂。 这个时候我应该选哪个词听? 那不是更生动,那么死板,但听起来太奇怪了。

这是整个对话都在控制。 现在有像微软公司的小冰一样同时发展IQ情商的对话机器人。

另外,一些创业公司更横向地主导任务型或科学知识地图领域。 竹间智能向哪个方向发展? 翁嘉颉:微软公司的小冰融合智商和情商的概念是正确的。 竹间智能的创始人简仁贤也是微软公司小冰的创始人之一,他于2015年从微软公司创立了竹间智能(Emotibot ),公司名称的命名是“感情机器人”的意思。

竹间智能只不过比微软公司的小冰早了一年半制作感情机器人。 情妇和感情不是一样的意思。 我的意思是情妇知道解读你。

我侮辱你。 我用冰冷的冰问东西。

那当然包括计算感情。 在文字感情方面,一些企业完成了、胜、中三类分类。 微软公司的小冰可能达到了六种。

竹间智能在文字感情上完成了22种分类。 我不能更准确地观测无聊和嫉妒。 光靠文字感情太多了,我们还实现了声音、表情感情。

比如,一个人说我在中学录了500分,这个时候你不知道是应该接受还是恳求恭贺,所以你必须传达语气。 一般来说,声音的感情不比文字感情的最重要度强,信号更令人厌恶。 脸上表情的感情必须简单。

我说话到一半的时候,我的脸可能变形了,所以我的嘴正好张开,这时拍的并不意味着我现在很惊讶。 那么,把文字、声音和表情混合起来就更容易了。
我经常推荐的例子,我带着笑容,回来的同事说你死了,表情的感情和文字的感情发生了冲突。

这个时候我该怎么办? 这是多模态感情的概念,你现在的感情是文字、声音,再加上人脸的表情,混合整体,各有各的权重。 一般来说,文字的比重不低一点。 声音不是最低的。 人脸上的表情列在中央。

在刚才的例子中,我笑着说你死了,这是看上下文。 如果前面的两个人说很有趣,我突然笑着说你死了。

亚博APP手机版

我想那是在威胁你。 所以,这种感情不仅仅是看文字。 感情计算这个概念最近大家说了很多,你能谈谈这个概念的解读吗? 翁嘉颉:感情计算是MIT教授Rosalind Picard明确提出的,他是感情计算的始祖。

而且,现在我一般把嵌入分为三个层次,最低层次称为自然语言处理。 比如说“我饿了”,“我想以后吃”。 这两个词的句法分析不同。

这是最低的水平。 第二层称为意图解读,这两句话不同,但意图完全一致。 那个意图可能代表你想订购店内或者去附近的哪家餐厅。

而且,第三层是背后的意思,现在谁也做不到。 我今天在这个地方,我们第一次见面时,如果我突然告诉你我饿了,我相信你的心太好了。

你总是说实话。 我是来吃饭的吗? 如果我告诉女同事我饿了,她真的是我约她来睡觉还是有错误的企图? 有不同的场景,有不同的人,谈什么情况,某种程度的事情,只是背后的代表意义不同。

现在大家还在达成第一层和第二层。 我怎么正确区分句子? 我如何使句法结构正确? 在这方面,国内哈佛大学有很多专家。

第二层的意图解读也有很多人在做。 现在可以用得差不多了,但对电视和扬声器说“请唱某人的歌”,教我听音乐。

那你对扬声器说“谁的歌好”并不意味着听他的歌。 今后不要让我听他的歌。

现在可以正确理解这些句子的意图。 第三层,背后的意思。 我说我饿了,这句话的背后确实有什么意思呢? 那就走到这一步,感情计算不可避免,整个场景,情况不可避免。 现在竹间智能有融合文字、声音、人的脸来计算感情的落地场景吗? 翁嘉颉:我来说说我们老板夏普电视做新零售的例子。

夏普有一家新开业的百货商店分店。 那家百货公司总共有五家买电视的商店。 开业前三天,夏普的销售额为90万,其他四家一起的销售额只有40万,夏普的一家达到了其他四家的合计。 这个是怎么做到的呢? 我们在卖场门口敲大电视屏幕,可以拍所有路径的人的脸,可以识别男/女、长发/短发、年龄、表情、颜值等,很多人停下来看。

然后根据用户图像展开不同商品和宣传活动的介绍。 这样,进店的人流就比别人多5倍。 进店后,我们有无人值守的智能货架。

上面有平板,照相机。 如果照相机看到长发女孩回来,智能架子就不积极说话。 “这个女人,你的头发很漂亮。

这里有洗发水、保护法和润发的产品。 你有兴趣吗? ”。 如果照相机认识到女孩的脸上有黑色斑点,就不会自动介绍遮瑕膏等产品。
如果对方对此有所不同,以后就不会成为话题了。

如果照相机发现消费者的脸色看起来更漂亮,就不会暂停话题。 所以,我发现这种情况下的交互还包括人的脸、声音和文字。

现在的对话式人工智能主攻语音,竹间智能为什么从一开始就尊重视觉? 翁嘉颉:我们的交互式人工智能创意主要来自电影《Her》,里面的智能助手赛曼莎能单方面感受用户的状态,看用户的表情听用户说。 无论是谁的交流,声音都是最重要的,但往往一言不发,一个表情就足够了。

比如,你遇到商店,看到某个产品藏着讨厌的表情,那只不过说明你显然不讨厌这个产品。 所以那时,做的时候,一跟着第一个,我们就有图像处理,声音处理,文字处理。

当时上司(简仁贤)已经在想他将来的场景。 除了内置在手机中的扬声器中,还包括进入卖场。 视觉是必不可少的部分。

所以最初上司的野心很大。 文字、语音、面部多模式情感计算的课题在哪里? 翁嘉颉:大课题自不必说,当一些感情发生冲突时该怎么办? 如果你说文字中很高兴,声音也很高兴。

亚博APP手机版

脸上的表情也很高兴。 那没关系。 小学生也说那很高兴。 那个声音很生气,文字很高兴。

比如,我生气地说:“今天很开心。” 接下来是什么意思? 要解决问题,首先文字、脸、声音的感情识别是正确的,另一个是一些感情冲突的时候,我到底谁多呢? 一般来说,声音感情占了更大的比例,但说到声音感情生气,自信的程度只有3~4分,文字说你高兴,自信的程度是99分。

这个时候该怎么办? 另一个最重要的地方是整个方案。 虽然有三种多模式的判别,但是仅部分段不太准确。 也看看倒数的方案。 人的感情变化不太快,当然,有时一瞬间也不惊讶。

瞬间不生气,但你生气了下一秒突然反高兴,所以必须考虑倒数的感情整体。 最后,最好的地方是智能助理找到你的愤怒和悲伤,怎么安抚和恳求你,感情识别结束后,该怎么办? 多模态感情计算的方案在你们现在的业务中能占太多的比例吗? 翁嘉颉:现在智能电话大部分都没有视觉,后来智能电视、冰箱、扬声器也没有照相机,但你家有很多摄像头,很担心,这个同意侵犯了你的隐私。 在公共场合,例如有外面的卖场、银行、照相机和监视照相机,这些人拒绝接受。

比如,我去试镜的时候,照相机对着我,然后在这里说话的时候,老板我在做面部分析。 这感觉有点奇怪,但恐怕不能接受。

人们对照相机的接受程度必须看场景,也可能必须看年代。 不同年代拒绝接受的东西不同。

你知道像现在的70多岁一样,不用手机吗? 电脑不能用。 这可能是不可接受的。

大家都用APP吗? 我还是习惯用电话说话,用电话交流。 不是在app上,而是在网上交流。 可能是五六十岁的一代,他可能只是习惯了搜索引擎。

因为他长大的年代没有搜索引擎。 而且,四十多岁的人,APP的比例远远多于二十多岁的人。 所以,这个还得看。 未来的一些变化,有些场景拒绝接受,有些场景不拒绝接受。

像现在这样几个扬声器已经有屏幕了,有可能添加到视觉中吗? 翁嘉颉:现在可能特别难买。
一般来说,照相机特别好的话,再盖一个盖子。 你可以盖这个盖子,盖照相机。 我必须告诉用户这里有照相机。

另外,也可以安装盖子,以便在适当的时间复盖照相机。 这个用户可以拒绝接受。 如果你突然不特别照相机,你的成本就会增加,反而购买不好,大家真的不是这个扬声器在做什么吗? 然后扬声器至少说OK,我一移动它,照相机就知道你不是把照相机放在家里的天花板上,那一点隐私都没有。

如果是机器人呢? 有与人眼相近的眼睛。 翁嘉颉:我们看科幻电影的时候,大家都拒绝接受。 机器人能走你家吗? 但是挂了这样的机器人,知道照相机在你家旁边,你的心现在应该太难受了。 竹间智能有机器人工厂,如果协助企业定制的话,会不会让每个定制的机器人都有自己的个性呢? 翁嘉颉:现在我们要做得更简单。

机器人有机器人的属性。 机器人叫什么名字? 是男孩还是女孩? 你今年几岁? 晚上不睡觉吗? 宽度是什么样子的? 爸爸是谁妈妈是谁从哪里来的? 我们不会根据大家最常听到的这些问题来展开原作。 另外,有个机器人的风格很坦率,有个机器人很可爱。 这个现在做了几个电源。

有些机器人可以开玩笑。 另外,有些机器人受不了天气。 我们尝试下一步,有没有你自己的机器人,我拿着你平时和你朋友聊天的一些数据展开训练,自学你说话的方法,你拿着你的机器人,用你的风格聊天这个步骤在技术上不现实,现在只是数据量的问题。

我必须得到足够的数据,让那个机器人慢慢变得像你的不道德。 但这也是你是否愿意公开你的隐私,你和你的朋友聊天的对话是你的隐私。

这是在实验中吗? 翁嘉颉:我们两年前结果了。检查过了,但找用户没有这个耐性。 可能会花很多时间,你教孩子几年? 十几年,二十年,对吗? 你能教机器人有那么多耐性吗? 你教两天左右就没有耐性了,所以这是耐性的问题。

现在像微软公司的小冰一样,向人工智能的创作发展。 她不会写诗,不会唱歌,不会写新闻。 在这一点上,你们想怎么做? 翁嘉颉:只是写诗,对联来说,这个玩性相对不低。

因为那只不过是在非常有限的方向上解决问题。 从冷笑的角度来说,这些很好。 大家都不太新鲜。

但是,从简单的观点来说,实现这个需要怎么解决问题,为我赚钱呢? 现在没用。 当然,小冰的定位是陪伴。

就是让你那么无聊。 这个花哨的反而是好事,可以合作。 竹间智能从一开始就把重点放在商业化上吗? 翁嘉颉:没错。 我们必须回到商业化这个地方,所以可以制造有趣的机器人。

只是不能收钱。 微软公司不介意,所以微软公司有Windows、Offices这样的利益业务,可以冷笑小冰。 在现阶段,交互式人工智能想超过什么水平? 翁嘉颉:我真的现在需要在技术水平上由特定领域的领导人解决问题。

特定的领域意味着预订酒店和开餐厅。 那可以解读我的对话。

开餐厅的机器人必须解读特定的语言,比如“七八个有两个孩子”和“七八个有两个孩子”。 这两个词意思不同。

一般需要说明,据说并没有各种各样的说法。 例如,“父母和老板的女朋友在一起”意味着需要多少座位? 他不是在教他四个你,他是在教他奇怪的文字。

那么,在这个领域中,必须让机器人听到人类的语言,而不是让人类适应环境机器人,让机器人理解。 我真的是未来。

每个人都有自己的机器人。 那个机器人会告诉你兴趣。 老板说我不喜欢开店。 他说他讨厌你什么都不吃。

我不讨厌什么都不吃。 还有,昨天说前天什么都不吃。

亚博官方手机版

今天不要长得一模一样。 我跟他说了老板。 我给妈妈打电话吧。

他告诉我妈妈指的是谁。 然后告诉你妈妈的电话,几点打电话比较好,他可能会警告你。 现在太晚了,妈妈早就睡了。 今后每个企业可能都有自己的机器人,比如麦当劳。

可能有订购的机器人。 老板管理订单。 如果你有自己的机器人,麦当劳就有机器人。

将来可能是机器人和机器人的交流我只要对我的手镯说,老板就点巨无霸吧。 然后告诉他巨无霸是麦当劳,跑去找麦当劳的机器人,两个机器人不一定用人类语言交流,不要用他们的方式交换信息,麦当劳处理了这个订单,扔掉了在这样的未来图中,大公司占有终端的优势,创业公司的机会在哪里呢? 翁嘉颉:微信是很天然的入口。 因为大家现在都习惯关闭微信了。

例如,在微信上,“这个月用卡翻了多少钱? ”。 微信的机器人教你三张卡:招行,交行,浦发的卡,去找这三个机器人。 老板制作身份证。 你不需要进入三家银行的APP。

微信机器人需要告诉他三家银行的信息。 当然,入口需要小公司保护,但意思解读,微信一家不能。

腾讯一家做不到。 我的意思解读包括说所有的邀请、工行和浦发,之后这个机器人也必须拒绝接受这些指令。 或者拒绝接受自然语言。 这不过是家家户户都要合作的东西。

竹间智能简仁贤:千篇一律的聊天机器人| Chatbot之流探索自然语言处理的商业落地:从基础平台到数据算法| CCF-GAIR 2018微软公司: IQ兼情商的语音助手少女歌手小冰教记) 以下,听取刊登的心得。。

本文来源:亚博官方手机版-www.ettikajewelry.com

相关文章