业界|骚扰电话太烦人?转接AI帮你回应吧
AI 科技评论按:今年 315 晚会曝光了智能骚扰电话机器人产业链,让我们意识到那些令人不堪其扰的销售来电背后,好多都是没感情的 AI。对此深恶痛绝的阿里人工智能实验室研究员聂再清决定「以其人之道还治其人之身」,近日发布一款名为「二哈」的防骚扰电话 AI 技术,让我们在接到骚扰来电时,可以选择转给 AI 代为应答。
阿里巴巴人工智能实验室近日发布的一段录音显示,「二哈」已达到以假乱真的对话水平,录音中的人类销售对此毫无察觉,不知与之对话的竟是一名 AI。
在这段长达 1 分多钟的对话中,「二哈」对答如流,不但会主动向女销售咨询「北京能不能贷款?」、「最多能贷多少钱?」,甚至还在对话中「调戏」对方:「你之前给我打过电话吧,听起来挺耳熟的?」
阿里 AI labs 北京研发中心负责人聂再清介绍,「二哈」应用了他提出的「智能聊天」概念,需要理解用户请求,用强大的知识图谱生成知识点,在对话中将知识点「输出」给用户,同时用基于深度强化学习的对话策略引导对方的问题,从而将聊天进行下去。
「大家可能看视频觉得这是一个特别逗的产品,但这里面其实应用了非常多的前沿技术。我们现在已经申请了几十项人工智能领域的技术专利,今天大家就可以在支付宝小程序和天猫精灵的 App 上『调戏』我们的这个小机器人了。」
相关技术积累
在聂再清一篇 2018 年 AAAI 录用论文中,他提出一个聊天机器人人机协作框架 CoChat,该框架可以让人类工作者随时干预机器人的学习过程,机器人能够通过从标注过的对话日志、人类工作者的反馈以及用户的反馈中学习,由此使对话质量获得持续改进。换句话说,CoChat 结合了监督学习(标注日志)以及有延迟奖励 / 反馈的强化学习(人类工作者/用户反馈),可以持续不断地自我完善。
CoChat 框架示意图
此外,该论文还进一步提出对话管理器模型 MemHRNN,可以让机器人迅速对人类提出的新问题作出回应(原来数据库所没有的)。
在具体操作上,首先将对话历史、语言理解结果和 API 调用结果等外部信息组合起来作为输入,然后输出所有动作的概率分布以用于动作选择。当出现新动作时,该 HRNN 的架构可以相应地改变,而不会丢失在之前的学习过程中积累的知识。最重要的是,聂再清团队还在 MemHRNN 中进一步引入了外部记忆来处理由即时引入新动作所导致的单样本学习难题,即这些新动作出现的次数太少,让 HRNN 难以学习与它们有关的有效策略。
论文链接:
https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/view/16748
聂再清的「实用产品」梦
聂再清此前在微软亚洲研究院主要负责微软自然语言理解、实体挖掘的研发工作。在对象级别搜索与大数据挖掘方面申请国际专利十余项。
在 2017 年年底,他选择加盟阿里人工智能实验室,当时被媒体称为「阿里达摩院成立后打响的人才强夺战第一枪。」,在业界的分量不言而喻。对于选择加盟阿里的原因,他在接受采访时表示,阿里可以让他「把一些想法做成真正影响很多人生活的一个东西。」,而到了阿里巴巴人工智能实验室的他主要专攻知识图谱与自然语言理解两个研究方向,为阿里巴巴提供包括意图理解、实体抽取、对话管理以及知识图谱在内的技术支持。
去年接受媒体采访时,聂再清总结了当时 NLP 领域的阶段性问题,并提出相应的 4 大对策,可以看作是他过去 1 年试图攻克的事情:
- 其一,从公开大数据中积累更多的可替换词典和语义模板。以「请帮我打辆车」为例,「请帮我」有很多说法,如「麻烦帮我」、「给我」等,「打车」可以叫「约车」等,这些同类词(或同义词)叫做可替换词典,它可以增强自然语言的通用性,能够很好的解决语言的歧义性问题。而语义模板侧重这句话中语义的顺序,不同顺序问答的积累,也可以解决一部分自然语言歧义性、多样性的问题;
- 其二,他希望建立一个知识图谱的生态平台,让大量的开发人员在上面去建立知识图谱,使用积累的知识图谱,不断扩大知识图谱在常识性和专业性方面的积累,即共建知识图谱,产生 1+1>2 的效果;
- 其三,随着语音交互进入千家万户,通过强化学习、深度学习等不同的策略,让机器在与人沟通中判断用户的喜好,并进行不断的自主学习和迭代,当有大量用户大量数据的时候,自然语言理解就会更准确和个性化;
- 其四,把知识库、知识图谱运用起来,让这些结构化的数据促进自然语言的理解。
因此,「二哈」如今看来令人惊叹的对话水平,其实早有相应积累。这既是聂再清加盟阿里后的阶段性成果,也是他个人「实用产品」梦的实现,让人不禁期待,他在未来又将为我们带来哪些有意思的产品。
更多有关 NLP 的学术和论文话题,欢迎点击阅读原文加入 AI 研习社 NLP 顶会小组~
相关文章
-
马云都忍不住炫耀的礼物,被他做成了刺激又好玩的生意
-
苹果前置摄像头打不开是什么原因
-
深度资讯|双十一争夺战:主流电商争论“二选一”,短视频抢市场
-
荣耀五年启示录:是什么成就了荣耀?
-
多行业上线算法关闭键,我们对内容的选择终于有了自由权!
-
美国组团围剿华为:要求盟国弃用,听话能得补贴
-
微博账号怎么养才能权重高?下面几步告诉你
-
LTC≠CRM——两者关系浅谈
-
营销观察|推出随心飞,东航在618呼唤现金流
-
你能想象iOS14是什么样子吗?
-
【虎嗅早报】京东获苹果授权下调iPhone8/8P售价
-
全国动态ip地址修改器是什么?
-
各短视频平台大战春节,派发35亿元掀起红包大战
-
Nature发文硕士谈回乡当公务员:科研经历是笔宝贵财富
-
王健林瘦身、张近东增肥,苏宁易购吃下万达百货
-
印度人为中国手机花了5千亿卢比:小米收入4倍于华为 排名第一
-
专访阿里巴巴段玲:买到就是赚到的 88VIP 会员是如何诞生的?
-
高通不卖5G芯片给苹果是自媒体在造谣!
-
蜂窝网络数据漫游什么意思
-
Lyft终于上市了,但它更说明网约车真的不是一个好生意
-
产品经理如何快速成长
-
科技神回复|京东取消快递员底薪,都是兄弟哪能不给东哥两肋插刀?
-
谁在购买微博、微信流量?
-
iPhone缺乏创新,转型服务遭质疑,库克能带领苹果再创辉煌吗?
-
高质量短视频需要满足哪几个条件?
-
【钛晨报】特斯拉二季度交付量达9.52万辆,创新高;日本移动运营商重启华为P30销售;北京取消手机一卡通开卡费
-
热点|人人车回应“破产”传闻:消息不实
-
AI金融交流群开放!周三将开讲《开源GPU数据科学平台RAPIDS在金融风险评估中的应用》
-
对纳入整治的网贷机构进行股权冻结?这政策深圳只执行了1天