业界|骚扰电话太烦人?转接AI帮你回应吧
AI 科技评论按:今年 315 晚会曝光了智能骚扰电话机器人产业链,让我们意识到那些令人不堪其扰的销售来电背后,好多都是没感情的 AI。对此深恶痛绝的阿里人工智能实验室研究员聂再清决定「以其人之道还治其人之身」,近日发布一款名为「二哈」的防骚扰电话 AI 技术,让我们在接到骚扰来电时,可以选择转给 AI 代为应答。
阿里巴巴人工智能实验室近日发布的一段录音显示,「二哈」已达到以假乱真的对话水平,录音中的人类销售对此毫无察觉,不知与之对话的竟是一名 AI。
在这段长达 1 分多钟的对话中,「二哈」对答如流,不但会主动向女销售咨询「北京能不能贷款?」、「最多能贷多少钱?」,甚至还在对话中「调戏」对方:「你之前给我打过电话吧,听起来挺耳熟的?」
阿里 AI labs 北京研发中心负责人聂再清介绍,「二哈」应用了他提出的「智能聊天」概念,需要理解用户请求,用强大的知识图谱生成知识点,在对话中将知识点「输出」给用户,同时用基于深度强化学习的对话策略引导对方的问题,从而将聊天进行下去。
「大家可能看视频觉得这是一个特别逗的产品,但这里面其实应用了非常多的前沿技术。我们现在已经申请了几十项人工智能领域的技术专利,今天大家就可以在支付宝小程序和天猫精灵的 App 上『调戏』我们的这个小机器人了。」
相关技术积累
在聂再清一篇 2018 年 AAAI 录用论文中,他提出一个聊天机器人人机协作框架 CoChat,该框架可以让人类工作者随时干预机器人的学习过程,机器人能够通过从标注过的对话日志、人类工作者的反馈以及用户的反馈中学习,由此使对话质量获得持续改进。换句话说,CoChat 结合了监督学习(标注日志)以及有延迟奖励 / 反馈的强化学习(人类工作者/用户反馈),可以持续不断地自我完善。
CoChat 框架示意图
此外,该论文还进一步提出对话管理器模型 MemHRNN,可以让机器人迅速对人类提出的新问题作出回应(原来数据库所没有的)。
在具体操作上,首先将对话历史、语言理解结果和 API 调用结果等外部信息组合起来作为输入,然后输出所有动作的概率分布以用于动作选择。当出现新动作时,该 HRNN 的架构可以相应地改变,而不会丢失在之前的学习过程中积累的知识。最重要的是,聂再清团队还在 MemHRNN 中进一步引入了外部记忆来处理由即时引入新动作所导致的单样本学习难题,即这些新动作出现的次数太少,让 HRNN 难以学习与它们有关的有效策略。
论文链接:
https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/view/16748
聂再清的「实用产品」梦
聂再清此前在微软亚洲研究院主要负责微软自然语言理解、实体挖掘的研发工作。在对象级别搜索与大数据挖掘方面申请国际专利十余项。
在 2017 年年底,他选择加盟阿里人工智能实验室,当时被媒体称为「阿里达摩院成立后打响的人才强夺战第一枪。」,在业界的分量不言而喻。对于选择加盟阿里的原因,他在接受采访时表示,阿里可以让他「把一些想法做成真正影响很多人生活的一个东西。」,而到了阿里巴巴人工智能实验室的他主要专攻知识图谱与自然语言理解两个研究方向,为阿里巴巴提供包括意图理解、实体抽取、对话管理以及知识图谱在内的技术支持。
去年接受媒体采访时,聂再清总结了当时 NLP 领域的阶段性问题,并提出相应的 4 大对策,可以看作是他过去 1 年试图攻克的事情:
- 其一,从公开大数据中积累更多的可替换词典和语义模板。以「请帮我打辆车」为例,「请帮我」有很多说法,如「麻烦帮我」、「给我」等,「打车」可以叫「约车」等,这些同类词(或同义词)叫做可替换词典,它可以增强自然语言的通用性,能够很好的解决语言的歧义性问题。而语义模板侧重这句话中语义的顺序,不同顺序问答的积累,也可以解决一部分自然语言歧义性、多样性的问题;
- 其二,他希望建立一个知识图谱的生态平台,让大量的开发人员在上面去建立知识图谱,使用积累的知识图谱,不断扩大知识图谱在常识性和专业性方面的积累,即共建知识图谱,产生 1+1>2 的效果;
- 其三,随着语音交互进入千家万户,通过强化学习、深度学习等不同的策略,让机器在与人沟通中判断用户的喜好,并进行不断的自主学习和迭代,当有大量用户大量数据的时候,自然语言理解就会更准确和个性化;
- 其四,把知识库、知识图谱运用起来,让这些结构化的数据促进自然语言的理解。
因此,「二哈」如今看来令人惊叹的对话水平,其实早有相应积累。这既是聂再清加盟阿里后的阶段性成果,也是他个人「实用产品」梦的实现,让人不禁期待,他在未来又将为我们带来哪些有意思的产品。
更多有关 NLP 的学术和论文话题,欢迎点击阅读原文加入 AI 研习社 NLP 顶会小组~
相关文章
-
多行业上线算法关闭键,我们对内容的选择终于有了自由权!
-
【钛晨报】报告:女性正迅速成为农产品电商的生力军;特斯拉国产Model3长续航版确认三元电池方案
-
多地疫情迭起,健康码再次“分身”,网友:先马上
-
氪星晚报|瓜子二手车母公司获软银15亿美元投资;瑞幸咖啡欲今年赴美IPO;百度推出带屏智能音箱小度在家
-
【动点播报】苹果允许用户iOS13中删除记录,支付宝微信禁止用于虚拟币交易
-
WhatsApp可能会在今年推出加密货币
-
硕士论文被知网收录?
-
手机时间怎么显示秒
-
【产业互联网周报】腾讯投微盟及有赞,加码智慧零售;字节跳动Lark正式上线,目标海外企服
-
谷歌称首次实现量子霸权;太空旅游公司维珍银河即将上市|早8点档
-
ISSN和DOI一样吗
-
双11大促复盘PPT,京东双11店铺复盘怎么做?
-
阿伦茨现身时装秀一起和大家分享未来计划
-
「不厚道」的丰巢、「真实」的网民和「次世代」的社交
-
晓觅云|工业4.0下,中小微企业该何去何从?
-
凌晨三点开法拉利的“临时工”。
-
低成本创业写文章有助于提升我们哪些方面?有什么样的技巧呢?
-
怎么选择专业靠谱的网站开发公司
-
谷歌应用商店出现恶意App:窃取用户加密货币
-
罗永浩即将开启第二场抖音直播,带货产品提前曝光!
-
产品思考:为什么微信语音消息播放不加进度条?
-
dwg格式用什么软件打开
-
为何要进行多轮核酸检测?
-
从成吉思汗生涯瞬间来看王兴评马云事件
-
BW-20N100W+固定衰减器
-
TCL与腾讯START云游戏成立联合实验室,共建大屏云游戏新生态
-
亚马逊计划再发射4538颗卫星挑战SpaceX“星链”网络
-
微信再度推出重磅功能!还能帮助客户定制新春红包
-
聊天宝“昙花一现”,罗永浩下一站在哪?