NeurIPS2021|一文洞悉因果机器学习前沿进展
微软中国MSDN 点击上方 蓝字关注我们
(转载自微软研究院AI头条)
编者按:近年来,因果机器学习在人工智能和诸多交叉领域产生了卓越的影响,得到了越来越多的关注。借助因果关系推理,机器学习的鲁棒性、泛化能力、可解释性等方面都将得到有效提升。今天我们精选了三篇微软亚洲研究院关于因果机器学习的 NeurIPS 2021 论文,为大家介绍该领域的最新科研进展。论文内容涵盖:在单源域泛化预测、多源域泛化预测,以及模仿学习三类任务中学习因果关系的方法和理论,并展示了利用因果关系提高模型在环境和分布发生变化时的稳健性。未来,微软亚洲研究院将进一步推进机器学习方法在更多更严苛的现实任务上的应用。
近年来,随着机器学习模型性能的不断提高,人们逐渐不再满足于它们在标准数据集上的表现,而是还希望它们能在真实的应用场景中同样具有稳定可靠的表现。但实现此目的的一个重要挑战是,真实场景中的环境情况通常与干净的标准训练数据集不同,会有数据分布的变化从而会遇到分布外样例,而模型不一定会在新环境中给出合理的结果。
这为机器学习模型带来了新的要求,即 模型需要学到做出预测或判断的本质原因和规律,而非依赖于表面“看上去”的关联关系,因为后者可能只是在特定环境下的表象,只有前者决定着环境变化之后的规律,可对分布外样例给出合理的结果。这便引出了因果机器学习这一新的研究方向。在 NeurIPS 2021 上,微软亚洲研究院的研究员们发表了一系列因果机器学习领域的研究成果。
学习用于分布外预测的因果语义表示
- 论文链接: https://arxiv.org/pdf/2011.01681
- 代码链接: https://github.com/changliu00/causal-semantic-generative-model
人们已经发现标准的有监督学习方法,特别是深度学习方法对分布外样例的预测表现欠佳。例如图1中的例子[Ribeiro’16],若训练集中大部分“哈士奇”的图片都是暗背景而大部分“狼”的图片都是雪地背景,那对于处在雪地中的“哈士奇”的测试样例,模型会预测为“狼”。若对模型进行可视化可发现模型更关注于背景,因为在这样的数据集上,背景与前景物体具有很强的关联性,并且背景是一个比前景物体更有区分度的特征,但只有前景物体决定图片的标注。
图1:分布外预测任务的挑战
基于这个因果角度的考虑,研究员们提出了 “因果语义生成模型”(Causal Semantic Generative model, CSG),如图2(a)所示(注意基于前面的考虑,图中去掉了v→y)。此外,根据上面的例子,s和v在特定环境中常会相关,例如“哈士奇”/“狼”常与暗背景/雪地背景一起出现,但此相关性并非因为两者间有因果关系,比如把“哈士奇”放到雪地中不会让它变成“狼”,也不会把背景变暗。因此研究员们使用了一个无向边来连接它们。这不同于大部分已有工作,那些工作认为各隐因子间都是独立的。
相关文章
-
微信支付锁定怎么解除
-
国家药监局公布上海新兴相关产品初步调查结果|过去24小时发生的新鲜事儿
-
9点1氪|腾讯公关总监:年终奖人均280万是不可能的;微博:2018年处置153.88亿条违法违规信息;比特大陆矿机甩卖降幅高达57%
-
同一天!抖音、微信小程序日活破2亿,头腾大战愈演愈烈
-
倾资源、投重金,屡战屡败的腾讯仍难改写短视频格局
-
孙正义"打眼"比特币!高位接盘割肉亏1.3亿美元
-
苹果产品定价过高?HomePod正在亏本销售
-
元宇宙的未来不止于Facebook的想象
-
老年人怎样到自动取款机取钱?
-
如果说比特币是场社会实验,那么区块链会走向何方?|硅谷资讯
-
疫情之下流行“云卖车”,特斯拉直营模式优势凸显
-
竞争、扶持与流量,微信小程序平台可能并非开发者最佳选择
-
LGDisplay将向韩国OLED面板生产线投资约26亿美元
-
天行健翟琨综合栏目:《暗黑2重制》D加密
-
Libra还能有戏吗
-
关于社交产品,我眼中最理想的样子(二)
-
“五一档”首日票房5.95亿;阿里回应拆分“大中台”模式:假的;Facebook称其AI技术可以更快发现仇恨言论|猬报
-
美国太空旅游公司将打造太空豪华酒店,一次费用950万美元
-
这款被黄牛炒到1000元的星巴克杯子,28日下午3点天猫开抢
-
天翼路由器怎么看几个人连接
-
【钛晨报】苹果斥资数十亿美元改进地图服务,与谷歌地图竞争;拼多多收盘暴跌近23%,创IPO以来最大单日跌幅
-
最前线|百度搜索引擎已死?王小川:欢迎使用搜狗
-
智东西晚报:华为发布Mate20X5G版苹果10亿美元收购英特尔手机芯片业务
-
突然下架!很多博兴人已经用了好多年…
-
QQ黄钻怎么领取每月的礼物
-
创业者心态不再,996余波难平
-
热点 | 斗鱼紧急裁员约70人 回应:团队正常优化调整
-
中科院院士郑建华:大数据安全仍处于积极研究,但不成熟的阶段
-
2018中国AI英雄风云榜:一起投出中国AI领军人