迷雾画仙迷雾画仙06-13 14:40

朱军、张长水、林宙辰共话机器学习无人区,下一步的突破在哪里?

朱军、张长水、林宙辰共话机器学习无人区,下一步的突破在哪里?


大数据文摘出品

记者:蒋宝尚

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。

机器学习的发展进程决定了人工智能产品的落地的进度,那么这两年机器学习究竟有哪些进展?

6月10日,国际电气和电子工程师协会(IEEE)和国际模式识别学会(IAPR)双料会士颜水成、林宙辰教授、国内机器学习领域的青年领军人物朱军教授、清华张长水教授共聚北京,在“智源学者候选人发布暨学术报告会”上,对机器学习的最近进展以及接下来的突破方向给出了观点。

以下是圆桌会议速记,大数据文摘做了不改变原意的编辑与整理。

机器学习最近两年的进展:理论和应用兼而有之

颜水成:今天就讨论三个题目。

一、过去两年你认为机器学习最重要的进展是什么;

二、接下来的两到三年的里面在哪些方向最有可能取得突破;

三、对学生有一些什么建议。

张长水:过去两年里,机器学习或者人工智能有很多令人激动的工作,只不过可能每个人关注点不太一样。比如机器翻译,国内有个团队在做翻译的一种模式非常棒,比如说英文和德文翻译,我们传统做法就是我们准备大量的语料,训练一个模型。

这个团队考虑到了英文翻译成德文,同样的语料还可以德文翻译成英文;不仅这样,我们还可以考虑对任何一句英文没有德文对应的情况下,我们要求它翻译过去再翻译回来还是原文,对于德文来说也是这样,翻译到英文再翻译回来,这样我们就少了大量的标注数据,但是通过优化方法,加了一些目标函数约束,使得它对于数据要求只有原来的10%。

在我们实际的研究中,往往会发现很多问题,其实问题之间有很多的共性,包括数据和模型上的应用。将很多问题结合在一起,这样的工作不只是理论上分析的很漂亮,关键很使实用,就是理论和应用两者兼有之。

朱军:我认为一个比较重要的是:不确定性计算方向。在最近的数学家大会上,大家有一个观点:因为对不确定性的计算没那么重视,所以当前的机器学习很多东西都做错了。我们很多时候都在通过做预测得到结果,很少分析,比如说结果可信的程度到底是多少。所以实际从统计学上来看的话,一些统计学家会认为机器学习领域有欠缺。

但是实际上一些研究机器学习的学者有统计学背景,很多都在做这个方向,例如概算编程的框架。这从编程角度来看是比较重要的进展,就是说编程主要是用神经网络等方法在拟合的时候做不确定性计算。

未来几年,可能在应用上和实际问题结合里面是一个比较重要的时期。因为像无人驾驶,做决策等这些场景我们需要更好地刻画在位置环境里面的不确定性。所以不确定性是接下来的研究重点。

林宙辰:我个人关注理论方面,过去两年虽然大家都很关心这方面的研究也越来越多,我可以看到,大家对于这个深度学习越来越接近现实,现在不仅仅是模型,现在还没有产生,但是进展还是蛮大的,尤其是像一些理论科学家,还有一些数学家慢慢加入这个团体,他们也意识到这个深度学习构建一个环境是非常重要的一个事情。

另外,深度学习和符号计算的结合最近也显现出了苗头。虽然还很初步,但这是未来巨大的方向,你不可能全部都依靠数据来进行驱动,你要达到这种递进或者人工智能的话,必须在符号运算方面有一定的能力。

颜水成:我认为特别有三点,前面有一些经典的算法,其实是已经在那儿了,但是那些算法其实让我们真的解决问题的话,其实在本身的能力方面还有很大的欠缺。传统的一些理论上已经很完备了,深度学习的这个进步的话,真的可以解决我们觉得非常现实的这种问题,所以深度学习可能是接下来的发展重点。

勇闯研究无人区,令人瞩目的研究并非一蹴而就

第二个问题是关于机器学习无人区的。北京的学者会勇闯哪些机器学习的无人区呢?

林宙辰:我觉得还是在基础理论这个方面,还有一个大场景的应用方面,这两个方面我觉得我们后可以取得很好的成就。

朱军:这个不太好预测。

张长水:我想从突破上来说,看起来有很多的偶然性,但是我们现在回想起来,如果我们看深度神经网络这段热潮之前,很多工作都有前面的很多影子,比如说卷积层,那也不是说一蹴而就的事,很多的工作多年积累出来这样一个工作,当然我们会有几个英雄的人物,此外还有很多人不懈努力的结果。

所以我觉得比较值得高兴的是,虽然这两年都有很多热潮式、跟风式的研究,但是我们也看到有很多很踏实的研究,包括在北京,包括我们身边,其他别的科学院都有,还有一些学校,也许那些不在我们这里,但是我知道他们真的很深入地在做研究,我觉得这些都是很好的苗头。

也许过了这两年,我们没有看到哪个工作更光鲜,像一盏灯一样去带着全世界往前走,但是我们知道积累的这些工作也许会在三年以后、五年以后对我们的年轻人和学生会产生一些影响,他们的工作会上一个非常大的台阶。

朱军、张长水、林宙辰共话机器学习无人区,下一步的突破在哪里?

000
评论