菲尔兹奖获得者、哈佛大学终身教授丘成桐(来源:中关村论坛官微)
【导读】日前,在以“前沿科技与未来产业”为主题的2019年中关村论坛上,菲尔兹奖获得者、哈佛大学终身教授丘成桐(文汇讲堂第11期嘉宾)呼吁:我们要在人工智能领域领先,基础学问一定要突破,要将数学和有关的学问一同发展,才能够真正领先突破。他在接受采访时透露,为推动北京基础科研发展,其正牵头与北京市商谈合作在怀柔科学城建立数学所,并将引进更多世界一流数学科学家加入。丘成桐认为,几十年来,数学都是整个社会的重要支撑。互联网、人工智能等技术,其背后的重要工具其实都是数学。当下广为流行的深度学习,存在不少问题,例如过度依赖大样本、可解释性差、容易受欺骗等。要想解决这些问题,需要对相关数学理论进行深入研究。
无为知识的无所不为:重视数学和基本科学在应用科学中的重要性
中国的大部分家庭,每个家庭都很用心于孩子的教育,都很关注孩子的健康成长。
基础科学的发展也是同理,我们不断投资在工业上,也将可观的经费投资在基本科学上,因为强大的基本科学对于一个国家的独立自主长治久安是必须的,没有基本科学的发展,研究科学发展不起来。
当年我在普林斯顿高等研究所当教授的时候,这也是杨振宁教授、爱因斯坦工作过的地方。当时的所长曾很自豪地说:“我们在这里研究的是无用之学!这些无用之学在未来将会成为社会的磐石、国家的栋梁。”高研所第一任所长叫A·Flexner,1939年他在杂志上发表了一篇题为“无为知识的无所不为”(The Usefulness of Useless Knowledge)的文章。文中指出:19世纪法拉第和麦克斯研究电磁学,不过是出于科学的好奇心,接着Hertz发现了电磁波。这些科学家并不重视电磁在人类社会中的应用,但是他们的工作却如此重要,不单单是在理论科学划时代的成就,同时也是近代文明的一大贡献。
普林斯顿高等研究所第一任所长A·Flexner,1939年在杂志上发表了一篇题为“无为知识的无所不为”(The Usefulness of Useless Knowledge)的文章
基本科学跟数学有哪些应用呢?在当今社会,互联网和计算机的能力极大,无论能源的分配、大数据处理物流系统、道路交通、仿真神经元、蛋白质结构等问题都需要大量地提升计算能力。这种能力有相当大的部分是依靠计算机芯片存储的。随着电子计算机计算能力的不断成长,30年来,摩尔定律已经到了极限,不可能再增长,计算机硬件的设计将要面临极大的瓶颈问题!
解决计算机瓶颈的两个方案:大力改革硬件设备或改善软件
如何解决呢?解决的办法有两个,一个是利用基础物理的原理和基本数学来大力改革硬件设备;另一个是大力改善软件,即找到最好的算法,来绕过硬件速度和储存能力来解决计算机瓶颈。
*投资要看二十年,IBM研发出53个量子比特的超级量子计算机
针对第一个方法,三十年前,伟大的物理学家理查德·费曼就提出量子计算这个方案,利用量子力学的基本原理来帮助计算,但当时费曼也不是特别清楚该怎么做,但他知道量子力学的基本原理能解决计算储存能力的问题。直到二十多年前,MIT有位应用数学家叫Peter Shor,他提出一个算法,利用费曼的提议做大数字的因子分解,在小学我们都学过因子分解,但是大数据做因子分解是一件很困难的事情,基本上大部分的保密系统就仅仅利用大数据分解困难这个问题来设计的。
1978年,科学家提出了一个很出名的方法:RSA加密算法,到现在所有系统都用这一个方法,但是Peter认为假如量子计算成功的话,RSA所有的加密方法都可以破解。
美国物理学家理查德·费曼
因为量子计算威胁到目前通用的保密方法,因此很多国家的政府官员、银行监管部门等都极为担心,但同时也投入了大量的资源来发展研究量子计算。这项研究需要大量的数学家、物理学家跟工程师合作:费曼是物理学家,Petter是数学家,美国名校有很多教授在做这方面的工作,MIT、斯坦福,在实验方面投入的资源很大。
美国公司投入的规模更大,包括IBM、谷歌、微软等公司在内,IBM投入量子计算研究已经几十年了,现在有1300名工程师在做这方面的研究。2018年,美国通过了National Quantum Initiatives(NQI)法案,许多智库与政府官员都认为量子计算就像二战前的曼哈顿核弹计划一样,关系着国家安全,需要政府全力支持。今年IBM研发出53个量子比特的超级量子计算机,可以通过云端使用,最近NASA宣布,谷歌可以通过量子计算在200秒内完成世界第一的Summit超级计算机在10000年才能解决的问题。
中国的学者和公司也在做这方面的工作,但是基本物理和基础数学的水平不如美国,要在量子计算的研发上努力追上他们。这其实也给我们一个很重要的启示:投资不能看五年十年,甚至要看二十年,因为IBM投资在量子计算的时间至少超过了20年。
2018年,美国通过了National Quantum Initiatives(NQI)法案
*要在人工智能方面领先,数学跟相关的学科需一同发展
第二个解决方法就是利用数学发展出来的方法,现在这方面研究有人工智能跟大数据。
人工智能已经从一种刚开始的理念,逐步转化为可应用的技术。30年前大家都不看好人工智能,现在已慢慢转化成认为可应用的技术。
人工智能的蓬勃发展基于三个重要因素:一是互联网技术带来的大数据;二是利用深度学习的标准算法来处理数据;三是超级计算机跟云计算的强大计算力。然而其中的数学理论却没有什么很大突破,这也是该领域存在诸多瓶颈的本源。中国的人口规模是发展人工智能的优势,在应用人工智能技术方面已经有了很多优秀的工作,发表的论文甚至比美国还要多,处于世界前沿水平。但是在基础理论和算法创新方面跟美国、英国还有一段距离,因此我们要在人工智能方面领先,基础理论一定要突破。要想突破,一定要将数学跟相关的学科一同发展,才能够真真正正地领先。
人工智能对大数据的处理,本质上是数学中的统计学,然而目前还没有完备的数学理论能支持大数据分析的结果,很多数学方法还相对原始,过度依赖于经验的总结,而非真正来自内在的数学结构。这也导致了当下人工智能在处理大数据问题时还需要大量的人力和算力,甚至需要超级计算机的协助。由于缺乏数学理论的支持,很多大数据分析的结果只适用于特定环境,缺乏迁移性。大数据还缺乏有效的算法,经典计算机的算法还不能直接用到大数据中。这是很重要的一个问题,我们要深入了解。
广为流传的深度学习有很多不足的地方,例如大样本依赖,可解释性差,易受欺骗等,但当前没有更好的算法来替代。要解决这些问题,就需要对相关数学理论进行深入研究,了解大数据内在的数学结构和原理。目前人工智能由于计算器速度限制,只能采取多层状结构解决问题,基于简单数学分析而非真正的Boltzmann machine,无法有效地找出最优解。在可见得未来,如何提升量子计算机的硬件,发展更有效的数学算法,让量子人工智能与量子深度学习变成实用工具,这有赖于基础科学和数学的深度结合。
让量子人工智能与量子深度学习变成实用工具,有赖于基础科学和数学的深度结合
医学和卫生保健新领域:人工智能和数据科学的医学研究
几年前,我的学生和我朋友发现我四十年前在几何方面做的研究,可以应用到人工智能的理论研究上,以前其实没有想到的基础科学可以用在这方面。由此可见,基础数学在工程问题上确实是重要的。
机器学习和人工智能等先进的计算方法,已经在零售和娱乐等领域带来了显著的突破。这些方法也可能对医学和卫生保健产生深远的影响,全球的卫生保健系统包括美国和中国,都着手将临床信息数字化。
但是,对如何分析和应用这些信息却还没有很好的策略。未来十年,数据科学和人工智能对医学的贡献可能超过其他所有技术的总和。
人工智能和数据科学的医学研究将变成医学和卫生保健的一个新领域。
在这个崭新的领域里,数学和计算科学将会更广泛地为医疗决策提供支持。目前很多医疗系统的研究人员还没有意识到这一点,或者低估了这些影响。
我们希望将最先进的计算技术应用到大型的、医学相关的数据库,得到有效的信息,并将之应用到医疗服务、临床诊断及相关的医学研究中。
为了将人工智能和应用数学更好地应用到医学研究和卫生保健上,不同的学科需要共享合作。
数学、医学信息学、计算机科学、生物统计学、工程学都将是研究工作不可或缺的。这将是一个很大规模的不同学科联系起来的一种研究,不同的学科共同的努力才能完成,不是一个学科就能够完成的。
以人工智能临床诊断为例,中国拥有全世界最大的临床医疗数据库,我们需要学习如何管理和应用这些数据,而通过计算科学和人工智能,我们可以用全新的方法利用这些数据,推动整个领域的发展。
首先,我们可以利用机器学习模型消化更大、更丰富的数据集,同时通过机器学习的结果重新审视传统的预测模型的准确性,同时我们还可以尝试在自然的状态下改变额外的变量去提高模型的准确性,这种设置还允许进一步分析如何以及为什么新的技术和方法可能更好,以及在数学上有什么改进的可能。
目前人工智能和数据科学的技术已经被广泛地应用于临床诊断、手术指导、风险预测等不同的领域。
在某些领域,计算机诊断的准确率甚至比医生还高,这是很大的进步,对临床实践影响深远,正是这样的成就进一步激发了科研人员的干劲。未来医学更大的变革,将会更依赖于数学理论的突破和人工智能技术的进步,这是毫无疑问的。
作者:丘成桐
编辑:袁琭璐
责任编辑:李念
来源:综合自数理人文、新浪科技《科学大家》、北京日报等