鬲融昔日的IOI战神清华特奖获得者,

列举从信息学竞赛(OI)或清华计算机系走出来的牛人,人们总会提到鬲融的名字。

这位来自河北唐山的青年,因年与楼天城、胡伟栋、栗师代表中国参加第16届国际信息学竞赛(IOI)、全面夺金而一举成名,保送清华后又在卧虎藏龙的计算机系留下三项至今无人打破的纪录:17科满分、学分积三年排名第一、计算机系历史最高GPA。

当你以为他只是一位竞赛强人时,他向你展示了在文化综合科上的实力;当你以为他只是“两耳不闻窗外事,一心只读圣贤书”的学霸时,他又在离开清华多年后捧回在理论研究上的拔群战绩:NIPS最佳学生论文奖、素有“诺贝尔风向标”之称的斯隆研究奖…

然而,关于鬲融的传说,大多还是集中在早期的竞赛与清华姚班的学习上。相比之下,他去普林斯顿读博、从事理论研究的经历则鲜为人知。

作为“光环学生”,鬲融的一言一行被寄予厚望。但是,在与鬲融的对话中,我们发现,这位昔日的IOI战神、清华本科特等奖获得者在科研上并非一帆风顺。刚入门时,他也不知道该如何做科研,也是经过一番自我觉醒,才明白了其中的门路。

与竞赛、考试相比,鬲融在科研上属于“大器晚成”:读博前三年,他在近似算法研究上探索无果,无奈转向机器学习理论研究,最后两年才发了顶会文章。到年凭借非凸优化的研究贡献获得斯隆研究奖时,他已是杜克大学计算机系的一名“青椒”。

年,鬲融从清华大学本科毕业,随后赴普林斯顿大学读博、微软研究院新英格兰分部担任博士后,年进入杜克大学担任教职。从姚班开始立志做理论研究,到成为机器学习理论研究方向小有名气的青年学者,鬲融用了近10年。

那么,鬲融离开清华后的成长历程是怎样的?今天,我们只谈鬲融与理论研究之间的故事。

作者

陈彩娴

1.普林斯顿前半章

在清华计算机系4字班(级)中,最出名的当数信息学竞赛圈无人不知的楼天城“楼教主”,百度曾经最年轻的T10级员工,后来又率先创立了国内知名的自动驾驶公司小马智行(Pony.ai)。

许多人最初知道鬲融,是借楼教主的名声,因为在楼教主的一段轶事里,鬲融曾作为一个“配角”的身份出现:

当时,楼教主的高中信息学竞赛教练李建江一直认为楼教主是天才型学生,心中引以为豪,每次去北京出差,只要有时间就会顺路去清华看望这位得意门生。

结果到了清华,与老师、同学交流,李教练发现,自己的学生在计算机系最多只能排到第二名,因为楼教主的同班同学鬲融常年排名全年级第一。

他还举例:每次夜晚9点去清华的计算机系宿舍,鬲融肯定在,而楼教主还在教室用功。他因此感叹,相比鬲融,楼教主是地道的勤奋型选手。

在与AI科技评论的对话中,鬲融首次回应了这段传闻:“哈哈其实是因为当时我们宿舍有空调,所以就不用去教室学习,楼天城他们宿舍没有空调,他只能去教室学习。”

图注:年,鬲融(中间)与楼天城(最左)、胡伟栋(最右)在日本参加ACM/ICPC,获得亚洲赛区冠军、全球第二名

楼天城的天赋与能力毋庸置疑,但相形之下,鬲融的实力也可见一斑。然而,在理论研究领域深耕多年后,回头再看在清华读本科时的成绩与排名,鬲融只是一笑置之,称自己不过是有一点“考试的天赋”:

我就是在做一些不是特别难的题时可以做得很快,也不太会出错。考试可能比较有用,但是(这项能力)后来到了研究上面就没有什么用了。研究的题比考试难,有些人可能考试时会在一些简单的题目上卡住,但在做研究的难题时就会做得很快。

鬲融与楼教主曾经是年一起参加IOI的战友,上了清华后又曾两次组队参加编程竞赛(两岸清华编程比赛与ACM/ICPC)。但是,与业余时间还爱“玩玩竞赛题”的楼教主相比,鬲融并不“恋战”,参加完年ACM/ICPC后便彻底告别了竞赛圈,因为那一年,他找到了下一个人生目标:理论计算机研究。

当时,鬲融刚加入姚班不久。在姚期智、陈卫、孙晓明等人的引导下,尤其是姚期智亲自讲授《理论计算机》课程,鬲融迷上了理论研究,立志走学术研究道路,将科研作为毕生之所向。

但是,与竞赛、做题相比,鬲融的科研“天赋”似乎略微逊色。比如,读博前期,鬲融在近似算法(ApproximationAlgorithm)的研究课题上苦苦折腾了三年,也没有找到正确的方向,最后只能无奈放弃。

年,在姚先生的建议下,鬲融去了普林斯顿大学(计算机理论研究排名全美前5)读博。普林斯顿的计算机系每年只招收大约20名学生。在鬲融那一届,除了他,还有名中国学生被录取,包括鬲融昔日的IOI战友栗师(现任纽约州立大学布法罗分校计算机系副教授)。

图注:普林斯顿大学

清华姚班出来的学生对研究往往有一种使命感,比如,引领一个领域的新潮流,或解决一道历史上悬难已久的问题。年少的鬲融起初对学术研究也是这样一种想法:“世界上有那么多猜想与没解决的问题,挑一个去做就是了。”

近似算法的研究历史可以追溯到18世纪中期欧拉(L.Eulr)研究的骑士环游问题,目标是用近似方法在多项式时间内给出尽可能接近最优值的解,比如著名的「旅行商问题」(TSP):一个商品推销员要去若干个城市推销商品,该推销员从一个城市出发,需要经过所有城市后,回到出发地,那么,TA应如何选择行进路线,以使总的行程最短?

这个课题很吸引鬲融。但很快,他就感到“出师不利”。

近似算法发展至今,亟待解决的问题是大家都知道的几个问题,比如旅行商问题、染色问题、最小分割等。鬲融的工作就是研究如何解决这些问题。但是,虽然有明确的研究方向,他却总会在各种地方卡住,导致工作无法进行下去。

至于卡住的原因,鬲融坦言,他到现在也还不是很清楚:

可能是对研究的课题不熟悉,也可能是思路不对,各种可能都有。我们当时想做的事情直到现在也还没有人做出来,所以也有可能是因为选择的题太难。

三年下来,虽然他在ICALP、ISAAC等理论计算机的会议与期刊上发表了论文,但总体感觉还是困难比较多,所取得的成果也远远没有达到鬲融对自己的要求。

回想当时的磕磕绊绊,鬲融分析,做研究无非就是两方面:一是找到合适的题目,二是把这个题目做出来。在选择近似算法时,他对第一步的认知只是在“世界上已有的难题”上,直到后来转向机器学习理论研究,才发现:原来学会自己定义问题,也是一项可贵的研究能力。

2.科研转折点与引路人

转折点发生在年。

那一年,Hinton与他的学生Alx在ImagNt比赛中凭借AlxNt远超第二名10个百分点,勇夺冠军,深度学习崛起。鬲融的博士导师SanjvArora敏锐地察觉到机器学习(尤其是深度学习)在未来的发展潜力,开始



转载请注明地址:http://www.shanghaibinbei.com/kflw/14177.html
  • 上一篇文章:
  • 下一篇文章: 没有了