Datawhale干货
分享:贾庆山老师,编辑:哈哈镜V
一个群体Permanent head Damage 的博士生群体
Permanent head Damage = Ph.D
博士生一年级的同学们,不要担忧或高兴得太早,抱歉你们还没有经历Qualification——预备考试,你们暂且不能被称为博士,只能称自己是要努力成为博士预备生的学生。等过了一年到了博二,你们会疑惑,自己读的是工学,为什么要被叫做Ph.D—哲学博士?不清楚。什么叫博士生?不清楚,甚至于不知道自己最后要成为什么样的人。在园子里待到第三个年头,同学们会开始想,我是谁?清华博士,可能已经不太会非常明确地表述,到底什么叫清华博士生?甚至于连博士生是什么都不太清楚。等到四年,终于就变成了永久性脑损伤(Permanent head Damage)。所以就Ph.D了,可以毕业了。
不是所有的人都适合去读博士,也没有必要大家都去读博士。人只要自己走成功的道路就好。但既然你选定了要去读博士,可能要先清楚地了解这意味着什么?现在退出,不用等到最后被开除,可以选择主动离开。为什么叫永久性脑损伤?因为你答辩完之后,会发现你思考问题的角度会和很多人不一样,甚至于是绝无仅有。寻常的喧闹声中,大家都嘻嘻哈哈讨论问题的时候,你经常会发现与众不同的细节。一道题大家在讨论选A还是B或者C的时候,如果你是一个博士,你可能会说这个题目出的不对,逻辑上有问题。这就是永久性脑损伤可能会给你带来后果。这个损伤是没法修复的,损伤过后想回归正常也比较困难。你会发现除了你,别人都和你不一样,很异类。
那是什么让你们变得与众不同?是什么能够让你们做出与众不同的贡献?怎样才能成为一个合格的毕业生?一名优秀的毕业生?或者即使你不能够毕业,也能够做出很重要的科研成果?大家不要害怕,其实能不能毕业不是清华的博士生首要考虑的问题,我的个人观点,清华的博士生重要的事情是你能不能够做好自己应该做的事情,这里面最重要的一环是学术志趣的培养。
三个问题:学术志趣培养
很多同学不清楚自己为什么要读博士。可能因为周围的人都在读博士,可能因为爸妈想让你读博士。你们有没有想过五年之后要做成什么样子?这个问题很重要。如果你只是生活在今天,我要做什么?明天要考试,后天要交论文截稿,这个不太对,这个是战术层面。战术层面上你可以打赢一个一个小仗,但是你可能会失掉整个战争。你可能会写很多很多论文,最后却发现你在博士期间没有学到太多知识,你可能会做很多很多工作,写了很多代码,最后却觉得在这里读一个博士并没有达到你预期的目标。为什么?第一个问题来了,因为你一开始就没有想好,五年之后你要成为什么样的人。比较合适的,当然是说五年之后我想毕业,大家谁不想毕业,这个目标不够。我要成为优秀毕业生,这是一个目标。五年之后我要能够做出很好的成果,这是一个好目标。有同学说五年之后,我要成为有钱的人,嗯这也是一个目标,但是你可能选错方向,不应该去读博士生。
随后的两个问题,你应该问自己,15年之后你要做成什么样子?你是不是正在朝着这些方向努力?这三个问题是我很早以前被面试的时候,我的导师提的。很幸运当时我确实想过这个事,所以后来能够成为博士生。当时我并不觉得有什么特殊,我觉得这个问题每个人都会想。直到后来有机会跟大家讲这个课,我才发现不是,很多人没有想过这些事情。有时候你会发现,原来你跟大家是那么的不一样。没有关系,你们每个人都不一样,但这三个问题值得你们思考。
学术志趣体现在你是不是真的对研究透一个问题感兴趣。这也是我个人的观点。每个老师可能有不同的观点。你读研究生不是为了有钱,你做研究不是为了有名,本质上你去成为一个研究生,是因为你很好奇,因为你不明白,甚至于你不舒服。因为你内心当中很痛苦,你会为一些问题,一天到晚不能睡觉,非常迫切的想把这个问题给解决。我看到在网上有些人会惊讶,说有多知名的专家,白发苍苍,竟然很认真在去听某场报告,最后还不时提出一些问题,哇多厉害。有没有搞错?这是一个学者自己应该做的事情,这有什么不应该?当你去听报告的时候,如果你的唯一目的是去凑人数,为什么要听?就像今天你来听我的讲座,如果你的唯一目的就是为了学分,为了课堂出勤合格,我说真的,不用。你要对自己诚实,你应该问自己,对做研究是否感兴趣?
三个条件:获得博士学位
获得博士学位的条件
你现在可能了解,也可能不了解,获得博士学位需要一些必需条件。有同学说我要发表足够多的文章,我要有足够多的成果,我要写一篇好的学位论文,要评审获得好的意见,同时还要找到好的工作,最后才开始申请毕业答辩。对,都对。都不太对。这些是自然而然的过程,这些不是最主要的。我觉得你应该问自己,第一,你是不是能够教会老师一点东西?
我原来不是这么想的,学生不是来学习的吗?后来当老师了,觉得这个想法有些问题。老师上课,贡献出时间,贡献出精力,贡献出经验,挺好。你毕业了,假如什么都没有教会你的老师,那这个老师不是又付钱又付时间又付精力又付经验,最后什么也没有得到?这个不对了,很不对。如果你到最后什么也没有教会你老师,我觉得你不是一个合格的博士生。你至少应该教你的老师一样东西。你能够说完了以后,你老师说对,不错,这个东西我没有想过,谢谢,我学会了。这个是你的目标。第二,写一篇文章,让同行说好。不一定要发表上《TAC》,《AUTOMATICA》,《PAMI》,《PROCEEDINGS OF THE IEEE》,不一定要写这些“CNS”的文章。“卡尔曼滤波器”第一篇文章也不是发在这上面,但是你应该写篇好文章。你可以发在一个很不起眼的期刊或者会议上,但是要求它一定要是好文章。而且这个好字不应该是你的老师说,不应该是你同学说。应当是一个同行,发自内心,真心佩服地说好。第三,不辱师门。就是一个老师以后出去,不会因为说这个人是我的学生,觉得脸上无光,反倒是应该很自豪,这是我的学生!
这些都不是我说的。当时我被面试的时候,老师说,我问你的问题都问完了,你有什么问题?我说那我问一个问题,假如我读研究生,怎么可以毕业?然后就有了这三句话。第一你应该教给我一样东西。第二,你应该写篇文章,让我们同行说好。第三,不辱师门。请大家看一下,这三条里面有没有定量?第一条,一样东西,1。第二条,一篇文章,也是1。第三条更泛,什么叫不辱师门?完全是一个定性概念。好的标准不是定量,是定性。我们也正在向这个方面去转化。以前咱们的学生毕业的要求非常明确,也比较高,是从定量的角度上评判。现在越来越偏向于定性,这才是真正体现出咱们清华的学生水平在提高,不太需要那些数字来去判断,不在于你写了多少篇文章,而是相信同行评议。
三个标准:如何选题
如何选题
大家经过考虑,参加面试,最后顺利入学了。很快的一个问题是选题。假设你们都能顺利通过博士生资格考试,怎么选题?给大家一些建议。我的菜烧得糟糕,难以下口,但并不影响我去评价人家的菜烧的好坏。所以你做研究,也许自己做不出特别特别好的成果,但是你应当有一个好的品位。这个品位是你们在研究生期间最需要去训练的东西。有句玩笑说小孩子从小吃东西太咸,长大以后吃什么东西都没有什么味道。如果你在读研究生的期间,品位已经变坏了,咸盐吃多了,可能你以后很难再成为特别好的研究人员。所以在选题的时候,应当先问自己三个问题。
第一,这个问题工程师是不是关心?你关不关心不重要。工程师是不是关心?我们是工学门类的研究生培养,你不是理学,你也不是商学,更不是艺术,你是工学,所以你一定要尝试去回答工程师是不是关心?工程师可能现在不关心,但是未来会关心,这个也很好。有人去研究MIT发表的文章影响力,很多文章在发表出来前五年没有citation(引用),同学们会想完蛋了,毕业的时候都没有citation,评不了优秀了是吧?这些文章往往成为很好的结果。还有一些文章发表出来,十年都没有citation,这些文章一般会成为特别棒的结果。还有极个别的文章发出来,15年都没有citation,很有意思,这些文章基本上是诺贝尔奖级。有些同学的论文citation很高,应该开心,毕竟还有些人的文章一辈子都没有citation,但是不要太开心。要不然是你生的时代对了,同行都能够很了解你的工作。要不然就只能说明你做的是一个热点问题,却不是一个根本性问题。谁都清楚做一个热点问题citation很容易变高,但作为一个基本性问题,可能别人很长时间都无法理解,为什么要去研究这个问题。另一方面citation高不一定是好事,也可能因为他的结果是错误的,被当做反面例子不停引用。选题关心citation,倒不如关心,工程师会不会关心。
第二,这个问题我是不是会做?博士生选题的时候可能会说:“导师给我选了一题,我根本不知道怎么去做,在国内外也没找到有人做过,文献和关键词都没有,是不是故意要为难我?跟我过不去。”你们想想,你要是会做,你干嘛要去研究它?你要是会做,你今天就写个报告就好了,干嘛要花四年五年的时间?你们现在20多岁,这个岁月正是人生当中最宝贵的时候,去干别的不好,干嘛要去做一些你很会的事情?如果纯粹做一些乏味却费力的事情,我建议你不要去做。你可能会在很短的时间当中发很多文章,但长远来看,有百害无一利。你用你人生当中最精华的时间做一个之前就已经会的题目,你失去了太多的机会,不要去做。
第三,这个问题我是不是感兴趣?你是不是感兴趣你得问自己,人一定要做你自己感兴趣的问题,才能够真正发挥你的潜质。所以我第三次说这件事,请大家要对自己要诚实。可能又会有学生说,我的题目是导师定的,根本没有给我选题的机会。对不起,谁说你一个人只能做一道题,谁说一个博士生就应该只做一道题目。我跟我的学生说,一个人至少应该做三个题目,一个题目是你可以毕业的,一个题目是能够对得起人家帮你交的学费。还有一个题目可能是你为了找工作,或者因为各种原因,你自己感兴趣。你应该做你感兴趣的问题,把你最主要的时间放在那个上面,当然并不意味其他的事情就一概不管。
七个问题:如何做研究
贾庆山老师介绍七个问题
你们比较幸福,我们的学生少。比方说我们一个老师一年只能招一个博士,隔几年才能招一个硕士生,你们对一个老师占用的资源会比别人多。那怎么做研究呢?是不是让老师给我安排任务?老师,你让我干三件事,我只能干一件,你告诉我应该做哪一件?其实这些问题应该你们自己去解决。正是这种过程,才是读研究生应当接受的训练。你要通过自己的揣摩来了解哪些问题更根本应该先做,哪些问题比较表面,可以后做。就算你们以后不做研究,这种能力也会对你们有非常大的帮助。
● What’s the problem?● Why is the problem important? ● Why is the problem difficult ? ● What is the state of the art?● What is your magic touch?● What are the main results?● What are the assumptions?
这里是七股文,不是我创造的。它来自于我还是学生的时候,我们的中心有一位讲席教授很有名,叫陆宝森陆老师,他提出来的。
第一,What’s the problem? 你要做的这个问题是什么?一句话就应该回答。任何一个问题都可以在任意短的时间内,向任何人讲到你希望达到的程度。如果你没有做到,不是因为你做的问题很高精尖,是你的功夫下的不够。例如我在听一个报告,五分钟还没有听懂他在说什么,不是因为我笨,是因为这个报告不好。为什么?他花了五分钟都没有把问题说清楚,他不尊重听众。如果有报告进行到最后我什么都听懂了,我会对这个报告人非常尊重,他属于一个真正的牛人,很不容易。报告深入浅出,能够把它的亮点用非常简洁的方式说明白,这也是我现在的标准。同学们,有可能我以后会出现在你的答辩委员会当中,这就是我的标准。你不用担心说五分钟就把我的工作说完,是不是说明我什么都没有干?不会。我会很开心。反倒是你要是讲了20分钟,30分钟,我都没有明白你说什么,我的感觉很差。自己提问,What’s the problem? 一句话应该能明白。
第二,Why is the problem important? 这个问题为什么重要?这个问题重要,因为我老师让我做的。这个问题重要,他要是不重要,我怎么能写文章。这个问题重要,他要是不重要,每天这个生活我都白花时间了,我何以对江东父老,所以他不重要我也得说他重要。你不够诚实。老老实实回答一下,你觉得这个问题到底重要不重要。如果你要觉得这个问题不重要,别做了,做他干嘛?每天都有机会去改变你的人生。马云说天天晚上想脚下千条路,早上起来却还是走老路。何苦呢?
第三,Why is the problem difficult ? 这个问题难不难,这个问题为什么困难?你要是没想过,赶快想。你要是想过了,发现这个问题不难,别做。你做也写不了文章,你写了文章也上不了好期刊,你上了好期刊,也不会有人读。上了好期刊,别人读了也是被人家笑话。你应该要做一个重要的问题,一个有难度的问题。
第四,What is the state of the art? 别人在干嘛?大家经常会有这个问题,怎么知道你的文献调研做得充分不充分?你站在这里闭上眼睛,你的脑海当中应当浮现出一个地球。在这个地球上面,每一个大洲,跟你做的这个问题最相关的研究组在哪里。每个组里面能说出代表人名字,在什么年代,这才叫做好了。如果你跳出来说,老师我做这个问题前无古人后无来者,我不信。因为我也是咱们这个学科的,你们做出一个这样的问题,多多少少都有别人的工作跟你有关系。要你说脑袋当中什么都没有,是因为你懒,你没有去充分做好文献调研。
第五,What is your magic touch?既然这件事很重要又很困难,很多厉害的人物尝试解决,却都没能解决,为什么你解决了?what is your magic touch?你的一篇文章就只用讲一个故事。同学们可能会讲,你太小看我做的贡献,一篇文章写不完。可以,那你写几篇文章,一篇文章讲一件事。what is your magic touch?一句话说清楚你的贡献是什么。
第六,What are the main results? 好,那你在这个漂亮的想法支撑底下,主要成果是什么?列出来。三个四个差不多,一个两个也没关系,五六个不太正常。怎么会有很多东西?毕竟你就一个idea。
第七,What are the assumptions? 你获得这么好的结果应当有前提假设。有的你知道,有的你没有意识到,应当把它写出来。这些前提假设是你后面的学者再去研究这个问题的时候,可以考虑去放松去突破去推广的,你不写别人也会问。如果不知道,那只能说明 对自己的成果认识不够。
七个问题。什么问题?为什么重要?为什么困难?别人做了什么?你的核心贡献是什么?主要成果有哪些?前提假设是什么?你每写一篇文章都应该问自己。等你把这七个问题都回答了,写一个excel表,我很推荐大家这样做。我也经常在写一篇文章前,列一个excel表,两列,七行。左边一列七个问题,右边一列回答,列完之后你可以开始写文章了。怎么写呢?
七股文:如何写论文
七股文,还是七个问题,是对刚才那七个问题回答的再组织。其实我的文章不多,大家可以去看我的主页。如果你想要发很多文章,我觉得你不应该跟着我做学生,也不应该来这里听我的经验教训。我有的是很多教训,没有太多成功经验。不过我看过许多好文章,所以可以给大家分享一下好文章大概是什么架构。
第一个部分是Introduction。大概一页两栏,用A4纸写的话大约就是两页。分为四段:第一段:What’s the problem?Why is the problem important? 问题是什么?为什么问题很重要。第二段,Why is the problem difficult?为什么问题很难?要阐述清楚问题的难点。第三段,简要提一下综述,What is the state of the art? 然后说What is your magic touch? 你的工作为什么解决了前面的问题,可能前人的工作可能忽视了这样那样的问题。再简要介绍一下What are your main results? 列点说明你针对这个问题做的突破。最后一段阐述论文整体的组织结构。
第二个部分是Literature Review。文献综述,大约一栏到两栏, A4纸半页到一页会比较合理。这部分详细回答“What is the state of the art? ”,是梳理学术脉络非常好的机会。你为什么要写这篇文章,你写了文章给谁看,谁会拿去用,你都要在这一部分指出来,所以需要梳理清楚学术脉络。其次,这部分能展示你很牛,show how smart you are。我上周听了一个讲座,已经完全忘了主讲人做的工作是什么,但他前面五分钟彻底打动了我。他那么年轻,对于这样一个古老的方向,居然了解那么多,听起来就像是一本活历史,让我很佩服。若干年之后可能不会有人记住他讲了什么,但是我会永远记住这个人。写文章也是,他能展示你是否清晰的知道,对于同一个问题有不同的工具去处理。他能展示你对本领域历史的了解,对当前各学派的认识,以及你对自己的工作与既有工作关系的梳理。一个好的文献综述,能够把你的文章挂在学科树一个非常合适的枝叶上,这不单单是帮助 Associate Editor确定评审人,编辑去送审,也能帮助读者去搜索的时候,能够非常迅速地定位到你的这份工作。
第三个部分是Problem Formulation,这可能要花一些功夫,一页到两页。你应该完整地回答“what is the problem”。不是一句话,你应该详细地去介绍数学上定量上怎么去了解,一定要用数学,不要有那么多文字。你要用一些篇幅,把你的问题用数学形式化地表达出来,可以附图去展示整个系统的架构,帮助人家了解你所研究的问题跟既有问题的关系。你可以引用其他采用类似问题模型的论文。指出谁跟你的工作有关系?你是不是第一个做这个问题的人?如果你不是,你用了人家的工作又没有引用,这很麻烦。你们应该有学过,这属于学术不端。就算是画图,两个人想的东西也绝对会不一样,不可抄袭。
第四个部分是Main Results。这是论文是最主要的部分,应当占你全文2/3左右的内容。《TAC》的文章一般最长十二页,短的话一般有八页,至少应该有2/3的内容是这个东西。这是“what are the main results?”的完整阐述,更应该讲清楚“what are the assumptions?”。这是论文的核心,应该有定理,证明,可以有算法描述。上周末我刚看了一个学生给我发的毕业论文,看完以后直接说这个不用毕业了。主体部分占全文比例太少,前面花那么多笔墨写背景写别人的工作,论文有多少是你自己的工作?要是少于全文的2/3,不用去送审了,就是自取其辱。
第五个部分是Numerical Experiments。如果你的主要工作全是数字实验结果,“Main Results”都是“Numerical Experiments”。很好,这是一个非常好的信号,说明你的工作做的不到位,文章不该投。Main Results是让你们写定理,而“Numerical Experiments”是说实际应用。有的人的数值算例可能偏多一点,就需要用其他方法进行对比,请大家务必注意。之后是挑选算例,尽量挑选一些比较公认的算法,benchmark,要选择数据量丰富的实际问题。针对参数的变化,测量误差,模型偏差等等,多个层面组织不同组的数值实验,去分析它会如何影响你的结果。
最后是Conclusion。比较简单,不用很长。大约1/4页,A4双栏的半栏就够了。简要地回顾你解决了什么问题,你是怎么解决的,你主要做了什么样的贡献。后面的人如果在这个方向接着做,应当做什么?千万不要跟引言和摘要相同,他们有不同的作用。引言是让人家读完之后能知道你的问题是否重要,摘要是读完之后知道这篇文章值不值得往下读,而总结是我读完了会决定要不要在你这个方向继续往下研究。
一个技巧:熟能生巧作报告
作报告不同于写文章,写文章可以有很多的数学公式,写文章可以有非常长的篇幅,仔细的探讨各种逻辑关系之间的联系。但作报告不一样,我们需要学会如何在有限的时间里,针对不同的人群,使用比较通用的方式去把你工作的亮点讲出来。这件事情唯有不停地训练,才能最终获得好的结果。每一次报告之后,给你提出好的评价的那些人当然是非常重要。但是给你提出不足意见的人,才是真正的帮助。我们应当把那些反馈意见收取下来,不要因为这个报告你做完了,就不用去改。应当是你基于做完这个报告的反馈意见,再去改,不停地修改。这样你下一次再做相关报告的时候,至少在某些方向会做得比前一次好。可能你们大部分同学以后不会从事科研,但你们会有很多机会去跟别人介绍自己。我希望你们能够练好这种能力,在任何短的时间向任何人可以把你想介绍的内容介绍任何的深度。如果你还没有做到这一点,我觉得你应该不停地努力,这可能真的是永远在路上,你要不停地训练自己。
研究生如何做学术?我一开始问大家五年之后想成为什么样子?十五年之后想成为什么样子?当然五年之后,我不希望看到我的学生们说到第五年还没毕业,在校园里赶毕业,不应该赶毕业。除了那个以外,我觉得你们应该学会两件东西。第一件是作报告。第二件就是选题。选题是品位,是让你判断什么问题重要?什么问题不重要?这个能力非常重要,非常关键。如果你能够形式化提出一个问题,而且这个问题提对了,就算你自己不会写,可以跟别人合作。会有聪明人帮助你一起去解决这个问题,但是前提是你在研究一个重要问题。最后,你写好了文章,被录用了,不用太开心,还是继续做好自己的事。如果你的文章被拒了,真的不要太灰心。因为不断地听到反馈意见,改变自己,寻找正确的研究方向,是我们应当一直做下去的事。
整理不易,点赞三连↓