研究感悟
我的博士研究生经历算是有些曲折。2018年本科毕业后先是在香港中文大学入学读了半年,退学后找了我现在的老板Rynson。2019年重新入学后,经历了两年多的迷茫期,期间尝试了各种不同的研究课题,等到博三时休学实习的半年里才找到一个能让自己投入的方向,然后磕磕绊绊到现在要准备毕业了。
应该说Rynson是个很nice的导师,他鼓励我自主思考并且支持我研究自己感兴趣的问题,从我之前的经验和观察来看这一点真的太难得。然而我的博士研究生生涯仍然很艰辛,原因无他,皆因我入学之后很长一段时间都眼高于顶,对各个课题浅尝辄止,无法坚持。这么煎熬了两年多,能力和追求逐渐收敛到差不多的水准,心境才渐渐平和下来,能够静下心来做些事情了。这其中的艰辛与曲折如人饮水,冷暖自知,就不一一展开,只分几点谈谈这几年参与学术研究感悟。
“生成器”与“判别器”
生成对抗网络(Generative Adversarial Network)是深度学习领域里很经典的工作,这个框架下同时训练一个生成器来生成图像,和一个判别器来评估质量,通过二者对抗训练最终生成高质量的图像。有趣的是,我认为这个奇妙的想法也适用于博士研究生的训练。
一个博士研究生的成长,就是一个自我对抗的过程:论文可以类比成GAN要生成的图像,而一个研究者要同时扮演生成器(论文作者)和判别器(审稿人)两种角色。一个PhD student要达到独立发表高水平的论文的水准,首先要学会判断论文或者课题的价值。有了正确的研究嗅觉,才能避免把时间浪费在一些不重要的、没有前途的问题上。
在做好生成器之前,首要的是学会做一个判别器。这也就是为什么很多大佬如此强调研究品味(research taste)。如能走在正确的路上,每天进步一点点,日积月累总归是能不断精进,变成更好的生成器。方向比努力更重要。
学术影响力和学术贡献
做学术研究是在追求什么呢?最高的境界可能是为了像佩雷尔曼那样纯粹追求自己的兴趣,又或者像邓稼先那样“为天地立心,为生民立命,为往圣继绝学,为万世开太平”。但是这种圣人的境界通常不是普通人能达到的。学术界本质上也是一个名利场,有些人做科研是期望一份安稳的体面的工作,大多数科研工作者还是追求学术影响力/学术声望(reputation)的。
什么是学术影响力?有些人可能会简单把它量化为(一区/顶会)论文数量,引用量。其实不完全对。学术影响力是大家一提到某个领域的工作就想起你的某些工作,就想起你这个人。这就是为什么我们会常听到这种说法:质量比数量更重要。比如在计算机领域,万引通常被认为是一个非常了不起的成就,但是假如你只用10篇论文达成了万引,那要远远好于300篇达成万引,因为前者意味着你篇篇是精品,而后者却有可能被调侃灌水。
学术影响力的决定性因素是学术贡献。关于学术贡献,我很喜欢下面这个比喻:
在上学时,导师曾经给我做过一个比喻:科研中最牛的人,比如杨振宁先生,可以达到什么水平呢?就是设计出一件衬衫,然后这件衬衫能穿。次一级的,比如那些院士们,他们是在衬衫左上方设计一个口袋,发现这里可以装名片,可以别钢笔。再次一级的人,就是我导师那样的人了,他们发现衬衫左上方的口袋可以装东西,于是就在右上方也设计一个口袋,也可以装东西。而再次一级的,就是还没有资格带硕士和博士的那些科研工作者,他们做的工作往往就是,发现原来我们可以往衣服上缝口袋,于是赶紧在衬衫后背比较宽敞的地方也缝上一个口袋。比这个还差的,就是发现原来在衣服上缝口袋有利可图,那为了省事儿,不缝了,干脆双面胶贴一个算了。还有一些怎么都憋不出成果,可又不想造假的硕士、博士们为了毕业,会在论文里像模像样的讨论一下,当一个人倒立行走的情况下缝的口袋必须口朝下的必要性。这大致就是学术贡献按等级排下来的逻辑。——卓克《科学人物课:冯·诺伊曼》
如果在学术上有追求,品味格局、执行能力和坚持不懈缺一不可。
自洽与包容
前面提到的愿景都非常宏大。然而理想很丰满,现实却往往骨感。做研究多少有冒险和赌博的成分:假如你所做的事情是确定的,论文的观点是人尽皆知没有什么惊喜和新颖性的,那么它就没有什么希望发表在top venues。淘金的时候淘到的是破铜烂铁才是人生常态。当研究不顺利时,每个研究者心里都需要有一杆尺来判断自己是及时止损还是
我的个人选择
我刚入学的时候不知道该做什么,Rynson推荐我做阴影检测(shadow detection)。这个问题很小众,我有一百个理由不喜欢它,说出来恐怕要得罪很多同行。不过,做这个也有好处,就是不吃硬件资源,一张2080ti就能跑得起来,而且居然每年顶会都有一两篇中稿。于是就这样半推半就完成了一篇投稿,最后发到了ICCV 2021上