亚洲熟妇av一区二区三区,久久久久久精品观看sss,免费观看四虎精品国产永久,国产成人精品一区二三区熟女,天堂网在线最新版www资源网

淺談完成一篇論文的科研歷程與經(jīng)驗 – CCCF精選(科研論文寫作經(jīng)驗分享與交流)

編者按:產(chǎn)出一篇有影響力的論文是學術界進行交流和分享的重要方式。剛入門的研究生和初入職場的研究者往往不清楚完成一篇論文的具體步驟,不熟悉如何構思新穎的想法(idea)、如何開展實驗和撰寫論文。針對這些問題,CCCF讀編往來欄目邀請浙江大學研究員彭思達結合自身科研歷程與經(jīng)驗介紹如何較好地完成一篇論文。

淺談完成一篇論文的科研歷程與經(jīng)驗 - CCCF精選(科研論文寫作經(jīng)驗分享與交流)

引言

完成一篇論文的常見科研歷程包括三大階段:想idea、做實驗、寫論文。每個階段又有細分的小步驟。在“想idea”階段,首先規(guī)劃一個重要的科研任務,然后調(diào)研任務中需要解決的技術挑戰(zhàn)/失敗案例(failure cases),最后針對挑戰(zhàn)構思解決方案。在“做實驗”階段,首先根據(jù)問題的解決方案設計簡單實驗(toy experiments),用于快速驗證方案的正確性,然后在簡單實驗設定下改進并調(diào)整方案,最后在真實數(shù)據(jù)上把算法調(diào)出理想的效果。在“寫論文”階段,首先根據(jù)論文的截止日期規(guī)劃論文各部分的完成時間,然后開始撰寫論文。在完成論文初稿后,可以找導師或行業(yè)內(nèi)專家?guī)兔υu閱論文,找出論文缺陷并進行修改。

階段1:想idea

“想idea”指的是確定具體的科研任務,找到該任務中最前沿的地方面臨的技術挑戰(zhàn),并提出相應的解決方法。

以三維計算機視覺方向為例,筆者認為存在兩種科研風格:目標驅動型科研(goal-driven research)和想法驅動型科研(idea-driven research)。前者的思路為:首先設定一個長遠的科研目標,然后規(guī)劃實現(xiàn)該目標的路線(roadmap),即需要完成哪些科研任務,最后基于提出的路線圖,選擇其中的某個任務進行研究。而后者的思路為:看到了一篇有意思的前沿論文,想著如何著手改進該論文中的算法。

這兩種科研風格有各自的優(yōu)缺點。想法驅動型科研的優(yōu)點是容易上手,是大部分科研新手會選擇的科研方式,其缺點比較明顯:(1)因為是在已有論文上改進已有的方法,所以除非改進的效果非常好,否則論文影響力有限;(2)科研思路可能被該論文帶偏,因為該論文的路線有可能是錯的;(3)容易和其他研究人員有相似的解決思路,因為其他人也可能在改進該論文;(4)由于任務已經(jīng)被該論文嘗試解決過了,解法上的創(chuàng)新空間有限,需要很聰明、很深刻的見解才能針對任務提出突破性的新技術。

目標驅動型科研有三個優(yōu)點:(1)容易做出突破性的創(chuàng)新。因為該科研方式從個人感興趣的任務出發(fā),為領域提出新問題,不是對已有論文進行改進,而是引領該領域的發(fā)展;(2)該科研方式有明確的長遠目標和路線圖,因此更有自洽的動機,有利于形成自己獨特的科研風格;(3)科研更具有連續(xù)性,科研成果可以形成體系。但目標驅動型科研也有缺點,因為規(guī)劃一條合理的研究路線圖是一件很難的事情,需要有豐富的科研經(jīng)驗。剛入門的科研新手往往無法構思出較好的研究路線圖。不過筆者仍然鼓勵科研新手嘗試構建自己的研究路線,在此過程中可以鍛煉自己的能力,并且厘清日后的科研規(guī)劃。雖然路線一開始不一定合理,但可以隨著經(jīng)驗的增加進行動態(tài)調(diào)整。

目標驅動型科研中“想idea”的詳細步驟如下。首先規(guī)劃一個長期目標,從事科研的人一般會有一個偏“科幻”的目標,比如想讓ChatGPT有一個自己的身軀。為了實現(xiàn)這個目標,需要制定一組重要的任務,即研究路線??梢砸?guī)劃的幾個任務是:先讓ChatGPT模仿人的動作,再讓ChatGPT生成自己新的動作,最后讓ChatGPT與人、外界環(huán)境交互。有了研究路線后,再選擇研究空間較大且用當前學術界的技術可以解決的科研任務,開始著手研究。

規(guī)劃自己的研究路線是“想idea”中最重要也是最難的一步。如果一個研究人員有特別豐富的科研經(jīng)驗,知道這個領域有哪些重要技術、重要論文、重要問題,很容易規(guī)劃出一個合理的研究路線。筆者設計了一棵“文獻樹”用來規(guī)劃研究路線,構建過程如下:首先列出自己科研方向上的大多數(shù)論文,閱讀論文并梳理論文解決了什么問題,根據(jù)問題將論文分類。這些論文解決的問題通常是有進展性的,難度是不斷加深的。然后梳理每個任務下的論文的一般性框架和流程,并根據(jù)技術框架進一步分類論文。這樣就建立起了一棵三層文獻樹。該文獻樹可以幫助自己清楚地了解該領域的重要問題和重要技術框架,從而有助于規(guī)劃研究路線。除此之外,以后寫論文時,可以把論文放到這棵文獻樹下面,根據(jù)該論文在文獻樹中的位置,判斷其貢獻程度,比如是否提出了一個新問題,或者提出了一個新的技術框架。

規(guī)劃好重要任務后,要找到任務中最前沿的方法面臨的技術挑戰(zhàn)。例如,探索算法上限的一個方法是在一些更具有挑戰(zhàn)性的數(shù)據(jù)或者設定下驗證該算法,看其實驗效果。這種方法除了幫助我們發(fā)現(xiàn)有意思的研究點,還能讓同行看到新的實驗結論和可能性。這在實驗上是一個很大的貢獻,在論文里放這些實驗結論是一個比較大的加分項。這種情況下,論文是比較容易被接收的。

確定好想要解決的技術挑戰(zhàn)后,就要構思解決方法。提出漂亮解法的前提是積累已有的解法,構建自己的“武器庫”。很多任務和實驗現(xiàn)象背后有相似的技術挑戰(zhàn),也就是一些方法效果不好的技術原因往往比較相近。因此,解決這些任務的技術思想較為通用。筆者構建武器庫的方法是構建一棵挑戰(zhàn)-解法樹(challenge-insight tree):首先收集一個研究方向存在的抽象技術挑戰(zhàn),然后收集這些技術挑戰(zhàn)下面的解法。例如,逆渲染任務(inverse rendering)常見的挑戰(zhàn)有渲染計算量較大和光照建模不準,應對這些挑戰(zhàn)的解法有預計算、各種光照模型等。逆渲染任務在不同設定下會經(jīng)常遇到類似的挑戰(zhàn)。在遇到類似的技術挑戰(zhàn)時,就可以在挑戰(zhàn)-解法樹中尋找解法,而不是從零開始構思解法。總體來說,構思解法的流程是:在新數(shù)據(jù)、新設定下嘗試現(xiàn)有方法,發(fā)現(xiàn)較差的實驗結果,分析其本質的技術原因,抽離表面問題得到真正的技術挑戰(zhàn);從武器庫中選擇一些技術,進行創(chuàng)新性的組合,解決該技術挑戰(zhàn)。

基于技術挑戰(zhàn)想解決方法的一個好處是,重要的技術挑戰(zhàn)會推動我們提出新穎的解法。如果一個技術挑戰(zhàn)可以被簡單的“A B”式技術組合解決,那么該技術挑戰(zhàn)可能不重要。重要的技術挑戰(zhàn)會有其獨特的地方,無法被簡單的“A B”式方法解決,因此會推動我們提出新的技巧或框架,將已有的一些技術進行創(chuàng)新性的組合,解決該技術挑戰(zhàn)下的特有問題。

除了上述常規(guī)的流程,“想idea”的過程還有一個特殊情況:當出現(xiàn)一個新“技術錘子”時,用這個新錘子嘗試解決研究路線上的一些科研任務是非常值得的做法。這樣容易做出有影響力的工作。舉兩個三維視覺領域的例子,當神經(jīng)輻射場(NeRF)這個工作出現(xiàn)時,有人將其用于三維重建的任務,實現(xiàn)了神經(jīng)表面重建方法NeuS。當穩(wěn)定擴散(stable diffusion)方法出現(xiàn)時,有人將其用于文本生成3D的任務,做出了DreamFusion。這種想idea的方式仍然屬于目標驅動型,拿一個新的技術解決科研路線上的任務,只不過不是分析當前任務面臨的技術挑戰(zhàn)能被哪些技術解決,而是分析新錘子能解決該任務的哪些技術挑戰(zhàn)。

階段2:如何做實驗

提出基本的解決思路以后,就可以開始做實驗,在目標數(shù)據(jù)上驗證算法。在實驗過程中,我們可能會遇到一些預想不到的問題,一般會在實驗過程中迭代式地改進算法。

做實驗一般是一篇論文完成過程中工作量最大的一個環(huán)節(jié)。好的實驗習慣和能力能夠極大地影響一篇論文的完成質量和速度。同樣的idea,有人用一年完成一篇論文,而有人用六個月就完成了,并且論文實驗很充分。造成兩者差異的原因就在于實驗習慣和實驗能力不同。

做實驗階段包含三個步驟:首先根據(jù)解法設計簡單實驗,用于快速驗證解法的正確性,然后在簡單實驗設定下改進并調(diào)通解法,最后用真實數(shù)據(jù)將這個解法實踐成功。

簡單實驗指的是只存在核心技術挑戰(zhàn)的實驗。一般而言,一個實驗數(shù)據(jù)不會只有一個技術挑戰(zhàn)。舉個例子,三維重建任務的目標數(shù)據(jù)可能同時存在相機位姿不準、目標物體紋理較弱、目標物體幾何復雜等技術挑戰(zhàn)。如果只想解決幾何復雜度的問題,可以先假設其他技術挑戰(zhàn)已解決,專注于在復雜幾何問題下驗證解法的正確性。簡單實驗有兩個好處:一個是降低實驗的難度,只需要解決一個技術挑戰(zhàn)即可;另一個是可以降低實驗的時間成本,如果在論文初始階段就在一個特別復雜的數(shù)據(jù)上做實驗,一兩個月以后發(fā)現(xiàn)解法不正確,那么就浪費了很多時間。

如何設計簡單的實驗?首先要明確論文想解決的核心技術挑戰(zhàn),然后分析當前數(shù)據(jù)或設定存在哪些額外的技術挑戰(zhàn),并尋找或人為構建額外技術挑戰(zhàn)的數(shù)據(jù)或設定。

設計好簡單實驗后開始在這組數(shù)據(jù)上驗證提出的解法。圖1展示了一個常見的實驗流程。首先基于一個idea進行實驗,實驗成功即可進入下一個實驗。如果實驗失敗了,就要分析實驗效果不理想的原因,并基于原因改進idea,然后進入下一個循環(huán)。這是一個經(jīng)典的實驗循環(huán)流程。根據(jù)筆者的個人經(jīng)驗,論文初期的實驗會經(jīng)歷幾十次這樣的循環(huán),在這些循環(huán)中研究人員會逐漸地收獲很多認知,一步步改進算法,最終得到一個效果理想的算法。實驗循環(huán)的迭代速度決定了做論文的時間。有人一天能經(jīng)歷五次循環(huán),而有人一天只經(jīng)歷一次循環(huán),前者做一個月的實驗相當于后者做五個月的實驗,論文進度的差距就拉開了。

淺談完成一篇論文的科研歷程與經(jīng)驗 - CCCF精選(科研論文寫作經(jīng)驗分享與交流)

圖1 一般實驗流程

做實驗的核心步驟是分析實驗效果不理想的原因。該步驟一般分為三步:發(fā)現(xiàn)實驗效果不理想的表面原因,發(fā)現(xiàn)本質的技術原因,通過實驗驗證這個原因。表面原因指一些表層因素,比如切換數(shù)據(jù)以后效果變差,那么數(shù)據(jù)就是一個表層原因。本質的技術原因指內(nèi)部的機理,比如為什么換了數(shù)據(jù)以后效果變差,數(shù)據(jù)的哪個特征導致效果變差?假設一些原因后,再通過實驗驗證該原因是否確實存在,然后有針對性地進行改進。

圖2展示了一個流程圖,用于發(fā)現(xiàn)實驗效果不理想的表面原因。筆者的經(jīng)驗是基于一個效果不理想的實驗,再設計一個效果理想的實驗,然后把兩頭的實驗固定住,分析兩個實驗的差異。

淺談完成一篇論文的科研歷程與經(jīng)驗 - CCCF精選(科研論文寫作經(jīng)驗分享與交流)

圖2 實驗流程圖

如果是數(shù)據(jù)造成了實驗效果不理想,一般有兩種情況。第一種情況是,同一個實驗中,可能有一些數(shù)據(jù)例子效果很好,而有一些數(shù)據(jù)例子效果較差,可以對比這兩組數(shù)據(jù)的差異。第二種情況是,實驗中所有數(shù)據(jù)效果都不好,此時可以切換到更簡單的數(shù)據(jù)再做一次實驗,看看簡單數(shù)據(jù)上實驗效果是否理想。找到一個讓實驗效果理想的數(shù)據(jù)后,再對比兩組數(shù)據(jù)的差異。

如果是算法模塊造成實驗效果不理想,可以先找到一個效果理想的算法,再對比其與之前算法的差異。在對比的過程中不斷地縮小兩個算法的差異,最終定位到一個關鍵的算法模塊或者技巧(trick)。

在分析本質的技術原因時,筆者總結了兩個可能的原因:代碼有bug和算法在某個數(shù)據(jù)上的效果不理想。查找代碼的bug有兩個方法:逐行檢查代碼輸出,驗證輸出結果和預期是否一致,以及檢查個人對算法的理解是否到位。

檢查算法問題的一個有效方法是看相關論文使用了什么技巧,給相關論文算法做消融實驗,找出算法的關鍵部分。一些情況下,算法本身沒問題,只是缺少技巧。一個經(jīng)典的例子是NeRF,該算法如果缺少位置編碼(positional encoding)這一技巧,效果會大打折扣。

在尋找問題的過程中,不能只歸就于某一個原因,不能一開始就覺得算法完全不行。算法效果不好很可能是多種原因疊加在一起造成的。算法可能在A數(shù)據(jù)上效果不好,但在B數(shù)據(jù)上效果很好。我們需要不斷地質疑算法,并同時相信自己的算法,尋找各方面的原因,包括數(shù)據(jù)難度、代碼bug、算法技巧等。最后,針對找到的技術原因,再有針對性地改進解法,暢想更多的解法。

在簡單數(shù)據(jù)上把算法調(diào)出理想的效果后,需要在真實數(shù)據(jù)上運行算法。這一步驟和前文描述的實驗流程類似。因為已經(jīng)驗證了核心的創(chuàng)新性算法,對于真實數(shù)據(jù),如果存在其他的技術挑戰(zhàn),只需要有針對性地使用一些已有的解決方法即可。

階段3:如何寫論文

論文是展示新想法的重要方式。優(yōu)秀的撰寫論文的能力能夠極大地提升一個idea的影響力。同樣的idea,有人能寫出非常有影響力的論文,而有些人卻只能寫出在接收邊緣的論文。一篇好的論文,寫作思路要清晰,能講清楚核心貢獻點。論文的實驗部分要有充足的對比實驗和消融實驗,以此驗證技術貢獻點的有效性。論文盡量在更具有挑戰(zhàn)性的數(shù)據(jù)上做實驗,以充分挖掘算法的潛力,擴展領域的想象力和可能性。

將核心算法在目標數(shù)據(jù)上實踐后,即可開始寫論文:(1)首先梳理論文的故事(story),寫一個類似論文引言(introduction)的初稿,同時整理論文所需的對比實驗和消融實驗。最好先做消融實驗,確認方法的最優(yōu)版本,然后做對比實驗。(2)構思論文方法(method)的提綱,撰寫論文方法,同步做論文實驗。(3)修改論文的引言和方法,同步進行論文實驗。(4)構思實驗的提綱,撰寫實驗。(5)撰寫論文的相關工作(related work)。(6)評閱論文,修改論文的引言、方法和實驗。(7)寫論文摘要,取論文標題。(8)反復評閱論文,修改論文。

組織論文的故事是“寫論文”階段的核心步驟。筆者常常使用“倒推-正推”法梳理論文的故事。在倒推部分,首先明確論文的貢獻是什么,比如提出了某個新任務,發(fā)現(xiàn)了某個新的技術挑戰(zhàn),提出了某個新技術;然后明確論文提出的技術有什么優(yōu)勢,解決了什么挑戰(zhàn);最后研究如何通過描述之前的方法引出論文解決的技術挑戰(zhàn)。

基于倒推部分回答的三點問題,在正推部分即可梳理出論文的故事:首先介紹論文的任務;然后討論之前的方法,引出論文解決的技術挑戰(zhàn);針對該技術挑戰(zhàn),論文提出了某個新技術;描述論文技術的優(yōu)勢。

論文實驗部分主要包括:對比實驗、消融實驗和一些可視化效果(demo)。消融實驗的目的是驗證論文提出的各部分技術的有效性,一般包含一張大表格和一些小表格。大表格列出論文核心技術貢獻點以及一些技術模塊對論文方法效果的影響。小表格分別列出某個方法模塊中的技術設計、超參的消融結果,或者是方法對輸入數(shù)據(jù)質量的敏感程度。

論文的demo與論文的影響力有較大關系。好的demo可以較好地展示論文技術的有效性,讓讀者直觀地體會到論文對領域的推動程度。因此,在目標數(shù)據(jù)上把算法調(diào)出理想效果后,盡量在更多新的有挑戰(zhàn)性的數(shù)據(jù)上做實驗,看看算法的極限,挖掘算法的潛力。讀者通常希望看到一個算法的效果能達到什么程度。論文在具有挑戰(zhàn)性的新數(shù)據(jù)上將一個算法調(diào)出理想效果是一個很大的貢獻。

論文寫完后,需要評閱論文,找出需要修改的點,通常是檢查論文是否存在被拒的因素,常見的論文被拒因素有以下五個方面。

1.論文貢獻不夠,沒有給讀者帶來新的知識,分兩種情況:論文想解決的技術挑戰(zhàn)已經(jīng)被很多論文解決過了,而且被解決得比較好了;論文提出的技術已經(jīng)被很好地探索了,該技術帶來的效果提升是可預?的。在這兩種情況下,讀者很可能看多了類似的工作,缺乏新鮮感。

2.寫作不清楚。常見情況是論文缺少一些技術細節(jié),導致論文不可復現(xiàn)。還有的情況是論文方法設計缺少研究動機(motivation),沒有講清楚為什么采用該設計。

3.實驗效果不夠好。論文方法的效果只比之前的方法好一點,或者是雖然比之前的方法效果好,但總體效果仍然不夠好。

4.實驗測試不充分。論文缺少重要的消融實驗、重要的基線方法以及重要的實驗指標,或者是論文的實驗數(shù)據(jù)太簡單,無法證明方法是否真的產(chǎn)生理想效果。

5.方法設計有問題。有四種情況:(1)論文的任務設定不切實際,沒有意義;(2)方法存在技術缺陷,看起來不合理;(3)方法不魯棒,需要在每個場景上調(diào)超參,對目標數(shù)據(jù)很敏感;(4)新的方法設計在帶來收益的同時,也引入了更強的缺陷,導致新方法的收益為負。

彭思達

CCF專業(yè)會員。浙江大學軟件學院研究員。主要研究方向為三維計算機視覺。pengsida@zju.edu.cn

特別聲明:中國計算機學會(CCF)擁有《中國計算機學會通訊》(CCCF)所刊登內(nèi)容的所有版權,未經(jīng)CCF允許,不得轉載本刊文字及照片,否則被視為侵權。對于侵權行為,CCF將追究其法律責任

淺談完成一篇論文的科研歷程與經(jīng)驗 - CCCF精選(科研論文寫作經(jīng)驗分享與交流)

版權聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 舉報,一經(jīng)查實,本站將立刻刪除。