摘要:農業農村農民問題是關系國計民生的根本性問題,是社會科學研究中國發展最顯著的解釋變量。三農社會科學研究要立足中國本土、鄉土或城鄉空間,遵循“八股”范式。即圍繞科學理論和三農實踐需求提出問題,展開文獻綜述、找出“文獻缺口”,基于理論框架分析構建假說,對應框架內容確定素材,腳踏實地進行資料采集,使用實證研究方法,得出具有穩健性的結論,進行三農政策設計。扎實地學習中國國情,借鑒世界先進的研究方法,講述好中國故事,可以作為新時代三農社會科學研究者共勉的技術路線。
關鍵詞:三農問題; 社會科學范式; 實證研究; 方法論;
哲學社會科學是人們認識世界、改造世界的重要工具,是推動歷史發展和社會進步的重要力量。作為認識和改造經濟社會現象的科學,社會科學中被解釋現象的重要程度及其影響直接決定了理論解釋對社會的貢獻。農業農村農民問題是關系國計民生的根本性問題,是解釋中國發展最顯著的解釋變量。農業是人類衣食之源、生存之本,中國是世界第一人口大國,14億人民的衣食住行和自然休閑活動需要依靠農業;農村在空間上占國土面積最大,農用地與非城鎮的建設用地之和為674.79萬平方公里,這就意味著廣大農村地區占中國國土面積70%以上;在廣大農村地區生活著5.90億人口,即便將來城鎮化率達到70%,屆時仍將有4億多人常住在農村。以國民經濟中的重要地位、空間規模和人口數量論,三農社會科學研究在社會科學中也應當具有重中之重的地位。
英文主流社會科學期刊,大都遵循問題、文獻、假設、測量、數據、方法、分析、結論的“洋八股”模式。
一、第一股:提出問題
也就是說,為什么要做這個研究?研究意義的提出非常重要。農業農村領域的社會科學研究,是在中國三農發展實踐基礎上凝練具有一定普適意義的科學問題加以研究,增添經濟、政治、文化、歷史、社會、法律等大學科在農業農村場景下的應用。例如,三農經濟問題研究,就是要不斷豐富農業經濟學、發展經濟學、制度經濟學、勞動經濟學、環境經濟學、資源經濟學等細分學科的知識體系。
(一)問題的背景尤其重要
整個敘事的背景,要有比較高的站位。習近平總書記要求哲學社會科學工作者要“立時代之潮頭,通古今之變化,發思想之先聲”。對整個科學研究的背景,國家自然科學基金委員會提出“六期疊加”的概念:即全球新科技革命和產業變革的歷史交匯期、中國經濟和產業提質增效升級的全面轉型期、國家發展跨越中等收入陷阱的戰略突圍期、創新型國家建設的關鍵決勝期、科技體制和創新體系的深度調整期、基礎研究從量變到質變的重要躍升期。
(二)注意研究問題部分寫作中鉤眼
不論研究成果提交的對象是誰,都需要引起讀者的關注和興趣。這就需要加強邏輯連貫性來增強研究成果的可讀性。可讀性需要做到敘事邏輯清晰。“鉤眼扣”就是其中“硬核”的敘事邏輯,“鉤”和“眼”就是連接句子和段落的主要思想,增加過渡性詞語或者語義群。下圖就是鉤眼的一個例子。鉤眼連好,一氣呵成。
(三)中國的三農問題研究離不開中國的制度場景
很多制度演變或者結構演變的回顧是必要的。如何去回顧這一系列的政策呢?以
(四)問題的提出一般是帶問號的
什么樣的問題是“好”問題?觀察到一個現象,但凡與經濟學、社會學、管理學等的傳統邏輯有沖突,那么就有好問題蘊含其中。例如,落后地區就業門路少。但為什么落后地區有大量農村勞動力流入?這其中的傳統理論推論是落后地區就業門路少,應該有較少的農村勞動力流入。但是我們卻觀察到相反的現象,即有大量農村勞動力流入。再如,一般而言,書面合同比口頭合同法律效力更高。訂單農業需要簽訂書面合同,其違約率高達70%—80%,為什么批發市場上批發商多靠打電話做的口頭約定違約率卻僅有10%?找到一個好問題太難了,往往我們提出的問題沒有這樣恰巧的矛盾在其中。解決思路有三個:第一種是從現象出發,觀察到一個新的現象,要做一個理論和經驗證據的解釋。例如:
(五)問題來源主要是文獻和實地調研
問題從哪里來?或者說,怎樣生發出一個研究問題。一個來源是閱讀文獻。如經典文獻中說,二元經濟中農村剩余勞動力向城鎮和非農部門逐步轉移,導致剩余逐漸減少,最終達到“劉易斯拐點”。問題的另一個來源是實地調研。如筆者曾經與期貨公司的研究員們一同赴糧食主產區調研,就以期貨研究員的名義身份來傾聽農民合作社理事長、家庭農場、中小農業企業主的反映。當時發現了一個非常有趣的研究問題:規模經營主體在購置農機、修造設施等固定資產的時候,傾向于使用自有資金,而購買化肥、農藥等流動資產的時候,傾向于向信用社等金融部門借貸。這可能要從資金市場供給和需求兩個方面進行解釋。實際上,調研中觀察,觀察后讀文獻,讀文獻后再觀察,是“寓研于樂”的過程。這就是三農社會科學研究者讀“萬卷書”和行“萬里路”的目的。
二、第二股:文獻評述
文獻綜述是慣常的叫法。實際上,叫做“文獻評述”更為合適,因為文獻回顧要做述中有評。新聞需要“綜”述,而文獻需要“評”述。文獻評述的一般步驟是選擇主題、文獻搜索、展開論證、文獻分析、文獻批評、評述撰寫。
(一)按照自變量、因變量和“求解”來選擇文獻綜述主題并進行搜索
文獻主題的選擇實際上是有公式可以遵循的。公式很簡單,就是y=f(x)。y為因變量文獻;x為自變量文獻;f為“求解”即研究思路的文獻。例如:研究的題目是《農業補貼對農戶生產經營行為的影響:基于農戶模型的實證分析》,其中,“農業補貼”就是自變量,“農戶生產經營行為”就是因變量,“農戶模型”和“實證分析”就是求解,可以圍繞上述主題分解來搜索文獻。
(二)文獻搜索時可以利用各類綜述性研究精準“定位”
各類文獻綜述是集中獲取文獻的首要渠道。以經濟學為例,經濟學文獻雜志(Journal of Economic Literature)是值得參考的一本文獻雜志,在Jstor中能夠查到過刊,在EBSCO-EconLit能夠查到現刊。這本期刊基本只接受約稿,文章的作者一般是某一領域深耕多年的前沿經濟學家。JEL有一個“小號”,經濟學觀點雜志(Journal of Economic Perspective),也可以在上述數據庫中找到。如果研究某一方面的話題,在上述兩個期刊中如果能夠找到相應的文章,那么將會是一筆很大的財富。第二個集中獲取文獻的渠道是各種經濟學、社會學或其他學科的文獻手冊。例如:經濟學手冊叢書由著名經濟學家Kenneth Arrow和Michael Intriligator主編,由Elsvier出版社出版。該叢書分多個學科,有數理經濟學手冊、計量經濟學手冊等,由叢書主編邀約學科某一領域的前沿學者撰寫一章文獻綜述。經濟學手冊叢書與“三農”問題研究直接相關的是農業經濟學手冊,有關的手冊包括發展經濟學手冊、勞動經濟學手冊、環境經濟學手冊等。選擇與研究問題相關性比較大的章節進行深入閱讀,文獻回溯,事半功倍。第三個集中獲取文獻的渠道是名校教授的課程介紹(Syllabus)和文獻閱讀目錄(reading list)。例如:當今最前沿的經濟學家之一——麻省理工大學Daron Acemoglu教授的勞動經濟學課程介紹,其中提供了很多勞動經濟學的經典文獻閱讀。雖然是勞動經濟學方面的課程介紹和閱讀目錄,但是對“三農”領域社會科學研究借鑒意義也比較大。而且,他對文獻閱讀目錄分了各類專題,包含勞動市場外部性,社會流動、同群效應和人力資本,職業關注,效率工資,一般性和特殊性技能投資以及搜尋,匹配和失業等專題,這些經典文獻對勞動力轉移就業、農民工問題研究等有很大的借鑒意義。需要注意的是,文獻搜索到之后,并不是這一篇回顧就結束了,可以回溯文獻引證的文獻,關注引用本文的文獻,就能夠形成文獻的主干、脈絡和枝葉。
(三)文獻搜索之后要用信息化手段管理
建議用Noteexpress或Endnote等文獻管理軟件來整理文獻,這樣做最大的好處是能形成大量的長期性文獻積累。這些文獻管理軟件都可以在Word當中加載插件,很方便地實現文檔中插入格式化的參考文獻信息,并且可以根據文獻發表或提交的取向進行自動化修改。高校和科研機構圖書館一般都會提供中國知網、Elsvier、Jstor、Wiley-Blackwell等文獻數據庫的查詢。國家圖書館也可以提供每天一定數量的中外文獻下載。上述文獻數據庫都會提供文獻管理格式文件的下載,可以很方便地導入數據庫。
(四)文獻閱讀可以按照“先鳳頭、豹尾再豬肚”的順序
黃宗智先生給青年學者的讀書建議中提到:第一步,閱讀文獻的摘要、論文的引言、專著的第一章或導論;第二步,閱讀論文的結論、專著的最后一章;第三步,快速閱讀中間部分,專著的每一章也可以按照這樣的順序閱讀;第四步,一句話提煉核心觀點;第五步,記錄如何連接理論與經驗證據。實際上,真正掌握一篇好的文獻,還可以想辦法再現研究的過程,進行“逆向工程”。例如:對于值得參考的消費行為、公司財務等領域的實證研究,可以把研究方法等套用到三農社會科學的某一主題。
(五)文獻綜述應當遵循一定的邏輯
文獻綜述應當有自己的邏輯形式,一般比較忌諱寫成“XXX(2020)認為,……”這一形式,常見的文獻綜述表達形式有“梳理總結式”和“娓娓道來式”。一種是“梳理總結式”。例如,對農戶生產行為和消費行為可分性辨識的方法:“主要有如下四種:(1)當事人自己宣稱有某一市場的限制(Feder等,1990);(2)通過觀察對某一市場的參與情況,來推導市場失靈(Carter和姚洋,2002);(3)用不均衡模型估計某一特定市場的不完全(Carter和Olinto,2003);(4)通過結構化的方法,來預測邊際生產率,然后與市場價格相比較(Skoufias,1994;Sonoda,2008;Le,2009)。”24另一種方式是娓娓道來的形式。例如,本文筆者之一在討論農戶生產行為和消費行為不可分原因的時候,就采用以下娓娓道來的形式,“不可分性的原因經常被歸咎于市場失靈(Yotopoulos和劉遵義,1974),但不總是市場失靈。對利潤和家庭效用函數的特殊的參數化可以歸咎為市場失靈的結果,但是也許并不能從實證上檢驗可分性(P. Schultz,1999)。當土地和勞動市場被放在一起考慮的時候,家庭農場可能會有效地分配他們自身和雇傭的勞動(及土地)(如姚洋,1999;Deininger和Jin,2005),這一行為即使通過測度計量得到了證明,但是也只能說明勞動力市場或土地市場有不完善的情況(Seavy,1987)。”
(六)文獻批評和分析需要找出文獻的“缺口”
文獻綜述一般需要找到就某一問題觀點非此即彼的兩派文獻。從這一點上看,文獻批評難度最高。例如,黃宗智在《華北的小農經濟與社會變遷》一書中提出解放前的中國小農有“三副面孔”,這樣就分析出“左手邊”的一個派別,即小農的階級性,“右手邊”則批判舒爾茨為代表的“理性小農”的主張,在中間對恰亞諾夫的“勞動消費均衡論”有所發展。再如,林毅夫在《中國的奇跡:發展戰略與經濟》中也是“左手邊”批評重化工業優先發展思路,“右手邊”則批評“休克療法”,中間發展古典經濟學中比較優勢分工理論。文獻綜述要為整篇文章服務,指出文獻缺口。說明“我將做什么?”,從而彌補這一文獻缺口。實際上,文獻評述并不只在文獻評述部分,在問題提出、分析方法、結論等各個部分經常也需要有文獻為證。
三、第三股:理論框架
理論框架要沿襲研究范疇、研究范式與學術傳統。以農業經濟學為例,近年來傾向于用產業組織理論研究范式來分析農業生產與市場,或者以發展經濟學研究農村發展問題,或者采用動態優化模型研究農業農村資源環境。在理論框架分析的基礎上,一般會提出假說來揭示變量之間的因果關系。這一過程需要內部邏輯自洽,而且理論及其推論必須經得起經驗證據的檢驗。理論框架要取得邏輯自洽,必須依靠理論分析。這對研究者的理論功底要求較高,需要培養深厚的經濟學、社會學、管理學素養。
(一)要注意研究假說和研究假設的區別
研究假說和研究假設是完全不同的兩個概念。假說(Hypothesis)是要驗證的問題,例如誘致性制度變遷假說等。假設(Assumption)則是分析的前提和基礎,如經濟學中理性人假設等。實際上,假說推導而出的前提是假設。
(二)可通過數理經濟學分析構建框架、得出假說
某些情況下,研究框架用數學符號、公式推導證明等方法來表述三農各變量之間的關系。一個比較簡單的例子是柯布道格拉斯生產函數,Q=AKαLβ,兩邊取對數可以得到:logQ=logA+αlogK +βlogL。這樣就可以說資本和勞動力投入對產量的影響是正向的。而且,用資本和勞動力解釋之后,還會剩余有一部分變化,可以用技術進步等去解釋。上文提到的陸銘的文獻,就是一個典型的數理經濟學比較靜態分析得出研究假說的例子。
(三)通過圖形分析構建框架、得出假說
某些情況下,研究框架用學理性的圖形分析來構建。例如,在經典的農戶模型分析中,一個簡單圖形分析就分析出了農戶在農產品消費、其他產品消費和閑暇之間做選擇的過程。實際上,關于農戶模型的分析,更為詳盡的要數中島千尋對農戶模型多維度的分析。
(四)通過邏輯演繹分析構建框架、得出假說
還有些情況下,研究框架用語言邏輯演繹來構建。例如,林毅夫根據威廉姆森、諾斯、速水和拉坦的誘致性制度變遷假說,提出理論命題,主要是農村要素市場這個制度的發育與農戶邊際產值差異有關。然后從這個理論命題中演繹出明確的假說,農戶家庭勞動力、土地、資本增加,其勞動力、土地市場供給增加,雇傭勞動力、租入土地、租用機械和畜力的需求相加。順帶著,林毅夫還用Hausman檢驗驗證了技術的內生性,直接把計量經濟學和技術內生性連接了起來。
(五)理論框架完整的前提下也可以不把假說講得那么明確
一般而言,理論框架里面要把意欲驗證的符號“正負”講清楚。但是,也可以說得比較模糊。甚至,部分研究可以把兩個或更多競爭性假說放在一起。如彭玉生在研究宗族網絡對企業創業及發展影響時,根據邏輯演繹的第一個假說相對比較清晰,宗族網絡有助于私營企業創業與發展;第二個假說則是建立兩個競爭性的假說,假說2a:宗族網絡有助于集體企業的發展;假說2b:宗族網絡無助于集體企業的發展。最終,實證研究驗證的是假說2b,宗族網絡既無助于集體企業創業,也與集體企業壯大沒有顯著關系。
四、第四股:確定素材
如上文所述,一個研究能否成立,標準就是“兩個一致”。一是理論分析內部邏輯自洽是否一致,二是理論及其推論是否與現象一致。前者在第三股里面分析了,后者則需要理論與經驗證據的連接。從而第四、五、六股,主要就是關于理論與經驗證據的連接。確定素材就是確定經驗證據的來源。
(一)素材可以源自已有的統計數據
根據研究主題來確定統計指標的有用性,無論研究的主體部分使用何種素材,各類統計年鑒和數據庫提供的數據總能夠在交代背景、提出問題等方面發揮不可取代的作用。諸如《中國統計年鑒》《農業統計年鑒》《農村住戶調查年鑒》《農產品成本收益調查資料》、國研網、中經網、國泰安、農業普查綜合資料、人口普查與抽樣調查資料、經濟普查資料、各類價格調查材料,等等。此外,省(自治區、直轄市)也有統計年鑒,縣(市、區)也有自己的統計年鑒。
(二)素材是調查數據和定性研究材料集合
統計年鑒的數據總是有不能覆蓋研究所需的所有變量,那么研究者自行組織的調查因其靈活性,成為可以選擇的一個方式。實地調查研究可以形成案例資料,也可以形成供定量分析的數據庫。
(三)實地調查問卷要圍繞研究的主題
在問卷設計的階段,就要考慮實證研究的關鍵變量和擬采用的方法,應當把需要的自變量、因變量想好,甚至工具變量、控制變量都要設計好,圍繞研究這些變量設計相應的問卷內容。問卷的問題既要符合標準的說法,又要通俗易懂。這就需要設計者對政策有深入的了解。如“耕地地力保護補貼”“城鄉居民基本養老保險”等要深入了解政策推進的過程。再如,對一些基礎設施,如“安全飲用水”“動力電”“水沖式衛生廁所”等,要詳細了解相關國家標準或者地方標準。問卷要配備指標解釋手冊,并對調查人員進行比較細致的培訓。
(四)素材也可以來自各種合作形成的其他數據和資料
如果做實證研究,素材并非自己調查的來源,那么建議無論如何都應當實地做一份問卷,對問卷的結構有一個深入的理解。而且,要針對自己的研究內容,進行實地結構性訪談。
(五)典型調查往往能夠形成對定量分析的補充甚至導引作用
典型調查一般要形成案例分析所用的素材,這需要到實地進行比較長時間的“蹲點”訪談調研。典型調查一般具有較強的代表性,有助于理解某個普遍的社會科學現象。有時候,為了形成對某一問題較為深刻的理解,或者發現苗頭性問題,可能還要對反常的或極端的案例進行調查研究。
五、第五股:資料采集
資料采集可能是整個三農社會科學研究花費時間成本和資金成本最大的部分。如果能夠使用數據集成平臺的數據,則盡量使用數據集成平臺,這樣可以節省很多時間。一般而言,實地調研是必不可少的環節。資料采集就是收集經驗證據的過程。
(一)最大程度地占有資料
以往的實地調研,課題組一般都有專門的一位研究人員負責收齊紙質材料,調研回來要復印、裝訂成冊,供課題組人手一冊。而今微信等信息化手段讓現在的實地調研資料采集省去了很多麻煩。如有道云筆記、印象筆記等,都提供了電子材料收藏和共享功能。在調研過程中,在研究過程中,盡量把素材電子化,之后形成云筆記文件夾的形式,可以在課題組微信群或郵件中方便地共享。
(二)很多數據集成商提供了好的數據采集平臺
如果擬采用的數據有公開的統計渠道,還是盡量購買數據集成平臺軟件,可以實現數據采集的簡便化,從而省去一年一年地翻查統計年鑒的時間。但是,到縣一級水平的統計數據,數據平臺只集成很少的指標。如果要滿足進一步的研究,可能需要找具體的統計年鑒往外“扒”。Wind、Choice、布瑞克等數據庫都是數據相對齊全的集成平臺,基本能夠滿足“三農”社會科學研究的需要。在新冠疫情期間,國泰安CSMAR數據庫和EPS數據平臺都曾經提供免費的數據下載。
(三)很多國際組織和外國政府部門提供了數據和資料查詢系統
不同國別的數據在世界銀行、國際貨幣基金組織、OECD等網站上可以比較方便地查詢到。國際貿易數據有UNcomtrade可以按照國別、商品代碼等信息查詢。如果是針對某一個國家或地區具體的數據,可能需要到這一國家三農相關政府部門官方網站上進行查找。例如:研究美國農業法案,除了要到美國參議院、眾議院、農業部等官方網站上查找相關政策以外,還要到一些農業游說團體、大學農業政策研究等網站上采集資料。
(四)問卷調查要盡量減小抽樣偏誤
問卷調查盡量做到隨機抽樣,尤其是分層隨機抽樣。當然,非隨機偏誤也不必太過擔憂。如果樣本量大,且分布相對均勻,則可以克服非隨機抽樣的偏誤。那么,何謂大樣本?統計學界曾經有“30個以上”的說法,所幸中國分省(自治區、直轄市)數據樣本量能夠滿足30個以上。
(五)問卷調查要講究技巧和注意事項
問卷篇幅既不能太長,又要保證有效地收集信息。因此,問卷設計及試調查就顯得非常重要。特別需要提示的是,收入測算不能上來就問調查對象收入。一是被訪者就算再不重視個人隱私,也是忌諱別人問收入的;二是被訪者自己也記不清楚自己過去一段的時間的收入。可供選擇的做法是,調查員與農戶共同回憶,結合問卷計算各類細分的項目,加總得到一個金額,甚至都不必當場計算處理。因此,現場調查最好配備手持的計算器。很多問卷的技巧與調研地點和研究主題是密切相關的。
(六)案例調查可以參考決策樹的思想
在一個地方調查2—3個案例之后,一般會對研究主題有一定的聚焦,之后就發現了有值得深挖下去的“點”,就可以進一步挖掘。可以從時間縱向上挖掘,也可以從橫向差異上挖掘。例如,本文筆者之一曾研究稅費改革試驗,從時間上看后期會因方案變化產生差異,橫向上又會出現不同改革方案導致的“征實和征幣”“稅與費”等利益與行為選擇沖突,繼續深挖又會發現體制性的根源。
(七)每天調研結束后的調研組討論必不可少
一是調查的感想與發現,可以就調研發現的現象進行理論解釋,此時的討論可以起到頭腦風暴的作用。二是調研組交流調研的技巧和經驗,交流遇到的困難,及時進行協調克服。三是如果問卷調查的話,要對問卷進行檢查,有少填漏填、問不清晰的內容,要及時安排查缺補漏。再就是,對調查員要做一個研究中間的督促。如果是研究生作為調查員,可能會經常遇到這樣一種情況,該研究生需要做論文的問卷內容,他問得比較細致,而其他內容就會少填漏填。這會導致樣本損失,資金浪費,時間白花。實際上,對這位研究生的論文也是不利的。因此,對調查員的培訓和督促是必不可少的。
(八)大數據時代仍然不能忽視進村入戶調查
信息化發展給三農社會科學研究帶來了一系列機遇和挑戰。研究所依據的資料,更加具有樣本量大、實時性、多元性、完備性等特征。但是三農社會科學研究者,要以腳踏實地的研究為己任,還是需要堅持進村入戶的調查。通過“下村看實際,入戶話家常”,發現趨勢性苗頭性的問題,掌握更為縱深的信息,是必須堅持的研究方式。
六、第六股:實證方法
實證方法是連接經濟學理論與經驗證據的工具,必須基于理論和經驗證據的連接,才能得出結論。第一個需要明確的是,方法只是工具,現實問題、經濟學理論、經驗證據才是研究的本體,不能陷入“為了方法而使用方法”的怪圈。即便并不是進行嚴謹的學術研究,學習各種社會科學研究方法,并正確地使用它們,也將掌握認識世界的工具,從而有利于從事各種工作。第二個需要明確的是,各種經濟學研究方法并沒有孰優孰劣之分,不能因所謂的“技術含量”“邏輯層次”等,而歧視任何一種研究方法。實際上,各種研究方法經常綜合交叉應用,形成對彼此的補充。
(一)歷史分析方法
通過對三農領域某一主題有關歷史資料進行科學的整理和分析,詳盡描述其歷史沿革、如何發展到現狀,并就這一主題對農業生產、農村發展、農民經濟社會行為變遷進行研究。農村改革每到一個標志性的節點,都會有一系列回顧性的文獻問世。例如,根據改革40年的經驗,可以發現農村制度創新、農業技術進步、農產品市場化改革和農業生產力投入是農業增長的主要驅動力。
(二)比較研究方法
在三農問題研究中,比較研究方法一般對不同國家或者地區的制度、績效的相似性或相異程度進行研究與判斷,經常會得出相關經驗和教訓的啟示。舉一個例子,在研究農產品流通主體時,可以將我國的情況與發達國家的情況進行比較。在發達國家農產品流通主體一般是農民協同合作組織,而我國依然是農產品經紀人、合作社、批發市場、龍頭企業并存,這就造成我國農產品流通中農民市場力量較弱。近年來,散見于諸多文獻中的國外農業農村農民問題考察報告等也屬于比較研究方法的具體應用。
(三)案例研究方法
結合三農研究實際,以典型案例為素材,并通過具體分析、解剖,展現特定的情景和過程,建立一種“實踐感”,從而尋求解決問題的方法。在很多社會科學研究中,研究者幾乎無法對研究對象進行控制,只能對具體的情景材料進行收集整理,所以案例分析在這種情況下尤為重要。實際上,案例研究經常作為定量研究的先導或者穩健性檢驗。
(四)數理經濟分析方法
依據數理經濟學分析方法,對三農問題進行數理經濟學分析,就是用數學符號、公式推導證明等方法來表述農業農村農民相關各變量之間的關系。上文已有舉例。
(五)描述性統計方法
統計圖表就是典型描述性統計方法的應用。描述性統計方法一般會與其他研究方法相結合,在使用計量模型分析之前,往往會對使用的變量進行描述性統計。最起碼,應當展示變量的均值和標準差。常用的統計學指標包括均值、方差、標準差、中位數等,可以求助于任何一本統計學教材。根據研究需要,研究者可能還會構建自己的一系列描述性統計指標。例如,CR4是行業前四名市場份額集中度指標,勒納指數和赫芬達爾—赫希曼指數可以用以度量農產品或農資市場中壟斷力量的強弱。近年來部分文獻對農產品流通的各個環節進行描述性統計分析,研究諸如利潤分配、流通費用的問題,也對政策有重要的指導意義。
(六)計量經濟分析方法
習近平總書記在哲學社會科學工作座談會上指出:“對現代社會科學積累的有益知識體系,運用的模型推演、數量分析等有效手段,我們也可以用,而且應該好好用。”當前,應用計量經濟學模型研究三農社會科學問題的文獻可謂汗牛充棟。本文的篇幅依然有限,窮盡不了所有的數量分析方法,僅僅做一個拋磚引玉。雖然經驗研究總是有這樣或那樣的局限性,但經驗研究還是規范化的標志。立足中國現實,用現代方法研究中國問題,用國際語言講述中國故事,三農社會科學研究仍然任重道遠。
1.回歸分析
違背回歸分析的幾個經典假設會相應地派生出很多新的方法。
(1)多重共線性。
實際上,回歸經典假設中的非完全共線性是一種極端。即使是比較強但不完全的共線性也會導致系數的不穩定,主要表現為系數標準誤很大。例如,構造回歸模型研究農戶收入的影響因素,自變量考慮農戶教育水平和能力水平(可以用智商代替),那么能力肯定與教育水平相關,于是多重共線性就產生了。完全可以通過做自變量之間的相關系數矩陣來判斷,如果相關系數太大,那么就意味著需要一些處理。第一種是根據經濟學理論重新選擇變量,實際上這可能是最佳方法;第二種是逐步回歸,但是這種方法經常會剔除掉一些符合經濟學原理的變量;第三種是采用有偏估計方法,例如嶺回歸方法。
(2)奇異值。
奇異值的英文名字非常有意思,叫做outlier,字面翻譯是“躺在外面的那位”。但是,這個“躺在外面的那位”卻經常導致估計的系數不穩定。近年來普遍的現象是受過大學教育的人回鄉創業,假設他從事了糧食生產,那么在控制其他規模性的變量之后,他還是難以獲得比較高的收入,于是這個奇異值就導致教育的系數偏小。處理奇異值的方法有三種:第一種比較簡單,觀察數據結構,將奇異值刪除,比較極端的是對自變量進行截尾處理,如將最大的1%和最小的1%全部刪除。但是這是萬不得已的選擇,因為奇異值的產生可能反映了一種社會科學現象,例如受過高等教育的人回到農村從事農業生產。第二種是進行縮尾處理。例如將落于如1%分位點到99%分位點之外的觀察值分別替換為1%和99%分位上的數值。第三種,也是比較好的辦法,是穩健回歸,很多計量經濟學軟件,例如stata可以很簡單地實現。
(3)異方差。
回歸經典假設之一是回歸模型中的殘差必須相等。否則,t檢驗會沒有意義,而且模型的預測作用也會遭到破壞。比較常見的異方差處理方法是加權最小二乘回歸,即將因變量賦予某一個權重,例如用因變量除以一個自變量等。
(4)非線性。
在回歸分析中,如果將非線性關系誤當做線性關系來估計,那么會得到錯誤的回歸系數。因此,在回歸分析之前,做自變量和因變量關系的散點圖就尤為重要。常見的處理方法是將自變量取對數,有時候因變量也會取對數。如果回歸方程兩邊都取了對數,那么估計的系數也就被賦予了彈性這一經濟學意義。有些情況下,也會對自變量取平方等,也就意味著因變量與自變量的關系出現了“U形”或者是“倒U形”。
2.處理內生性的一些努力
回歸方程中,自變量與誤差項的相關。這有可能是由于自變量與因變量因果倒置或者互為因果,也有可能是因為遺漏了重要變量。有計量經濟學家直言:“內生性是計量模型擺脫不去的惡夢。”內生性的處理辦法也有一些:
(1)工具變量法。選擇一個與自變量相關,但是與誤差不相關的變量。例如,研究農業生產力對外出打工的影響,由于外出打工反過來會導致農業勞動力投入減少,從而導致農業生產力下降,于是就產生了反向因果。可以用降雨量做農業產出的工具變量。
(2)兩階段最小二乘法。簡單一點描述,就是將工具變量方法推廣到了多工具變量的階段。
(3)雙重差分法。或稱倍分法。在某項農業政策效果分析中,這一方法經常使用。有時候,簡單的雙重差分法實際上就是設置交乘項,對該變量的系數進行估計。例如,研究戶籍制度改革對農村勞動力流動的影響,可以根據戶籍改革省份不同的推進年份設置交乘項,從而估計戶籍制度改革的影響。
(4)傾向值匹配法。在政策效果分析中,這一方法也比較常用,通過對各觀察樣本特征進行分析,將最為相似的樣本匹配在一起,通過對享受政策與否的樣本進行比較,得出政策效果。實際上,目前為止最趨向完美的傾向值匹配法可能就是同卵雙胞胎數據。因為同卵雙胞胎在家庭背景、顏值、智商甚至大部分后天能力等方面是比較相似的,因此,使用這樣一種“近乎完美的”傾向值匹配后的數據進行回歸,可不用擔心遺漏變量造成的內生性。中國學者最早使用過同卵雙胞胎數據,分析教育差異對收入的影響。
(5)斷點回歸。前提是識別一個斷點,例如測算新型農村社會養老保險的影響,如果只有年滿60周歲的參保人才能夠領取養老金,那么60歲就是斷點。當然由于政策執行嚴格的程度,這個斷點也有可能是“模糊斷點”。
(6)合成控制和回歸控制。例如,研究撤縣設區的經濟影響,構建的假說是:撤縣設區增加勞動力轉移就業的機會,這樣就可以選擇一個近期撤縣設區的“A區”,用其他與其狀況相似的沒有撤縣設區的縣的特征,用主成分分析合成或回歸分析方法擬合出來一個“A縣”,比較這個“實際存在的A區”與“合成的A縣”二者在勞動力轉移就業上的差異。
(7)面板數據分析。這對數據要求較高,必須獲得連續多年的追蹤數據,而且很多農業經濟變量年際之間差異較大,所以這一方法使用的前提是獲得高質量連續多年的追蹤數據。通常的情況下,經濟學的分析中,選擇面板數據固定效應模型的較多,這是因為隨機效應經常出現有偏估計。
3.離散選擇模型
有時候,因變量不是連續變量,而是二分變量。例如,對于農戶是否選擇參與訂單農業,變量就只取0或者1,這種情況下,經常選擇Logit模型或者Probit模型對相關問題進行計量經濟學分析。如果因變量的取值更多,如經營主體在選擇農產品的運輸方式時,可以是人力拖運,可以是汽車裝運,也可以走水路又輪船運輸,甚至某些農產品可以走空運,那么就可以選擇多元Logit模型。如果離散型因變量是定序的,一般而言,定序Logit模型因變量之間的離散程度應該是均勻的。
4.選擇性模型
在農產品流通的實證分析中,經常遇到這樣的因變量,其取值大量為零。例如:一個農產品加工企業可能大量出口,也有可能不出口,那么這就導致因變量大量為零,本來這需要使用受限因素模型——Tobit模型。
5.時間序列分析
時間序列分析是研究農產品價格問題經常用到的方法。例如,對于糧食的月度價格變化規律,可以使用各種自回歸移動平均ARMA模型進行研究,加入季節性因素加以差分,就變成了ARIMA模型。對于兩個平穩性時間序列之間的統計學因果關系,經常需要使用格蘭杰因果方法來檢驗。具有因果關系時間序列之間會存在長期的協整關系,然而短期內幾個時間序列組成的經濟系統又常常會受到外生變量的干擾。因此,向量自回歸模型是一個較好的選擇。農產品價格與其他時間序列變量(如農產品價格與通貨膨脹)之間存在長期均衡關系,甚至不同農產品價格(如豬肉價格與玉米價格)之間也存在長期均衡關系。這種關系就是協整。有時候,農產品價格會對前期的非均衡程度作出修正,因此,向量誤差修正模型經常作為一種選擇出現。在衡量制度的變化時有時候會在時間序列中使用虛擬變量。然而,制度的影響有時候并不是突變的,所以,虛擬變量可能并不合適,在近期的文獻中非線性時間序列分析也逐漸得到應用。另外,面板數據因為具有時間序列的性質,也可以用非線性的模型。例如,面板門檻回歸模型。
6.空間計量經濟學
實際上,空間計量經濟學與地理信息系統關系極為密切。很多時候,地理信息系統展示得比較直觀,并且可以通過一系列地理信息識別來為空間單位賦值。在此基礎上,橫截面、面板等數據中加入空間權重,根據需要,進而考慮時間序列依賴和空間依賴,甚至把空間依賴分解為周期性共同趨勢和“相對干凈”的空間相關,例如,農業機械總動力在縣域水平上的變化,可以用地理信息系統展示,并且可以使用空間計量經濟學分析。
7.分位數回歸
分位數回歸提供了對解釋變量和被解釋變量的分位數之間線性關系的估計方法。例如,在分析農村人居環境質量的時候,有些自變量,例如村莊規劃,對于農村人居環境質量較低和較高的村莊促進效果存在差異。分位數回歸可以衡量出這種差異。
8.隨機試驗方法
將研究對象進行隨機分組,同時對對照組和試驗組實施不同干預并比較干預效果。社會科學里面很難做實驗,但是20世紀90年代中期,隨機試驗法開始在發展中國家被應用于政策評估。2019年諾貝爾經濟學獎就是授予經濟學隨機試驗方面的前沿經濟學家Abhijit Banerjee、Esther Duflo和Michael Kremer,以表彰他們“在減輕全球貧困方面的實驗性做法”。
9.機器學習
在機器學習這個大門類下,Lasso系列的懲罰回歸在分析高維數據上具有優勢,決策樹在預測方面效率較高,支持向量機是比較優秀的分類器,隨機森林可以用于模型變量選擇,等等。在大數據和人工智能的時代,三農社會科學研究者需要緊跟時代,強化學習,克服“本領恐慌”。
七、第七股:檢視結論
結論部分一般就是證明或者證偽假說,從而對理論框架進行驗證。很重要的一步是穩健性檢驗。如果幾種研究方法綜合應用結論“打架”,甚至得出與中國現實不符的結論。那么,必須回過頭去求助于社會科學理論,或者檢視研究方法是否應用正確,或者尋找新的經驗證據。穩健性檢驗之后的文字性的結論,實際上是很簡要的。主要目的在于重述整個研究,強調一下研究的貢獻,指出一些研究的未盡之處。
(一)穩健性檢驗一般不能“缺位”
建立競爭性的假說,或者使用不同的方法,來檢視一下結論是否仍然成立。經驗研究中,可能穩健性檢驗要占到很大的篇幅。計量經濟學分析來進行穩健性檢驗,需要盡可能引入控制變量,使用各種方式減輕內生性影響。或者換一種方法,也就是說第六股中的研究方法都可以用于穩健性檢驗。還有一些常用的穩健性檢驗方法,包括剔除樣本、替換變量、變換樣本、工具變量、距估計方法,等等。實際上,具有典型意義的案例、全國或更大范圍的統計數據、來自其他國家和地區的經驗等,也可以作為穩健性檢驗的手段。
(二)結論要對整個研究進行總結提煉
這個研究提出了一個什么樣的問題,圍繞這個問題本研究在文獻體系中的地位如何,或者找出了哪些文獻缺口。為此,本研究設定了什么樣的研究目標,構建的是什么假說。為了研究目標設計研究內容,構建理論框架,對應著研究內容需要什么樣的素材,采集哪些數據和資料。對應于數據和資料采用一系列怎樣的研究方法,得到什么樣的結論,而這些結論又具有什么樣的意義。實際上,有時候結論部分容易寫成摘要。區別在于,摘要更加簡潔,結論可以發揮的篇幅略大,而且經常要引發今后的研究。馬克思主義認識論告訴我們,認識要螺旋狀上升,即調研生發問題,文獻校準問題,實證得出結論,再調研校準結論并生發新的問題。實際上就是,行萬里路,讀萬卷書,寫萬言文,不斷地循環這一個過程。
八、第八股:政策設計
政策設計是三農社會科學研究學以致用的體現。在當代中國亟需完善制度頂層設計和政策分層對接的背景下,由科學規范的研究得到科學的結論,為政策設計提供決策參考,甚至可以作為研究的主要目標之一。
(一)政策設計要緊扣研究結論
研究結論推導不出來或者引申不出來的政策啟示不要體現。例如,上文提到的,我們發現村莊規劃對人居環境質量影響是正向的,那么一條政策建議就可以是“完善村莊規劃,促進人居環境質量提升”。但是,如果得出“村莊規劃中提出未來20年的明確目標,能夠促進人居環境質量提升”這樣的政策建議,雖然有一定的道理,但是并不是實證研究結果明確發現的。
(二)很多政策建議可以從先進地區的經驗來
實地調研的重要性就凸顯出來了。例如,“發動和依靠群眾,堅持矛盾不上交,就地解決”的“楓橋經驗”,就寫入了十九屆四中全會《決議》。實際上,當下的農村改革試驗有很多。很多案例和綜合的素材,可以用社會科學研究方法來集成研究,之后提出來有意義的決策參考、示范經驗,為政策分散風險、分解困難。
(三)借鑒國際經驗一定要看外文原文
在借鑒國外經驗的時候,不要過分相信二手文獻。盡量閱讀外文原文,例如,世界銀行、世界貿易組織、國際貨幣基金組織、聯合國糧農組織等國際組織的網站,世貿組織、經合組織等網站上每隔一段時間會提供分國別的一段時期內的政策回顧,國際食物政策研究所等國際研究機構網站也會提供某個國家或地區的發展經驗教訓,特定國家的農業部或農業農村研究部門的網站也是國際經驗文獻的重要來源。
(四)政策可以作為一種模擬情景放入預測模型
可計算一般均衡模型或局部均衡模型為我們提供了有力的動態分析工具,模擬的情景經常包括不同的經濟增長速度、不同的城鎮化速度,實際上政策設計也可以作為一種情景放入這種“大模型”進行預測。
習近平總書記在哲學社會科學工作座談會上指出:“要按照立足中國、借鑒國外,挖掘歷史、把握當代,關懷人類、面向未來的思路,著力構建中國特色哲學社會科學,在指導思想、學科體系、學術體系、話語體系等方面充分體現中國特色、中國風格、中國氣派。”這就告訴我們,要扎實地學習國情,培養對中國問題的敏感度。然后創造一切條件,踏實學習社會科學研究方法,進而研究中國的問題,講述好中國故事。從歷史和現實、理論和實踐相結合的角度深入闡釋如何堅持中國道路、弘揚中國精神、凝聚中國力量。
(作者彭超系農業農村部管理干部學院鄉村振興研究中心主任、研究員;朱守銀系中共農業農村部黨校副校長、農業農村部管理干部學院副院長、研究員;朱信凱系中國人民大學黨委常委、副校長,中國人民大學農業與農村發展學院教授、博士生導師,長江學者特聘教授)
(掃一掃,更多精彩內容!)