于曉華等:機器學習和農業政策研究范式的革新

［作者：于曉華?唐忠?包特? 文章來源：中國鄉村發現點擊數：更新時間：2019-03-13 錄入：王惠敏］

摘要：傳統的農業政策分析偏重于分析變量之間關系和模型參數的估計, 而“機器學習”更注重對未來結果預測的準確性, 而后者恰恰是農業政策分析的目的。“機器學習”具有龐大的數據收集和儲存能力、強大的學習分析能力以及更智能化的語言分析能力等, 所以“機器學習”會對農業政策研究帶來革命性的影響。農業經濟學界要關注“機器學習”的發展, 在科研和教學中導入“機器學習”, 結合傳統的農業經濟學分析方法, 讓農業政策的制定更加精準、更加科學、更加強大, 政策溝通更加有效。

關鍵詞：機器學習; 農業政策研究; 農業經濟學; 預測; 計量模型;

一、前言

2018年是中國農業政策和農村發展歷史轉變的關鍵一年, 中央一號文件的主題是“鄉村振興”。在經歷改革開放后40年高速經濟發展, 中國農業占GDP的比重從1978年的28.2%下降到2017年的7.9%。農業小部門的趨勢會進一步強化。城市化率也達到58.5%。傳統農業政策側重關注糧食安全以及農民收入和貧困問題。這兩者在現在的中國已經基本得到解決 (于曉華等, 2012;Yu, 2018;于曉華, 2018) 。

現在農業和農村發展遇到一系列新的問題:農業生產成本上升、農業競爭力下降、進口和庫存暴增、農業生產的生態環境壓力巨大、農村老齡化迅速推進、鄉村人口不斷衰落。在這樣的背景下, 中央提出“鄉村振興”的偉大戰略, 指導今后幾十年中國農村經濟的發展走向 (于曉華2018) 。

鄉村振興是一個系統工程。一號文件提出的總要求為產業興旺、生態宜居、鄉風文明、治理有效和生活富裕。中國農業和農村處于一個劇烈動態變化之中, 如何制定更好且具體的“鄉村振興”政策和措施, 向學術界提出更高的要求。現實中存在多種政策模型, 不同的政策模型可能得出差距很遠的各種政策建議, 如何找到最合適的模型一直是政策分析中的難題。

伴隨著計算機計算和存儲能力的飛躍發展, 機器學習 (Machine Learning) 開始走到科學研究舞臺的前沿。機器學習是人工智能的一個分支, 它研究如何學習利用數據或者以往的經驗, 改善具體算法的性能 (楊善林等, 2004;Lesmeister, 2015) 。機器學習給科學研究和生活娛樂等各個領域帶來的影響可能都是革命性的。

機器學習給農業技術和農業政策研究提供了新的強大的工具, 也帶來很多新的挑戰。在農業技術領域, 世界主要發達國家開始利用人工智能發展精準農業, 以克服農業成本上升和老齡化的壓力, 提高農產品質量和產量, 降低農業對環境的壓力。由于中國農業的平均經營規模很小, 所以精準農業的應用發展滯后, 但是其在研究方面正在奮起直追 (金繼運, 1998;劉愛民等, 2000;李忠武等, 2001;趙春江等, 2003) 。

機器學習對農業政策研究帶來的影響也是巨大的。傳統農業政策研究過程一般是先收集數據, 分析主要變量之間的關系, 然后給出政策建議, 提交給政策制定者討論通過。考慮到計算機龐大的數據收集和儲存能力, 現在“機器學習”能夠自我分析學習這些數據, 發現傳統分析方法所忽略的一些規律, 并能考慮和模擬未來社會和經濟的動態變化, 然后提出更科學的政策建議。

傳統的農業政策分析, 更偏重于分析變量之間的關系, 而機器學習更注重對結果的預測, 而后者恰恰是農業政策分析的主要目的。相比較傳統的政策分析, “機器學習”在農業政策研究的某些方面可能更加精準、更加科學、也更加強大。

農業經濟學是一門應用科學。農業經濟學界要注重機器學習這方面的發展, 在科研和教學中導入“機器學習”, 結合傳統的農業經濟學分析方法, 讓農業政策的制定更加精準、更加科學、更加強大。

農業政策的制定和實施需要很好的溝通。一個好的政策建議需要和社會各界, 尤其是政府部門進行溝通。由于各個政策利益主體所掌握的信息和利益訴求不同, “機器學習”可以通過自然語言的學習和分析, 為各個利益主體量身定制政策溝通的方法, 使得政策建議能夠被社會各界廣泛接受并付諸實踐。

二、機器學習的發展

“學習”是獲取和傳遞人類知識的重要手段。“學習”在經濟學 (尤其是實驗經濟學) 研究中一直是一個重要的課題。知識和信息的獲取與市場均衡的達成過程, 都是一個學習的過程。Camerer (2003) 在其經典教科書《行為博弈》中總結了各種學習。這包括演化動態強化學習、信念學習、老練 (預期性) 學習、經驗加權吸引力學習、模仿學習、方向學習以及規則學習等。經濟學中對于“學習”的研究和機器學習中的”學習”有很多相類似的地方。

從計算機誕生后的1950年代起, 人工智能就開始成為一個重要的研究對象。作為人工智能的一個重要分支, 機器學習在1980年代后在人工智能界引起了關注, 逐漸發展成為一個龐大的具有廣闊應用前景的學科 (楊善林等, 2004) 。

機器學習的核心目標是機器從過去的經驗中學習出一般的規律, 并能夠準確分析和預測新的和未曾經歷過的任務。“機器學習”一般分為監督式學習、非監督式學習以及介于兩者之間的半監督式學習。Athey (2018) 通過經濟學的實際例子比較了他們之間的區別。非監督式學習主要是發現觀測對象的聚類, 得出他們相似處, 所以有時也被稱為“降維分析”。非監督式學習主要用來分析視頻, 圖片或者文字。對經濟分析而言, 非監督式學習可以幫助生成變量。而監督式學習主要是通過給出一系列特征或者變量 (X) 來預測一個結果 (Y) 。正如Athey (2018) 所強調的那樣, 監督式學習不是聚焦于預測, 而是機器在X和Y都可以觀測的情況下得到訓練, 然后用其他的X來預測Y。這和計量經濟學比較類似。但是計量經濟學強調估計參數, 而監督式學習更強調于預測的準確性 (Mullainathan等, 2017) 。

經過30多年的發展, 結合統計學和數學規劃等領域, 機器學習已經發展出很多學習方法。這包括決策樹學習、深度學習、強化學習、人工神經網絡學習、貝葉斯網絡學習、基因學習、聚類學習等方法 (楊善林等, 2004) 。不管哪種學習方法, 機器學習利用大數據作為過去的經驗, 結合數值模擬, 學習效率在很多方面超越人的認知能力。

機器學習已經在很多領域帶來革命性影響。比如在通過深度學習建立的Alpha Go在2016—2017年連續戰勝多位世界圍棋頂尖高手, 使其在圍棋界獨步天下。Athey (2018) 認為機器學習也會給經濟學帶來深遠影響, 會給經濟學帶來新的研究問題和新的分析方法。她認為主要的影響有這四個方面: (1) 機器學習并不會給經濟學分析的識別問題帶來新的幫助, 但是會讓模型的選擇更加富有彈性; (2) 機器學習可以很容易的比較各種實證分析模型; (3) 經濟學可以把模型“外包”給機器學習, 讓數據更能吻合模型; (4) 機器學習要修正模型, 以給估計結果提供有效的置信區間。

必須指出的是非監督式的機器學習對視頻、圖片和語言文字具有很強的學習和分析能力, 這可以幫助更加清晰的了解政策各個利益主體的需求, 從而實施有效的政策溝通。

農業作為國民經濟的重要組成部分, 農業經濟學作為一門應用科學, 機器學習給農業政策分析帶來的沖擊也必然是巨大的, 而很多影響現在還沒有體現。

三、機器學習對農業政策研究的影響

農業政策制定需要科學性和預測準確性。政策科學性的基礎是數據的有效收集、模型的科學建立以及模型計算的精準性和效率性。在計量經濟模型和統計模型已經逐步在政策分析中普及的今天, 政策分析的科學性似乎已經建立。機器學習能夠給農業政策分析帶來什么新的東西呢?

于曉華 (2014) 認為計量經濟分析需要注重數據和模型兩個方面的準確性以及計算的經濟性。本文在這里就對機器學習對政策研究中的數據、模型以及計算的影響做一個具體的分析。

1. 數據。

隨著計算機數據收集和儲存能力的不斷增強, 數據來源的不斷擴展。大數據已經漸漸成為經濟分析的基礎, 其對政策分析的作用是多方面的 (Einav等, 2014;張浩然等, 2004;Lesmeister, 2015) 。于曉華 (2014) 指出數據來源包括政府機關數據、調研數據以及網絡數據等。機器學習能夠給政策提供更多數據, 并能整合各種數據資源。

首先, 機器學習能夠提供更多數據。一個簡單的運用就是網絡爬蟲, 它能搜集并整理網絡相關數據, 減少數據收集的成本, 并增加數據的來源。其次, 數據來源是多方面, 機器學習可以通過學習分析整合不同的數據來源。既減少分析時間和成本, 也為政策研究提供更多的維度和信賴的結果。一個很好的應用例子就是周潔紅等 (2016) 運用網絡數據挖掘技術和文本內容分析方法, 對2009—2014年與中國豬肉質量安全相關的10160則新聞報道進行歸類分析, 從中總結食品安全事件中社會共治的3類主體———政府、生產經營者和社會監管力量, 各自發揮的作用及存在的問題, 并提出相應的政策建議。這樣的研究數據收集成本低廉, 更容易發現一些一般分析所難觀察到的經濟規律, 提出的政策更具有針對性。第三, 非監督式的機器學習能夠分析視頻、圖片以及語言文字等非標準化數據, 通過聚類等方法, 使得數據“降維”, 為政策分析提供新的變量以及更標準化的數據。但是, 還存在由于這方面的研究一定的技術障礙, 比如語言識別的精確性不夠、現階段這方面的應用還非常少見。最后, 機器學習還可以通過蒙特卡洛模擬等方法提供更多的分析或者模擬數據, 使得數據內容更加豐富, 使其政策預測更加準確。

總之, 機器學習能夠提供更多的數據, 把非標準化的視頻、圖片以及語言文字等“降維”為標準化數據, 并能夠整合不同的數據來源。這為政策分析提供了更全面更豐富的數據, 制定的政策更具有針對性。具體到農業政策分析, 機器學習可以收集古今中外農業政策的案例、成功和失敗案例以及現有各種相關的微觀宏觀調研和統計數據。比如于曉華等 (2017) 就指出歐盟共同農業政策的歷史發展過程和中國類似, 所以其成敗的經驗值得中國農業政策制定者學習。

2. 模型和計算。

相對于實證計量經濟分析更關注于參數的估計, 機器學習更加關注預測的準確性 (Mullainathan等, 2017;Athey, 2018;Lesmeister, 2015) 。機器學習出發點是數據, 然后找出最好的模型與之吻合。計量分析中如何權衡模型的表達性和吻合性, 一直是個難點。但是機器學習可以找到很多很好的方法來權衡 (Athey, 2018) 。

相對于計量經濟學中模型的選擇是預先設定的, 機器學習的出發點是數據, 通常是比較多個模型, 從而找出對數據吻合最佳的模型;很多時候, 機器學習的分析模型可能是非參數的或者是動態的。這樣, 機器學習的模型選擇更有彈性, 對政策結果的預測也更加準確。對于政策研究而言, 最重要的不是模型的精美, 而是結果的準確。如果機器學習提供的政策預測更加準確, 那機器學習在政策分析中淘汰計量模型的可能性就很大。

現實政策分析中存在多種模型, 模型的分析結果通常會差異很大, 這導致政策分析存在很大的爭議。但是, 機器學習可以通過自身強大的計算能力, 在農業政策分析時在自我的學習中分析過去各種農業政策案例的成敗經驗, 也可以對照各種變量建立聯系, 或者通過概率模擬分析政策的各種效果。這樣的政策建議會考慮政策歷史路徑, 參考其他國家的經驗, 結合現實和未來的各種可能選擇, 使得政策決策考慮更加全面、更加科學, 減少政策失誤的可能性。

政策分析中一個很重要的應用是時間序列變量之間的因果關系。趙國慶等 (2009) 分析建國以來通貨膨脹和糧價之間的格蘭杰因果關系, 發現兩者之間存在長期均衡。因為糧價過高會傷害消費者利益, 而糧價過低會傷害農民的利益。但是, 對于他們之間的因果關系還是存在很多爭議。格蘭杰因果檢驗的模型選擇存在一個難點:最優滯后長度的選擇, 不適當的滯后長度會導致分析結果存在謬誤。Lesmeister (2015) 指出運用機器學習可以選出最優的滯后量, 使得格蘭杰因果檢驗更精確。

我國的鄉村振興戰略作為一個長遠的系統工程, “到2020年, 鄉村振興取得重要進展, 制度框架和政策體系基本形成;到2035年, 鄉村振興取得決定性進展, 農業農村現代化基本實現;到2050年, 鄉村全面振興, 農業強、農村美、農民富全面實現”, 鄉村振興戰略具體政策制定時, 需要考慮的變量非常多、政策內容非常龐雜、政策目標甚至可能存在沖突, 短期目標和長期目標的協調, 各個利益主體的協調等因素 (全世文等, 2016) 。傳統的政策分析研究方法可能不夠系統性, 機器學習可以給鄉村振興戰略的政策制定提供很好的幫助, 使得具體政策的制定更加科學和精確。此外, 機器學習可以很好打破宏觀模型和微觀主體行為之間的界限。現有的大數據可以直接記錄和保存個體微觀的數據, 在政策的模擬的時候, 可以直接模擬到每個個體效應, 然后直接加總微觀主體的效果得到政策的總體效果, 使得其宏觀政策的偏差能夠更小。

四、機器學習對農業政策溝通的影響

農業政策的制定過程包括了政策研究、政策分析以及政策溝通。一個好的政策建議, 能夠上升為國家政策, 得以實施, 還需要很好的政策溝通。

政策制定會影響很多利益主體。具體到農業政策制定, 利益主體包括:政府、農民、消費者、糧食貿易商、糧食加工商、生產要素供給商、環保機構等。很多利益主體之間的利益目標并不是一致的, 如何和他們進行有效政策溝通就顯得尤其重要, 這關系到政策的順利通過和實施。全世文等 (2016) 和趙國慶等 (2008) 就指出建國后我國糧食價格的政府干預一直存在對農民利益和城市消費者利益的權衡, 糧價太高會傷害消費者利益, 糧價太低又會傷害農民的利益。如何通過溝通讓各個利益主體之間能夠求同存異, 保證政策實施顯得至關重要。機器學習在政策溝通中有很多優勢。

首先, 非監督式機器學習可以通過聚類法等學習相關的視頻、圖片、對話、以及文字等非標準數據, 獲取各個利益主體的利益訴求, 這樣在制定政策的時候可以考慮他們的利益, 使得政策更容易通過并實施。

其次, 中國的政策制定更多的是由上而下的過程, 政府在政策制定過程中的主導作用非常明顯。如何使政策建議更能夠讓政府接納, 這需要了解政府的政策偏好, 甚至對政策建議的寫作風格都有一定的要求。機器學習能夠對這些非標準的數據進行分析, 針對各個政策制定者的個人偏好定制不同的政策報告, 使得政策建議者和政策決定者之間的溝通更加順利, 政策建議更容易被采納。

最后, 政策被政府接納通過后, 其實施也需要和社會各界溝通。機器學習能夠很容易分析并反映出各個政策主體的利益需求, 從而可以通過視頻和圖片等手段對各個利益主體進行特別溝通。

現實中, 已經有學者開始運用機器學習中的文本挖掘技術, 對各種政府政策文件進行分析。韓國明等 (2017) 運用文本挖掘技術分析了1982—2016年的一號文件, 發現政府對農業經營主題的關心一直在變化, 但是家戶制始終貫穿其中, 農民的合作問題始終是決策層關注焦點。但是, 該分析只是關注了政府的一號文件, 社會對政策反饋等還缺乏深入分析。

以我國的鄉村振興戰略為例, 政策制定和實施所需要溝通的內容和對象非常多。鄉村振興的總目標為“產業興旺、生態宜居、鄉風文明、治理有效和生活富裕”。其利益主體不僅是農民和政府, 也包括涉農產業、環保工作、以及社會文化工作等利益主體。有些時候, 各個利益主體之間的利益可能是不一致的 (全世文等, 2016) , 比如產業興旺和生態宜居之間可能存在利益沖突。如何讓政策和各個利益主體有效溝通, 機器學習可以提供很好的幫助, 找出他們之間的共同點, 使得政策溝通求同存異。

中國處于一個高速發展的過程中, 政策處于動態變化之中 (蔡昉等, 2008;于曉華等, 2014;于曉華, 2018;Yu, 2018) , 如何就政策變化和各個利益主體有效溝通, 機器學習是一個很好的輔助手段。

五、總結

伴隨著計算機儲存和計算能力的發展, 大數據和機器學習開始走上歷史舞臺, 經過30多年的發展, 機器學習開始對科學研究和人民生活產生巨大且革命性的影響。

農業經濟學是一門應用科學, 而農業政策分析是農業經濟學的核心內容之一。機器學習對農業政策研究的沖擊是巨大且可能是革命性的。

傳統的政策分析更注重模型參數的估計, 機器學習更注重政策預測的精確性。它能夠提供更多的數據, 從數據出發, 通過智能學習和龐大的計算能力, 找到更吻合的模型, 從而產生最精確的預測結果。政策分析本身更追求預測的精確性, 這為機器學習在農業政策分析中廣泛應用提供了最好的土壤。

機器學習對非標準數據也有很強的學習能力, 比如視頻、圖片、對話以及文字等。機器學習通過“降維”學習為政策分析提供更多的標準數據, 也能更好的在政策研究中分析各個利益主體的利益訴求, 并為政策溝通提供很好的輔助手段。機器學習在進行農業政策分析時在某些方面超越傳統的分析手法, 所以在農業經濟學的研究和教學中導入機器學習, 也是不可避免的趨勢。在專業課程設置的時候, 對農業經濟學專業的學生, 要強化計算機編程以及統計學相關的訓練, 使得學生至少掌握一門機器學習相關的主流計算機語言, 例如R (Lesmeister, 2015) 或者Python。

隨著經濟的高速發展, 中國農業發展和農業政策處于一個快速的動態調整過程。2018年中央一號文件提出了鄉村振興戰略, 為今后的農業發展指明具體發展方向。但是具體的農業政策制定還需要更細致和科學的研究, 需要權衡各利益主體之間的關系, 權衡政策的短期目標和長期目標之間的關系, 考慮農業和國民經濟整體發展之間的關系等。精準而有效的農業政策制定以及與各相關利益主體之間進行有效溝通是一個巨大的挑戰, 機器學習有可能為制定有效且精準的農業政策、實現鄉村振興貢獻力量。

現有的農業經濟學者已經意識到機器學習對農業政策分析的重要作用, 并開始將其導入到政策分析中, 比如網絡數據收集和文本分析等 (周潔紅等, 2016;韓國明等, 2017) 。總體而言, 機器學習在農業政策分析中還基本處于空白階段。隨著機器學習技術的飛快發展, 它必然在不久的將來主動進入農業經濟分析領域。農業經濟學者必須要主動迎接這個挑戰。

作者簡介：于曉華德國哥廷根大學農業經濟與農村發展系 ;唐忠中國人民大學農業與農村發展學院 ;包特新加坡南洋理工大學經濟學系

中國鄉村發現網轉自:《農業技術經濟》2019年第2期&《三農學術》

(掃一掃，更多精彩內容！)

免責聲明：中國鄉村發現網屬于非盈利學術網站，主要是為推進三農研究而提供無償文獻資料服務，網站文章、圖片版權歸原作者所有，不代表本站立場，如涉及版權問題請及時聯系我們刪除。

于曉華等:機器學習和農業政策研究范式的革新

相同主題閱讀

最新發布