經濟學家洪永淼:ChatGPT對經濟學研究範式的影響
2月18日,2023年春季首屆中國數字經濟發展和治理學術年會在清華大學順利舉辦。會議由清華大學經濟管理學院、公共管理學院和計算社會科學與國家治理實驗室承辦。中國科學院大學經濟與管理學院院長洪永淼教授在大會發表題為《人工智慧新近發展及其對經濟學研究範式的影響》的主旨演講。本文根據洪永淼教授現場發言內容整理。
今天主要和大家一起交流人工智慧新近發展,特別是ChatGPT的發展理念與方法論,對經濟學研究範式的影響。
一、數智時代的基本特徵
在數智時代,大數據為人類社會提供了認識世界、改造世界的新思維,即大數據思維。大數據思維是通過大數據去發現、理解現實複雜系統的運行狀態與發展規律,分析、解決現實問題,探索、預測未來變化趨勢的新範式、新方法、新工具。大數據思維與現代經濟學的主流研究範式是一致的。現代經濟學的主流研究範式是實證研究,以數據為基礎,應用計量經濟學方法推斷經濟變數之間的邏輯關係尤其是因果關係,從而揭示經濟的運行規律。大數據思維的實現方式是人工智慧,特別是機器學習。
那麼,以ChatGPT為代表的人工智慧先進技術的發展理念與方法論,會對經濟學的研究方法與研究範式產生什麼潛在影響?
二、ChatGPT與大模型範式
ChatGPT的方法論是“規模至上”,其演算法基礎是大語言模型。大模型是參數維數極大的模型,這些參數需要通過數據訓練或估計。大語言模型是指輸入數據主要為文本數據的大模型。實際上,大語言模型在深度學習發展階段就已出現。隨著人工神經網路模型的隱藏層不斷增加,其參數數量呈現快速增長。文本數據本質上是高維或超高維數據,簡約模型無法刻畫異質性高維數據的特徵,因此需要使用大語言模型。從計量經濟學視角看,大模型最主要優點是系統偏差比較小。同時,由於ChatGPT的訓練數據主要來自互聯網文本數據,樣本容量極其龐大,從而保證了大語言模型參數的估計精度。因此,大語言模型具有比較強的泛化能力,即樣本外預測能力。
長期以來,計量經濟學與統計學面臨的一個困擾是“維數災難”:當模型參數維數相比數據容量不是很小時,雖然模型偏差比較小,但因為參數維數大,在有限數據容量條件下,對每個參數的估計不甚精准,導致模型過度擬合,其樣本外預測能力較差。“維數災難”不僅存在於計量經濟學與統計學,在社會科學和自然科學很多領域也存在。ChatGPT通過使用海量互聯網大數據,確保訓練數據容量遠大於模型參數維數,從而避免了“維數災難”。
三、大模型與經濟學研究範式
作為學術研究的好助手,ChatGPT可大幅提高研究效率。在經濟學研究中,可借助ChatGPT搜索資訊、收集數據、撰寫文獻綜述、編寫代碼、檢查程式、設計實驗方案、翻譯文本等。雖然目前ChatGPT的表現仍有不少缺點,其整體智能水準與人類相比尚有不小的差距,但可以預計,隨著人工智慧技術的發展以及ChatGPT廣泛應用的經驗積累,ChatGPT的智能程度在很多方面將日益接近甚至超過人類。ChatGPT及其大模型方法論可能會對經濟學乃至整個社會科學產生深遠影響。
比如,ChatGPT與大模型將對計算經濟學產生較大影響。計算經濟學與計算金融學已存在相當長一段時間。經濟學是一個比較複雜的系統,數學經常無法給出解析解,這時就必須用到電腦模擬仿真方法,經濟學家比較熟悉的有可計算一般均衡模型和基於主體的模型(Agent-Based Model)。近十年出現的計算社會科學就是一種數據密集型研究範式。再如,ChatGPT與大模型將對經濟學的理性經濟人假設產生較大影響。實驗經濟學研究表明,人類經濟行為並不滿足完全理性假設,更多表現為有限理性,甚至存在預期偏差。但是,ChatGPT能夠改進理性經濟人假設,基於人工智慧或人工輔助的決策有可能成為計算經濟學的一個重要研究方向,比如提供理想參照系、定量政策評估以及進行人工智慧決策等。
我今天重點探討ChatGPT與大模型將對計量經濟學產生的深遠影響。計量經濟學有兩個原則,一個是簡約模型原則,即如果能用最簡單的模型去總結最多的數據,那就是最好的統計模型;另一個是充分性原則,用低維統計量總結樣本資訊。20世紀,統計學存在參數與非參數建模的方法論之爭。統計學家Ronald Fisher認為非參數模型因其參數維數高而估計不精確,主張使用參數維數較少的參數模型;另一位統計學家Karl Pearson則關注參數模型可能誤設而產生較大偏差,主張使用非參數模型。計量經濟學也有類似爭論。2003年諾貝爾經濟學獎得主Robert Engle主張從特定模型出發,通過檢驗遺漏變數等計量經濟學方法拓展模型,這是所謂的“從特殊到一般”的建模方法;而倫敦計量經濟學派代表人物David Hendry則主張從高維的一般模型出發,通過統計學假設檢驗與經濟理論約束條件等方法得到特定模型,這是所謂的“從一般到特殊”的建模方法。“從一般到特殊”的建模方法更適合大數據分析,更接近數據驅動研究範式。但是,兩種建模方法的最終目的都是獲得一個具有經濟可解釋性的簡約模型,參數不多且有經濟含義,同時擁有良好的樣本外預測能力。為了獲得簡約模型,計量經濟學與統計學提出了很多經典降維方法,比如主成分分析、因數模型、模型選擇、經濟理論約束等。在大數據時代,由於潛在解釋變數或預測變數很多,新的統計降維方法也不斷產生。例如,人工智慧與統計學的交叉產生了一個新領域——統計學習,其中一個代表性降維方法是LASSO回歸。LASSO的基本思想是假設大量潛在解釋變數中只有少數變數有重要影響,在此稀疏性假設下,通過引入適合的懲罰項,以犧牲估計偏差為代價,換取估計方差的大幅度減少,從而顯著降低均方誤差,達到精准選擇重要變數和改進樣本外預測的目的。
統計學與計量經濟學一直考慮的數據均是“小”數據,相對人類擁有的海量大數據來說,只是使用了“滄海一粟”,大量數據資訊沒有被利用。目前,統計學和計量經濟學的研究還是以模型為重心,特別是以降維為導向,這主要是受到可解釋性需求、數據容量、計算資源等原因的限制。在預測經濟金融數據方面,機器學習比傳統計量經濟學模型有顯著改善,但尚未達到令人滿意的程度,特別是與其他領域(如人臉識別)相比,更是如此。這主要是因為經濟金融系統是複雜系統,受人類心理影響很大,而且經濟金融系統具有時變性。為顯著改進經濟金融預測,可以考慮大模型範式。大模型可以容納高維影響因素,允許模型參數時變性或非線性影響,顯著減少預測偏差或模型偏差。同時,大模型使用了海量數據,對數據的估計精確度有一定保障。實際上,計量經濟學與統計學中的模型組合或模型集合就是一種大模型研究範式,計量經濟學已經開始往大模型方向發展,只是發展速度遠遠比不上ChatGPT。因此,可以考慮使用大量的非結構化數據,通過類似ChatGPT的建模方法來大大改進經濟金融預測。在這方面,熱力學與統計物理學的發展歷史經驗或許可以給我們一些啟示。關於黑體輻射,曾經出現兩個理論——在短波範圍擬合較好的維恩近似,以及在長波範圍擬合較好的瑞利-金斯定律,後來普朗克將兩者綜合起來,提出了適合全波段範圍的黑體輻射定律。在經濟學研究中,大小模型各有優缺點,那麼是否可以找到更好的方法把這兩種模型結合在一起,從而提高模型的經濟可解釋力和預測力?
四、ChatGPT範式的局限性
人工智慧特別是ChatGPT及其大語言模型正在推動經濟學研究範式的深刻變革,但是人工智慧與ChatGPT 的大語言模型範式也有局限性。
第一,以ChatGPT為代表的人工智慧前沿技術沒有人的意識或理解能力,只有預測能力。ChatGPT在《時代》週刊的採訪中表示,它只是一個機器學習模型,只能根據給定的訓練數據,根據某些單詞或單詞序列一起出現的概率生成文本。因此,ChatGPT本質上並不是在理解文本數據,而是在預測。此外,目前的人工智慧技術不具備與人類一樣的批判性思維與想像力,無法從現有數據推斷或預測出重大創新成果。
第二,基於大數據的人工智慧因果推斷本質上其實是一種統計關係推斷,並不是真正的因果關係。所謂因果關係,是指其他因素不變的條件下,某一變數的變化必然引起另一變數的變化。實驗方法是識別、測度因果關係的最有效方法,通過可控試驗控制其他變數不變,只讓其中一個變數變化,觀察結果是否變化。由於大數據基本上是觀測數據而非實驗數據,基於人工智慧的因果推斷本質上是一種預測關係或相關關係,它只不過是兩個變數在電腦中的統計關聯。這種人工智慧因果關係類似於英國哲學家休謨所說的因果關係,比如太陽出來,石頭變熱。因此,人工智慧因果關係和經濟學因果關係並不完全一致。要識別經濟學因果關係,不能僅僅依靠人工智慧因果推斷,還必須有經濟理論的指導或引入實驗經濟學的方法。在我看來,經濟學家不用擔心會被ChatGPT等人工智慧工具所替代,如果沒有經濟學理論的指引,很難找到經濟學因果關係。ChatGPT是一種數據驅動的研究範式,比起計量經濟學的模型驅動範式,有顯著的改進。模型驅動建立在各種假設的基礎上,結論常常受到所假設模型的限制,使用不同模型可能會導致不同的結論。Breznau et al. (2022, PNAS) 研究表明,基於同一數據,不同人使用不同的模型,會得到不同的結論,這也是模型驅動的缺點。數據驅動無需假設具體的函數模型,通過演算法從數據中獲得經濟變數之間的邏輯關係,特別是經濟學因果關係,以得到更加穩健的結論。但是,對經濟學研究而言,數據驅動必須與經濟思維、經濟理論相結合,否則無法得到經濟學意義上的因果關係。
第三,以ChatGPT為代表的人工智慧前沿技術沒有改變經濟學實證研究的本質,即從樣本推斷總體性質。毫無疑義,大數據與人工智慧大大強化了經濟學以數據為基礎的實證研究範式。雖然ChatGDP使用了海量大數據甚至是整個互聯網文本數據,但是互聯網大數據並非全樣本。人類經濟社會發展是一個漫長歷史過程,現有互聯網大數據縱使樣本容量極大,也只是這個歷史過程的一個樣本。基於大數據的經濟學實證研究仍然是從樣本推斷總體,以及進行樣本外預測。此外,經濟發展在不同歷史階段具有不同的特徵,經濟運行規律因此會呈現出顯著的時變性,有時是緩慢變化,有時是突變,這使得人工智慧對經濟金融變化趨勢的預測更具挑戰性。
第四,模型、演算法與數據的可靠性有待驗證。以ChatGPT為代表的人工智慧正在推動經濟學
與社會科學研究從模型驅動範式轉變到數據驅動範式,從數據直接獲得穩健的結論,克服了模型驅動範式得到的結論可能會因模型改變而變化的缺陷。但是,互聯網開源大數據存在各種虛假資訊與社會偏見,人工智慧尚無法確認其表述內容的真實性。此外,互聯網大數據也存在“樣本選擇偏差”問題,如城鄉數字鴻溝、地區數字鴻溝、代際數字鴻溝等。這些問題不可避免會影響基於互聯網大數據的ChatGPT乃至人工智慧所獲得的結論的可靠性與科學性。
我們正處於大數據、大科技、大模型的時代,加上中國超大人口規模和超大經濟規模給人工智慧技術帶來的廣闊應用場景,這些將為經濟學研究提供大量豐富素材。應當充分利用所有數據資源,積極探索大模型研究範式,揭示中國複雜經濟系統的運行與發展規律。需要指出,強調大模型並不意味小模型不重要,大小模型分別適用於不同情境;強調大數據並不意味“小”數據不重要,“小”數據的資訊密度通常更高;強調文本數據等非結構化大數據也並不意味結構化數據並不重要。
報告觀點已整理發表在《中國科學院院刊》2023年第3期。
請先 登錄後發表評論 ~