馬敏、陸漢文:如何充分發掘統計資料在民國史研究中的價值

編者按:“近代以前的中國歷史,由于統計資料的缺乏,很難訴諸系統的計量研究。迄至清季,新式統計開始出現,但局限于海關等少數經濟領域。民國時期,各部門的統計逐漸完善起來,這就使得計量方法有了廣泛的應用空間。”本文論述了民國時期政府統計資料的史料價值及其使用中遇到的具體困難。本文出自《民國時期社會發展的計量研究與政府統計資料利用》,載《大數據與中國歷史研究》第1輯。馬敏,華中師範大學中國近代史研究所教授;陸漢文,華中師範大學社會學院教授。
民國政府卷帙浩繁的統計資料既有其值得珍視和利用的一面,也有其需謹慎對待的另一面。然而,也許正是這種狀况使歷史研究本身具有“仁者見仁,智者見智”的學術魅力,給我們的研究工作留下了很大的空間。誠如有研究者所指出的,即使比較可信的資料,也可能會有不足或遺漏,需要經過史料的考證、評估等過程,才能够得出可靠的研究結論。退一步說,即使最不可信的資料,也幷非毫無價值,其中總會蘊藏著一些真實的東西,關鍵在于我們如何去發掘、甄別和利用。因此,研究者在微觀層面上對具體統計資料的恰當評估和謹慎利用就顯得尤爲重要。例如,自殺作爲一種意外變故,政府機關是不可能統計清楚的。內政部通過各城市公安機關統計的上海、南京等31個城市1932年自殺人數共1277人,而實際上僅上海市1932年的自殺人數即多于該數,自殺統計遺漏之驚人由此可見一斑。因此,根據政府統計直接計算自殺總人數及在總人口中所占比例等總體數據沒有什麽意義。但是考慮到通常情况下不同性別、不同年齡、不同原因自殺者被遺漏的概率應該相差不大,且不同城市的結構性誤差可相互抵消一些,存在驚人遺漏的各城市自殺統計仍可以視爲自殺總體的一個有代表性的樣本,包含著非常有用的信息,可用以推論城市自殺現象的結構特徵,如自殺者性別構成、自殺者年齡構成、自殺原因等。可見,只要研究者能够真正重視幷認真檢視民國政府的統計資料,就完全可能發掘出這些數據的價值,使之成爲歷史研究中的有用史料。
不僅如此,與文字資料相比,民國時期的政府統計資料還具有非常獨特的價值。首先,政府統計旨在周知國勢民情以及政府工作績效,作爲政府施政之參考及社會各界之借鏡。因此,歷史上遺留下來的政府統計資料實際上是時人和今人可以共享的“文本”。透過“文本”,我們不僅可以明瞭時人對處身其中的國家和社會的認識和概括,而且可以提出我們今天的解釋,幷在與時人的概括相比較的過程中,達成與時人的對話,進而更好地進入“文本”,更透徹地理解歷史。另一方面,由于同一歷史時期世界上許多國家都已建立起比較完善的統計制度,收集有豐富的統計資料,幷且不同國家的統計方案和規則也有很多相通的地方,這就使得以政府統計資料爲依據開展民國時期我國與世界上其他一些國家的比較研究不僅可能,而且非常便利。這有助于認識當時的中國與其他國家的差距。國民政府主計處統計局彙編《中華民國統計提要(二十九年輯)》專辟“國際比較”一類資料即顯明了這種可能性。同樣,以統計資料爲依據,對民國時期的中國與當代中國及其他一些發展中國家進行比較,可以幫助我們更好地理解中國社會主義建設取得的成就,及反過來以當代中國及其他一些發展中國家爲參照更好地評價民國歷史。實際上,統計資料算得上對具有不同傳統及發展模式的國家或同一國家的不同歷史階段進行比較的最好依據之一。當然,比較幷不是簡單地看數據的表面差异,而是要以一定的理論和指標體系爲指導,深入數據的背後,尋找深層次的東西。
其次,民國政府的統計資料涉及國勢民情的方方面面,不僅包括政治的、經濟的、人口的,而且包括教育的、衛生的、社會的;不僅包括城市的,而且包括農村的;不僅包括上層的,而且包括下層民衆的;等等。所以,這些統計資料是民國時期遺留下來的涉及範圍極爲廣闊的史料類型,不僅史料基礎已很扎實的政治史、經濟史等可以從中受益,而且社會史之類史料基礎相對較薄弱的研究領域也可以直接扎根其中。比如,我們的很多研究成果,包括政治史、經濟史等等,經常面臨的問題就是,衆多的檔案文獻記載的主要是精英人物的活動,因而很難寫出包含普通人物的歷史。統計資料則由于往往包括總體的數據,注重面上的情况,而有助于我們克服這樣的問題。又如,社會史作爲一種新的研究“範式”,强調“綜合的”、“整體的”取向,但社會生活千頭萬緒,包羅萬象,社會史研究要避免“瑣碎化”的陷阱,除了理論方面的建設外,史料的選擇也很重要。如果史料本就極爲瑣碎零亂,其“結構化”自然很困難。由于是按照特定目的和程序或完整的統計方案而收集彙編的,民國時期尤其是主計處成立後的許多統計資料本來就具有“綜合的”、“整體的”和“結構化的”特點,因此,這些資料用于社會史研究具有不可替代的長處。
再次,統計資料主要是以數字形式表達的史料,而數字顯然是最精練、最便于使用的記錄符號,這就使得統計資料具有其他很多史料無法比擬的優勢。在方法論意義上,統計資料有助于計量史學的理論與方法在中國的運用。計量史學作爲一種方法論路徑,只能用于那些可以用數字表達出來的史料。近代以前的中國歷史,由于統計資料的缺乏,很難訴諸系統的計量研究。迄至清季,新式統計開始出現,但局限于海關等少數經濟領域。民國時期,各部門的統計逐漸完善起來,這就使得計量方法有了廣泛的應用空間,可以用中國的經驗數據檢驗計量史學相關理論和方法的適用性和解釋力,建構和發展中國的計量史學科體系。另一方面,儘管計量史學也有自身的缺陷,但對于具有深厚、悠久人文史傳統,習慣于“定性”分析的中國史學界來說,計量方法仍然具有不可替代的作用和獨特的優勢,可藉以深化許多已有研究成果,或實現新的突破。比如,現代統計方法和計算機軟件技術的迅猛發展和密切結合,使得統計資料的使用和分析變得非常方便,在沒有計算機的情况下無法真正應用于實踐的一些多元分析技術,現在可以輕鬆地通過統計軟件完成,我們因此可以將更多因素納入歷史研究的視野,將表面上看來互不相干的一些變量引入統計模型,經過反復運算,尋找其深層聯繫,從而有可能提出新的問題,發現歷史的新面相。
最後,民國時期的政府統計資料是在特定的統計制度下,由特定的人員按照特定的程序和方法收集彙編的,絕大多數統計表格都附錄有資料來源及其他具體說明,因而其甄別考證等工作一般而言應有軌可循。此外,以數字形式表達的史料相互印證的機會更多。比如,不同年份的數據可以根據變化的趨勢和可能性相互印證,不同類型的統計數據可以根據彼此的依存關係相互印證,不同地域的統計數據可以根據地域差异相互印證,等等。所以,未經細緻考證的統計資料比其他史料更容易露出破綻,這就給統計資料的考證提出了更高的要求。換言之,以統計資料爲依據進行研究,必須更注重其可靠性、可信性,更注重考證功夫。在這個意義上,以統計資料爲依據的研究更值得信賴,更科學。
另外需要提及的是,儘管政府統計資料具有很高的史料價值,但在民國史研究中的利用還面臨著其他一些不容忽視的具體困難。比如,政府統計浩如烟海,其發掘和整理工作异常繁重。除主計處統計局彙編的綜合性統計資料(如《中華民國統計年鑒》等)比較集中外,在當時各種雜志、報紙、學術著作、年鑒、中央政府各部門出版物、地方政府出版物等載體上都散布有大量的政府統計資料,系統搜集和整理這些資料的難度極大。迄今爲止,尚無關于民國時期政府統計的大型彙編資料問世,而在這方面單憑個別研究者的努力是很難取得巨大成效的。又如,因時局的動蕩,民國時期政府統計在時間上的連續性不强,很多數據在一些年份上存在殘缺不全的情况,這使得長時段的縱向比較和趨勢分析常常成爲無米之炊。儘管部分領域殘缺的數據(如物價)可以通過各種方法估算出來,得出一個連續序列,但這畢竟提高了數據誤差的可能性。再如,中國地域遼闊,區域差异鮮明,同樣的數字在不同的地方可能有不同含義,需要做不同的解釋。這就要求研究者的數據分析工作能够將抽象的數字與各地豐富多彩的現實生活聯繫起來,做出恰如其分的分析和解釋。這些都在一定程度上爲利用統計資料進行歷史研究增加了難度,提出了更高的要求。
本文原刊:社科文獻出版社近代史主題微信號