从此走进深度人生 Deep net, deep life.

分类: 专业学校考试

  • 程千帆,徐有富:版本学的名称与功用

    第一節 版本與版本學

    古代用以書寫的木片通稱爲版或板。漢王充云:“斷木爲槧,析之爲版,刀加刮削,乃成奏牘。”(1)許慎也説:“牘,書版也。”(2)

    因爲供書寫用的木片呈方形,所以又稱方。《莊子·天下篇》:“惠施多方,其書五車。”《儀禮·聘禮》:“百名以上書於策,不及百名書於方。”鄭玄注云:“名,書文也,今謂之字。策,簡也;方,板也。”(3)

    方、板作爲書寫工具有時也連稱,故賈公彦疏又釋鄭注云:“云方板者,以其百名以下,書之於方,若今之祝板。不假連編之策,一板書盡,故言‘方,板也’。”(4)直到唐代,還用方板記事,如李賀《感諷五首》之一云:“越婦未織作,吴蠶始蠕蠕。縣官騎馬來,獰色虯紫鬚。懷中一方板,板上數行書。”(5)

    同簡比起來,方版容納的字數要多一些。《春秋序》云:“大事書之於策,小事簡牘而已。”孔穎達疏曰:“簡之所容,一行字耳。牘乃方版,版廣於簡,可以並容數行。凡爲書,字有多有少。一行可盡者,書之於簡;數行乃盡者,書之於方;方所不容者,乃書於策。”(6)對於方版與簡策的使用繫於文字之多寡,説得十分清楚。

    雕版印書之法通行以後,版或板的含義逐漸演變爲經雕刻後供印書用的版片。如唐馮宿《禁版印時憲書奏》云:“準敕,禁斷印曆日版。劍南兩川及淮南道,皆以版印曆日鬻於市。每歲司天臺未奏頒下新曆,其印曆已滿天下,有乖敬授之道。”(7)宋代以後,雕版印刷事業日益興盛,版或板作爲供印書用的版片的含義更加明顯。宋王應麟稱:“自太祖平定四方,天下之書悉歸藏室。太宗、真宗訪求遺逸,小則償以金帛,大則授之以官。又經書未有板者,悉令刊刻,由是大備,起秘閣貯之禁中。”(8)這種板片隨着印刷事業的發展,也就可以作爲公私財産進行移交或出售。如陸心源《皕宋樓藏書志》卷三十二載有元馮福京《昌國州圖志》七卷,福京跋後有字數行云:“《昌國州圖志》板五十六片,雙面五十四,單面二,計印紙一百零十副,永爲昌國州官物,相沿交割者。大德二年(一二九八)十一月長至日畢工。”版片作爲私有財産,當然會出現易主現象。杜信孚曾指出:《吴越春秋音注》十卷“目録後有‘萬曆丙戌(一五八六)之秋武林馮念祖重梓於卧龍山房’三行牌記。該書版片易主,轉給楊爾曾。楊氏重印時,將牌記改爲‘萬曆辛丑(一六〇一)之秋楊爾曾重梓於卧龍山房’”。(9)

    因爲板雕好後,在印刷時需要上墨,所以又稱墨板。宋朱翌云:“雕印文字,唐以前無之。唐末,益州始有墨板。後唐方鏤九經,悉收人間所有經史,以鏤板爲正。”(10)宋《國史藝文志》也指出:“唐末益州始有墨板,多術數、字學小書。”(11)

    本的原義爲樹根。許慎云:“木下曰本,從木,一在其下。”(12)引申其義,則據以校書的書的原本也可稱本。《北齊書·樊遜傳》:

    (天保)七年(五五六),詔令校定群書……遜乃議曰:“按漢中壘校尉劉向受詔校書,每一書竟,表上,輒云臣向書、長水校尉臣參書,太史公、太常博士書,中外書合若干本以相比校,然後殺青。”(13)

    這“合若干本”的“本”就是用來校書的原本。《隋書·經籍志》總序亦云:“隋開皇三年(五八三),祕書監牛弘,表請分遣使人搜訪異本。每書一卷,賞絹一匹,校寫既定,本即歸主。”(14)顯然,這裏的“本”也指據以校寫的原本。

    在通常情況下,本即指書。《顔氏家訓·書證篇》:“《漢書》:‘田肯賀上。’江南本皆作‘宵’字。沛國劉顯博覽經籍,偏精班《漢》,梁代謂之漢聖。顯子臻,不墜家業,讀班史呼爲田肯。梁元帝嘗問之,答曰:‘此無義可求,但臣家舊本以雌黄改“宵”爲“肯”。’元帝無以難之。吾至江北,見本爲肯。”(15)這段話中的“江南本”,指流傳在江南的《漢書》;“江北本”,指流傳在江北的《漢書》;“臣家舊本”,指劉臻先世所收藏的《漢書》。其義甚明。

    因爲本即指書,所以書本二字往往連用。《顔氏家訓·書證篇》復云:

    《後漢書》:酷吏樊曄爲天水郡守,涼州爲之歌曰:“寧見乳虎穴,不入曄城寺。”而江南書本,“穴”皆誤作“六”,學士因循,迷而不寤。夫虎豹穴居,事之較者,所以班超云:不探虎穴,安得虎子。寧當論其六七耶?(16)

    又《漢書·賈鄒枚路傳》有云:“路温舒……爲山邑丞,坐法免,復爲郡吏。”師古曰:“山邑不知其處,今流俗書本云常山石邑丞,後人妄加‘石’字耳。”(17)皆其證。

    隨着印刷術的發達,本與書本的含義逐漸同於版本。例如南宋岳珂撰《相臺書塾刊正九經三傳沿革例》專設《書本》一例,並列舉了唐石刻本、晉天福銅板本、京師大字舊本、紹興初監本等二十三本。岳珂所謂書本實即版本。

    宋代雕版印書盛行,“版本”二字從北宋以來便被用來專指雕版所印之書。正如葉德輝所説:“雕板謂之板,藏本謂之本。藏本者,官私所藏,未雕之善本也。自雕板盛行,於是板本二字合爲一名。”(18)如《宋史·邢昺傳》云:景德二年(一〇〇五),“上幸國子監閲庫書,問昺經版幾何?昺曰:‘國初不及四千,今十餘萬,經、傳、正義皆具。臣少從師業儒時,經具有疏者,百無一二,蓋力不能傳寫。今板本大備,士庶家皆有之。’”(19)又沈括指出:“板印書籍,唐人尚未盛爲之。自馮瀛王始印《五經》,已後典籍,皆爲板本。”(20)葉夢得亦云:

    五代時馮道始奏請官鏤六經版印行。國朝淳化中,復以《史記》、前後《漢》付有司摹印。自是書籍刊鏤者益多,士大夫不復以藏書爲意。學者易於得書,其誦讀亦因滅裂。然版本初不是正,不無訛誤。世既一以版本爲正,而藏本日亡,其訛謬者遂不可正,甚可惜也。(21)

    邢、沈北宋人,葉南宋人,可見版本之稱在宋代已確立,且其含義乃對寫本而言。

    作爲版本學的專有名詞,則版本是指同一部書在寫作、編輯、傳抄、刻版、排版、裝訂乃至流通過程中所産生的各種形態的本子。正如王欣夫所説:“所謂版本,並不限於雕版印刷的書籍,而實際上包括没有雕版印刷以前的寫本和以後的鈔本、稿本在内。”(22)

    早在漢代,劉向等就已經注意到版本的差别,並且利用各種不同的版本爲校書服務。從劉向《别録》所僅留的幾篇書録中,可以看出他們在校書時就已利用了中書、太常書、太史書、臣向書、臣參書、大中大夫卜圭書、射聲校尉立書等各種不同的版本。《漢書·河間獻王傳》云:“河間獻王德,以孝景前二年立。修學好古,實事求是。從民得善書,必爲好寫與之,留其真,加金帛賜以招之。繇是四方道術之人,不遠千里,或有先祖舊書,多奉以奏獻王者,故得書與漢朝等。”(23)這是藏書重視舊本的最早事例。在讀書時,人們也早就注意到了版本的差别。《顔氏家訓·書證篇》:“《詩》云:‘有杕之杜’,江南本並木傍施大。……而河北本皆爲夷狄之狄,讀亦如字,此大誤也。”曹丕在贈書時也因人而異其本。《三國志·魏書·文帝紀》注引胡冲《吴曆》云:“帝以素書所著《典論》及詩賦餉孫權,又以紙寫一通與張昭。”(24)可見人們早就運用版本知識從事校書、讀書、藏書乃至贈書活動了。

    什麽叫版本學?葉德輝認爲:“私家之藏,自宋尤袤遂初堂,明毛晉汲古閣,及康、雍、乾、嘉以來各藏書家,齗齗於宋元舊鈔,是爲板本之學。”(25)

    很顯然,這個定義是太窄了。所以顧廷龍補充説:

    講究宋元舊刻,固然是“版本之學”的一項内容。但是在雕版以前的簡策、縑素,一寫再寫,不也就是不同版本嗎?現代鉛印和影印的出版物,一版再版,不也又是不同版本嗎?依我看來,版本的含義實爲一種書的各種不同的本子,古今中外的圖書,普遍存在這種現象,並不僅僅限於宋、元古籍。

    在九世紀以前,經過不斷的傳寫,在印刷術發明以後,經過不斷的刻印,因而産生了各種不同本子。有了許多不同本子,就出現了文字、印刷、裝幀等等各方面的許多差異。研究這些差異,並從錯綜複雜的現象中找出其規律,這就形成了“版本之學”。他還指出:“版本學的内容實在是相當豐富的,如關於圖書版本的發生和發展,各個本子的異同優劣,製版和印刷的技術,版本的鑒别,裝訂的演變,以及研究版本學的歷史等等,應該可以成爲一門專門的科學。”(26)顧廷龍對版本學的認識已比葉德輝全面得多,而在傳播媒介日益發達的今天,推而廣之,則以録音帶、録像帶形式所構成的音像型書籍,也未嘗不可以包括在版本學範圍之内。至於本書的研究對象,則以古籍版本爲主,其主要内容是探討古籍的版本源流,研究古籍版本的異同優劣,鑒定古籍版本的真僞等問題。

    總的説來,版本學所研究的内容無不與書的物質形態有關,因此可以概括地説版本學是研究書的物質形態的科學,是校讎學的起點。

    第二節 版本學的功用

    版本學的功用是多方面的,概括起來有以下幾點:首先,讀書應擇善本。

    張之洞《書目答問·略例》有云:“諸生好學者來問:應讀何書?書以何本爲善?”爲什麽呢?他自己回答説:“讀書不知要領,勞而無功;知某書宜讀而不得精校精注本,事倍功半。”(27)

    讀書應當選擇版本的最主要的理由是:書在長期流傳過程中,因各種原因産生了一些不同版本,而這些版本之間從文字到編次又往往存在着很大差别。這種差别又往往可以決定讀者從書中所獲得的知識是否正確。清顧廣圻談到過這個問題:

    蓋由宋以降,板刻衆矣。同是一書,用較異本,無弗夐若徑庭者。每見藏書家目録,經某書、史某書云云,而某書之爲何本,漫然不可别識。然則某書果爲某書與否,且或有所未確,又烏從論其精粗美惡耶?(28)

    余嘉錫對版本的差異及其原因分析得更加透徹:

    蓋書籍由竹木而帛,而紙;由簡篇而卷,而册,而手抄,而刻版,而活字,其經過不知其若干歲,繕校不知其幾何人。有出於通儒者,有出於俗士者。於是有斷爛而部不完,有删削而篇不完,有節鈔而文不完,有脱誤而字不同,有增補而書不同,有校勘而本不同。(29)

    正因爲一本書的不同版本往往有很大差别,所以讀書不注意版本,就會鬧出一些笑話。《顔氏家訓·勉學篇》曾舉一例:“江南有一權貴,讀誤本《蜀都賦》注,解‘蹲鴟,芋也’乃爲‘羊’字。人饋羊肉,答書云:‘損惠蹲鴟。’舉朝驚駭,不解事義。久後尋迹,方知如此。”(30)因讀誤本給工作造成損失的也不乏其例。如宋朱彧《萍洲可談》卷一載:哲宗元符初年,杭州府學教授姚祐有次考學生《易經》,題目是“乾爲金,坤亦爲金,何也”。學生們都無從下手,因爲《易經》的原文是“乾爲金,坤爲釜”。有的學生問他是否所據版本錯了,他便取監本來看,果然是“坤爲釜”,顯得十分尷尬。明陸深《金臺紀聞》也載有類似的事例:

    金華戴元禮,國初名醫,嘗被召至南京,見一醫家迎求溢户,酬應不間。元禮意必深於術者,注目焉。按方發劑,皆無他異,退而怪之,日往觀焉。偶一人求藥者既去,追而告之曰:“臨煎時下錫一塊。”麾之去。元禮始大異之,念無以錫入煎劑法,特叩之。答曰:“是古方爾。”元禮求得其書,乃“餳”字耳。元禮急爲正之。嗚呼!不辨“餳”“錫”而醫者,世胡可以弗謹哉!

    可見引書不注意版本,有時就會産生不良的後果。

    讀書不擇本是一種偏向,把好的版本僅當作古董收藏欣賞,而不將其作爲研究資料加以利用,也是一種偏向。清陳其元云:

    今人重宋版書,不惜以千金、數百金購得一部,則什襲藏之,不特不輕示人,即自己亦不忍數繙閲也,余每竊笑其痴。王鼎丞觀察定安酷有是癖,宰崑山時,嘗買得宋槧《孟子》,舉以誇余。余請一睹,則先負一櫝出,櫝啓,中藏一楠木匣,開匣方見書。書紙墨亦古。所刊筆劃究無異於今之監本。余問之曰:“讀此可增長智慧乎?”曰:“不能。”“可較别本多記數行乎?”“亦不能。”余笑曰:“然則不如仍讀今監本之爲愈耳,奚必費百倍之錢以購此耶?”王恚曰:“君非解人,不可共君賞鑒。”急收弆之。余大笑去。(31)

    王欣夫曾指出:這個故事正可説明,人們對於版本有兩種不同的認識:一種是讀書而不重視版本,另一種是重視版本而不讀書。因爲陳其元對那部宋刊《孟子》略加省視,便説是“紙墨亦古”,但“所刊筆劃究無異於今之監本”;而王定安又把它“什襲藏之,不輕示人”。實質上,兩人都將古書僅僅看作文物或古董。王定安所藏宋版《孟子》,不知是宋朝的哪一個刻本,也不知是不是真的宋版。不過陳其元將它比作監本,可見是《四書》中的《孟子集注》了。世傳宋版《四書》有淳祐丙午泳澤書院刻本(實爲元代至元刻本,淳祐二字係剜改,但前人相承爲宋刻),它與包括明監本在内的普通讀本不同之處正多得很,不弄清楚是無法認真進行研究工作的。(32)

    讀書不重視版本與重視版本而不讀書都是偏向,正確的態度應當是“讀書宜求善本”。(33)宋歐陽修云:

    陳公(陳從易)時偶得杜集舊本,文多脱誤,至《送蔡都尉詩》云:“身輕一鳥□”,其下脱一字。陳公因與數客各用一字補之。或云“疾”,或云“落”,或云“起”,或云“下”,莫能定。其後得一善本,乃是“身輕一鳥過”。陳公嘆服,以爲雖一字,諸君亦不能到也。(34)

    這則詩話雖然旨在贊美杜詩用字之妙,然而也表明了善本對讀書的重要性。一些藏書家從有利於讀者出發,也十分注意對版本的辨别與善本的搜聚。如宋陳振孫爲郭氏《杜工部詩集注》所作解題云:

    蜀人郭知達所集九家注,世有稱東坡《杜詩故事》者。隨事造文,一一牽合,而皆不言其所自出,且其辭氣首末若出一口,蓋妄人依託以欺亂流俗者,書坊輒勦入集注中,殊敗人意,此本獨削去之。福清曾噩子肅刻板五羊漕司,最爲善本。(35)

    讀書宜求善本,那麽什麽是善本呢?從讀書治學的角度看,同符或接近原稿的書就是善本。張之洞《輶軒語·語學篇》云:“善本之義有三:一、足本(無闕卷,未删削);二、精本(精校、精注);三、舊本(舊刻、舊鈔)。”首先要是足本,因爲不完整就不能反映原作的全貌,當然也就談不上與原稿相同或接近了。商務印書館出的《四部叢刊》、百衲本《二十四史》之所以受到學術界的重視,就在於編者做了許多艱苦細緻的工作,使它們都成爲盡可能完整的本子。顧廷龍指出:

    近人張元濟輯印《四部叢刊》和百衲本《二十四史》,盡力搜求舊本以校正今本,有很多新的發現。例如《四部叢刊》續編中《愧郯録》各本都缺十葉,後得祁氏澹生堂鈔本半部,其中就有此十葉,得以彌補了向來的缺憾。(36)

    其次是精本,精校的目的是使書接近原貌,精注的目的是使讀者更好地理解書的内容。清高宗嘗云:“朕披覽《十三經注疏》,念其歲月經久,梨棗日就漫漶,爰敕詞臣重加校正,其於經文誤字以及傳注箋疏之未協者,參互以求其是,各爲考證附於卷後,不紊舊觀,刊成善本。”(37)陳振孫云:“《元和姓纂》絶無善本,頃在莆田,以數本參校,僅得七八。後又得蜀本校之,互有得失,然粗完整矣。”(38)又如王國維跋《雅雨堂叢書》本《文昌雜録》云:

    戊午(一九一八)臘月,國維復讀一過,訂正十餘字。

    庚申(一九二〇)六月朔,又讀一過,訂正十餘字。

    辛酉(一九二一)穀日,以南林蔣氏藏舊鈔本校前所校

    正處,舊鈔多不誤。又增改數十字,足爲善本矣。(39)

    由此可見凡經名家精校過的書皆可視爲善本,所以張之洞《輶軒語·語學篇》云:“善本非紙白版新之謂,謂其爲前輩通人用古刻數本,精校細勘付刊,不訛不闕之本也。此有一簡易之法,初學購書,但看序跋,是本朝校刻,卷尾附有校勘記,而密行細字、寫刻精工者,即佳。”

    名家的精注本往往博徵繁引、精校細核,對我們閲讀和理解原書極有幫助。唐顔師古注《漢書》,有《叙例》一篇,談到了他這方面的工作。今録二則爲例:

    《漢書》舊文,多有古字,解説之後,屢經遷易。後人習讀,以意刊改,傳寫既多,彌更淺俗。今則曲覈古本,歸其真正,一往難識者,皆從而釋之。

    古今異言,方俗殊語,末學膚受,或未能通,意有所疑,輒就增損,流遯忘返,穢濫實多。今皆删削,克復其舊。

    此外,作者還“隨其曲折,剖判義理”“各依本文,敷暢厥指”“窮波討源,構會甄釋。”(40)正因爲如此,人們在研討《漢書》時,都得用顔師古注本。古籍注本歷代多有,學者研討,所當慎擇。

    再次是舊本。舊本在時間上距離原書較近,因此在一般情況下會更接近原貌些。盧文弨説:

    書所以貴舊本者,非謂其概無一訛也。近世本有經校讎者,頗賢於舊本,然專輒妄改者,亦復不少。即如《九經》小字本,吾見南宋本已不如北宋本;明之錫山秦氏本又不如南宋本;今之翻秦本者,更不及焉。以斯知舊本之爲可貴也。(41)

    近人陳乃乾也談到了舊本的可貴:

    嘗謂古書多一次翻刻,必多一誤。出於無心者,“魯”變爲“魚”,“亥”變爲“豕”,其誤尚可尋繹。若出於通人臆改,則原本盡失。宋、元、明初諸刻,不能無誤字。然藏書家争購之,非愛古董也,以其誤字皆出於無心,或可尋繹而辨之,且爲後世所刻之祖本也。校勘古書,當先求其真,不可專以通順爲貴。古人真本,我不得而見之矣;而求其近於真者,則舊刻尚矣。(42)

    應當注意的是,從書的文物價值和收藏價值看,古本就是善本,但從讀書治學的角度看,古本就未必都是善本。清郭麐云:

    書貴善本,可以是正謬誤,然亦有古未必是,而今未必非者。《文選》謝靈運《游赤石》詩“終然謝先伐”,用直木先伐之義,宋本作“天伐”爲無解矣。曹子建《箜篌引》:“生存華屋處,零落歸山邱。”“生存”“零落”偶字也,宋本作“生在”,疑誤。(43)

    這些例子説明:我們讀書應擇善而從,但不要一味迷信古本。

    讀古書要注意版本,讀現代書也要注意版本。例如姚名達的《中國目録學史》一九三六年由商務印書館出版過,一九五七年又由商務印書館重印。在重印前,由王重民校閲過,他在重印本《後記》中寫道:

    我在校閲過程中,只做了下列兩件事:

    一、原書文字上的錯誤不少,有的是引用上的錯誤,有的是排印上的錯誤。我一共修正了一百零六處,另外還改正了標點斷句二十九處。

    二、姚先生在書内還保留了一些問題,没有得到解決。這些問題,有的是由於當時所掌握的資料不够,有的是由於用錯了資料。我這次就其中的六個問題提供了一些新資料,但不敢補入原書,因作爲這次翻印本的後記。

    顯然,我們讀《中國目録學史》最好采用一九五七年重印本。

    其次,校書應備衆本。

    廣搜異本,進行比較,擇善而從,是校書所應當首先采用的基本方法。孫德謙云:

    校書之事,必備有衆本乃可以抉擇去取。近世如阮文達之校《十三經》,有所謂單經本、經注本、單疏本;謝墉之校孫卿子,有所謂影鈔大字宋本、元刻纂圖互注本、明虞氏、王氏合校刻本、明世德堂本、明鍾人傑本是也。姑舉一二,此外無不皆然。

    又説:

    欲校一書,須備衆本,有斷然者。蓋不備衆本,書之或有缺佚,或有謬誤,其義皆不可通,此讀者之大憾也,故既得一别本矣,足與此本對校,又當兼備衆本,如是則異同得失始能辨别而有所折衷。(44)

    汪辟疆先生也認爲:“顧校理之業,必廣徵衆本,參證互勘,乃可藉手。”(45)

    章學誠指出,備衆本以供校讎始於劉向:

    校書宜廣儲副本。劉向校讎中祕,有所謂中書,有所謂外書,有所謂太常書,有所謂太史書,有所謂臣向書、臣某書。夫中書與太常、太史,副官守之書不一本也;外書與臣向、臣某,則家藏之書不一本也。夫博求諸本,乃得讎正一書,則副本固將廣儲以待質也。(46)

    今節録劉向《管子書録》爲例:

    護左都水使者、光禄大夫臣向言:所校讎中管子書三百八十九篇,大中大夫卜圭書二十七篇,臣富參書四十一篇,射聲校尉立書十一篇,太史書九十六篇,凡中外書五百六十四篇。以校,除復重四百八十四篇,定著八十六篇。殺青,而書可繕寫也。(47)

    劉向利用衆本校定群書的經驗産生了深遠影響。例如北齊樊遜校理秘府書籍時就説過:“向之故事,見存府閣,即欲刊定,必藉衆本。”(48)廣聚衆本是校書質量的可靠保證,顔師古校定《五經》就是一個典型例子:

    太宗以經籍去聖久遠,文字訛謬,令師古於祕書省考定《五經》。師古多所釐正,既成,奏之。太宗復遣諸儒重加詳議。於時諸儒傳習已久,皆共非之。師古輒引晉、宋已來古今本,隨言曉答,授據詳明,皆出其意表,諸儒莫不歎服。於是兼通直郎、散騎常侍,頒其所定之書於天下,令學者習焉。(49)

    隨着印刷術的日益普及,宋以後的公私出版事業都得到了蓬勃發展。凡是在古籍出版事業方面做出突出貢獻的,往往都是廣儲副本、精心校勘的結果。宋岳珂刊正九經三傳即其例。其《相臺書塾刊正九經三傳沿革例·書本》有云:

    今以家塾所藏唐石刻本、晉天福銅板本、京師大字舊本、紹興初監本、監中見行本、蜀大字舊本、蜀學重刻大字本、中字本。又中字有句讀附音本、潭州舊本、撫州舊本、建大字本(俗謂無比九經)、俞韶卿家本。又中字凡四本、婺州舊本、並興國于氏、建余仁仲,凡二十本。又以越中舊本注疏、建本有音釋注疏、蜀注疏,合二十三本,專屬本經名士,反覈參訂,始命良工入梓,固自信以爲盡善。正恐掃塵隨生,亦或有之,惟通經先達,不吝惠教。

    現代,上海商務印書館出版的《四部叢刊》之所以受到學者的信賴,主要也是由於編者在廣儲副本、精心校勘方面下了很多功夫。《四部叢刊例言》云:

    版本之學,爲考據之先河,一字千金,於經史尤關緊要。兹編所采録者,皆再三考證,擇善而從。如徐氏仿宋刻本《三禮》,明人繙宋岳珂本《九經》。徐刻《周禮》不如岳本之精,岳刻《儀禮》又不如徐本之善;皆非逐一細校,不能辨其是非。其他北宋本失傳之書,賴有元、明人翻本,轉出南宋本之上者。若僅以時代先後論之,則不免於盲人道黑白矣。兹編於此類,頗用苦心,非泛泛侈言存古也。

    書無論鈔刻,雖大體完善,欠葉闕文,總不能免。今兹所依,矧多古本,影印之際,不加參訂,則郭公夏五,(50)所在皆是,學人得之,殊費推尋,故每印一書,恒羅致多本,此殘彼足,藉得補正。(51)

    整理出版書籍固然需要備衆本以資校勘,而讀書治學也得備衆本,也應掌握版本知識。許多學者都强調讀書必須校書。清王鳴盛云:“嘗謂好著書不如多讀書,欲讀書必先精校書,校之未精而遽讀,恐讀亦多誤矣。”(52)張之洞《輶軒語·語學篇》也指出:“讀書先宜校書。”葉德輝《藏書十約》甚至説:“書不校勘,不如不讀。”(53)因爲隨讀隨校,所以前人往往稱讀書爲校讀,他們在利用衆本校勘方面下了很大功夫。如宋葉夢得説:“余在許昌,得宋景文用監本手校《西漢》一部,末題用十三本校,中間有脱兩行者,惜乎今亡之矣。”(54)清初錢曾跋《洛陽伽藍記》云:

    清常道人(趙琦美)跋云:“歲己亥,覽吴琯刻《古今逸史》中《洛陽伽藍記》,讀未數字,輒齟齬不可句。因購得陳錫玄、秦酉岩、顧寧宇、孫蘭公四家抄本,改其訛者四百八十八字,增其脱者三百二十字。丙午又得舊刻本,校於燕山龍驤邸中,復改正五十餘字。凡歷八載,始爲完書。”清常言讎勘之難如此。(55)

    清邵懿辰在《四庫全書簡明目録》上標注版本,其目的主要也是爲了便於日後校讀。故葉名澧《橋西雜記》稱:“澧嘗見邵蕙西案頭,置《簡明目録》一部,所見宋元舊刻本、叢書本及單行刻本、鈔本,手記於各書之下,以備他日校勘之資。”

    可見,不論是整理出版圖書,還是讀書治學,凡需要校勘,就應廣搜衆本,具備一定的版本學知識。

    再次,購藏書籍應鑒異本。

    藏書一般要從購書開始,而購書就必須有版本知識。要能精於鑒别。孫慶增云:

    夫藏書而不知鑒别,猶瞽之辨色,聾之聽音。雖其心未嘗不好,而才不足以濟之,徒爲有識者所笑,甚無謂也。如某書係何朝何地著作,刻於何時,何人翻刻,何人鈔録,何人底本,何人收藏,如何爲宋元刻本,刻於南北朝何時何地(案此云南北朝,當指宋、金、元之間),如何爲宋元精舊鈔本,必須眼力精熟,考究確切。再於各家收藏目録,歷朝書目,類書總目,讀書志,敏求記,經籍考,志書,文苑志,書籍志,二十一史書籍志(《零拾》本書作經),名人詩文集書序跋文内查攷明白,然後四方之善本祕本,或可致也。(56)

    同書第一則《購求》亦云:“與能識古本今本之書籍者,並能道其源流者,能辨原板翻板之不同者,知某書之久不刷印,某書之止有鈔本者,或偕之閑訪於坊家,密求於冷鋪,於無心中得一最難得之書籍。”都强調了采購應具版本知識。

    采購新出的古籍同樣也有個版本問題。顧廷龍説:

    采購工作者,必須熟悉版本。就古籍説,某書歷來傳世者有多少版本,現在某本稀見,某本習見,某本校勘精善,某本粗疏,某本由某本出,辨其源流。例如章學誠的《文史通義》和《校讎通義》兩書,有鈔本十餘種、刻本十餘種,現在最通行的兩本:一爲商務印《遺書》本(商務尚有《萬有文庫》本),一爲中華印《四部備要》本。商務本出於劉氏嘉業堂刊《遺書》本(劉刻印本亦有二:初印不足本三十二册,後有增刻本四十册),而劉本係出沈復粲藏鈔本最足本;中華則出湖南菁華閣本,與《文史通義》之文字及篇目頗有出入,應以劉刻爲善,是商務本勝於中華本。一九五六年古籍出版社出版的劉公純標點本《文史通義》根據劉本,比舊刻本增内篇一卷、補遺八篇,後附補遺續五篇,則較商務本爲尤勝。掌握了這些複雜情況,采購起來就心中有數。(57)

    魏隱儒也曾就此點舉例道:

    清曹霑(雪芹)的名著《紅樓夢》,一百二十回活字本,初版是乾隆五十六年辛亥(一七九一)排印的,稱程甲本(程偉元字小泉),乾隆五十七年壬子再版排印的爲程乙本。兩者都是活字本,因排印時間不同,内容有出入……正是因爲同一種書,刻印有好壞、先後,内容有正誤,它的價值價格也就有了高低差異。如同一種書,某本有名家藏章或名人題跋,價值就隨之提高;同是手寫本,稿本與傳鈔本價值不同,舊鈔本與新鈔本不同,叢書本與單刻本不同,初印本與再版本不同。既有區别差異,所以我們從事這一專業工作人員,就必須學習它、研究它。(58)

    實踐證明,没有版本知識的人,往往會將珍本當作廢紙;而經驗豐富的人却有時會從廢紙堆中發現珍本。如“一九六四年,中國書店從廢品收購站發現的明覆宋板《古今注》,是商務印書館《四部叢刊》的底本,與北京大學圖書館所藏的明末刻本《崔豹古今注》相對校,對出明末本有多處不妥,誤字很多”。(59)

    藏書當然也離不開版本學知識。顧廷龍曾指出:“保管工作者,必須熟悉版本,根據不同版本的情況來掌握不同的保管方法,如稀見本、加工本(批校、題跋)、僞裝本、特裝本等等,應該和一般的版本書有區别的。”(60)事實上,中國歷代主持國家藏書工作的人都較好地運用了版本學知識從事搜訪與典藏工作。《隋書·經籍志》總序介紹隋代國家藏書情況有云:

    隋開皇三年(五八三),秘書監牛弘,表請分遣使人,搜訪異本。每書一卷,賞絹一匹,校寫既定,本即歸主。於是民間異書,往往間出。及平陳已後,經籍漸備,檢其所得,多太建時書,(61)紙墨不精,書亦拙惡。於是總集編次,存爲古本,召天下工書之士京兆韋霈、南陽杜頵等,於秘書内補續殘缺,爲正副二本,藏於宫中,其餘以實祕書内、外之閣,凡三萬餘卷。煬帝即位,秘閣之書,限寫五十副本,分爲三品:上品紅瑠璃軸,中品紺瑠璃軸,下品漆軸。於東都觀文殿東西廂構屋以貯之,東屋藏甲乙,西屋藏丙丁。(62)

    由此可見隋代對國家藏書,很注意其異本、古本的搜訪典藏,還做了“校寫”“補續殘缺”和“總集編次”等工作。這項工作,到了清代更爲完善。國家藏書設有專門的善本書庫,按分類和不同的版本進行收藏,對於一書的不同刻本,一版的前後印本也兼收並蓄。如《欽定天禄琳琅書目》就證明了這一點,詳見本編第七章第一節。

    最後,學術研究也應注意版本。

    圖書出版工作同政治、經濟、文化有着十分密切的關係。因此,我們從對版本的研究中,可以瞭解某個時期或某個地區的政治、經濟、文化的發展情況。

    以宋刊《大藏經》爲例,宋代公私雕印《大藏經》共有六部:即《開寶藏》《崇寧萬壽大藏》《毗盧大藏》《思溪圓覺藏》《思溪資福藏》《磧砂藏》,共三萬五千一百八十一卷。宋代多次大規模地雕印《大藏經》不是偶然的,它一方面説明了當時佛教文化對我國的巨大影響,另一方面也説明了宋代統治者很會利用佛教來鞏固自己的政權。大家都知道,五代十國時期,吴越、南唐、後蜀這些封建割據的獨立王國,朝野都崇信佛教。宋太祖用武力統一這些獨立王國不久,便於開寶四年(九七一)派高品、張從信等前往成都監雕《大藏經》,顯然是爲了收買人心。《開寶藏》是我國歷史上雕印的第一部佛教全書,全藏有一千零七十六部,五千零四十八卷。共刻十三萬多版片。宋太祖爲此可謂不惜工本了。(63)

    再以蜀刻本爲例。顧廷龍《唐宋蜀刻本簡述》所附《蜀刻書目》根據傳本和文獻記載,計收唐刻三種、宋刻七十四種。(64)四川成都一帶成爲唐宋刻書中心之一,是與其政治、經濟、文化地位密切相關的。安史之亂時,成都一度成爲唐代臨時首都。自肅宗至德二年(七五七)分劍南爲東西兩川後,成都長期爲西川治所。唐末黄巢起義後,全國政治、經濟中心再次移向成都,名家世族,也多避亂入蜀,所以中原文化不可避免地給四川以較大的影響。此後,前、後蜀國又皆定都成都。北宋初在成都刊刻《開寶藏》,客觀上也爲四川培養了大批雕印工人。另外四川素稱天府,盛産木材與紙張,這也爲蜀本的興盛奠定了物質基礎。所以説,版本學與各個時期的政治、經濟、文化有着十分密切的關係,研究版本學也有助於研究各個時期各個地區的政治、經濟、文化。

    各種版本的出現,與學術的發展變化息息相關。因此,從對版本的研究中,可以看出學術發展變化的脈絡,從而深化我們的學術研究。譬如從對杜甫詩集版本的研究中,我們可以發現,杜詩在宋代受到特别重視,是有一個過程的,而這個過程是同政治形勢的變化緊密相關着。

    北宋前期,杜詩似乎没有受到格外重視。所以蘇舜欽在《題杜子美别集後》中稱:“杜甫本傳云:有集六十卷。今所在者才二十卷,又未經學者編輯,古律錯亂,前後不倫,蓋不爲近世所尚,墜逸過半,吁,可痛憫也!”(65)經過王洙、王安石、王琪等人的不斷搜集整理,直到嘉祐四年(一〇五九)終於在蘇州鏤版印行了《杜工部集》的第一個定本。王琪於嘉祐四年四月望日寫的《杜工部集·後記》云:

    原叔(王洙)雖自編次,余病其卷帙之多,而未甚布,暇日與蘇州進士何君瑑、丁君修得原叔家藏及古今諸集,聚於郡齋而參考之,三月而後已。義有兼通者,亦存而不敢削,閲之者固有淺深也。而又吴江邑宰河東裴君煜,取以覆視,乃益精密,遂鏤於板,庶廣其傳。(66)仇兆鰲引《吴郡志》也談及此事:

    嘉祐中,王琪以知制誥守郡,大修設廳,規模宏壯,假省庫錢數千緡。廳既成,漕司不肯除破。時方貴杜集,人間苦無全書,琪家藏本讎校素精,既俾公使庫鏤板,印萬本,每本爲直千錢,士人争買之。既償省庫,羨餘以給公厨。(67)

    這都説明杜詩在北宋越來越受到重視的情況。

    南宋雖然處於兵火戎馬之間,杜甫詩的整理和研究反而深入了,出了編年本、注釋本、集注本、評點本,甚至還出現了作僞的現象。如郭知達於淳熙八年(一一八一)自序其《九家集注杜詩》云:“杜少陵詩,世號詩史。自箋注雜出,是非異同,多所牴牾,致有好事者掇其章句,穿鑿傅會,設爲事實,託名東坡,刊鏤以行,欺世售僞。有識之士,可爲浩嘆。”(68)

    所有這些杜詩版本的出現,都反映了南宋人對杜詩的愛好同北宋人相比有過之而無不及。這是什麽原因呢?李綱《校定杜工部集序》道出了秘密:

    蓋自開元、天寶太平全盛之時,迄於至德、大曆干戈亂離之際,子美之詩凡千四百四十餘篇,其忠義氣節,羈旅艱難,悲憤無聊,一寓於此。句法理致,老而益精。時平讀之,未見其工,迨親更兵火喪亂,誦其詞如出乎其時,犁然有當於人心,然後知爲古今絶唱也。(69)

    杜甫所經歷的安史之亂同北宋末及南宋初年的政治動亂、人民流離有相同之處,隨着當時局勢的發展,杜詩越來越受到人們的重視和欣賞,就很容易理解了。

    從對新書版本的研究中,也可以窺見文化學術的發展變化。例如劉大杰的《中國文學發展史》即是一例。其上海人民出版社一九七三年版《前言》説:

    《中國文學發展史》是我的舊作,原爲上下兩册。上册成於一九三九年,一九四一年出版;下册成於一九四三年,一九四九年出版。……建國後,我將本書作過一些修改,分爲上中下三册,於一九五七年、一九六二年兩次印行。印行以後,各方垂教甚殷,使我得益不少。……學術領域裏對於資産階級思想的批判,使我進一步認識到在本書中所存在的一些歷史唯心主義觀點,現在我又作了一些修改。

    該書的這一版充塞着所謂評法批儒的内容。如其《柳宗元與古文運動》一章中《古文運動及其分野》一節聲稱:

    在古文運動中形成了兩派的鬥争。一派是革新,一派是保守。前派較富於尊法非儒的精神,後派則强調“徵聖”“宗經”的傳統。這兩派同樣提倡散文,反對駢體;同樣强調内容,反對浮艷,但他們的政治態度和文學内容是不同的。兩派的對立,形成革新與保守,唯物與唯心,法家思想與儒家思想在古文運動中的鬥争。

    這顯然是對歷史事實極爲荒謬的塗抹。同時,它對作家也作了很不公正的評價。如其評論韓愈,不僅取消了這位作家的詩歌在文學史上的貢獻,而且對他的散文也妄加貶損,甚至還不恰當地越出文學史的範圍,用大量篇幅對韓愈進行人身攻擊,如云:

    韓愈在寫《論佛骨表》時,似乎理直氣壯,一到潮州就上表求情,並以封禪諛帝。後來又祭鰐魚,宣揚迷信思想。這都表明,他爲了要升官發財,到了不擇手段的地步。《舊唐書》本傳説他:“觀諸權門豪士,如僕隸焉,瞪然不顧。”這真是笑話。……韓愈不但愛官如命,也愛錢如命。……劉禹錫《祭韓吏部文》説:“公鼎侯碑,志隧表阡;一字之價,輦金如山。”可見其稿酬之高。韓愈在這方面利用他的官名、文名,在死人身上賺到了不少的錢。

    從一九七三年版《中國文學發展史》中,我們可以清楚地看到十年浩劫不僅扼殺了正常的學術研究,而且嚴重敗壞了學風。同時,如果要理解劉大杰對古代文學史的觀點的變化,我們就不能不將《中國文學發展史》的幾個版本加以對照。

    我們從事學術研究也理所當然地應當辨别版本,引用文獻,如各本有異同,也應載明所據版本。余嘉錫在論目録應載版本時,曾概括地指出:

    使不載明爲何本,則著者與讀者所見迥異。叙録中之論説,不能不根據原書。吾所舉爲足本,而彼所讀爲殘本,則求之而無有矣。吾所據爲善本,而彼所讀爲誤本,則考之而不符矣。吾所引爲原本,而彼所讀爲别本,則篇卷之分合,先後之次序,皆相剌謬矣。……反是,則先未見原書,而執殘本、誤本、别本以爲之説,所言是非得失,皆與事實大相逕庭,是不惟厚誣古人,抑且貽誤後學,顧廣圻所謂“某書之爲某書,且或未確,烏從論其精觕美惡”也。(70)

    就拿《紅樓夢》來説,現存不同的版本有一百多種。在研究時,理應選擇某種版本作爲依據,並將它同其他版本作些必要的比較。何其芳的《論〈紅樓夢〉》正是這樣做的。作者在注釋中指出:“本文所引《紅樓夢》原文均根據庚辰本(引者案:指乾隆庚辰秋《脂硯齋重評石頭記》。有一九五九年文學古籍刊行社朱墨影印本、一九七四年人民文學出版社影印本)。庚辰本有脱誤,以有正本(引者案:指《國初鈔本原本紅樓夢》。上海有正書局有一九一二年石印大字本、一九二〇年石印小字本。一九五八年人民文學出版社出版的《紅樓夢八十回校本》即以有正本爲底本)或通行本校改。”(71)文中還引用了下面這段話爲例:“原來王夫人自那日着惱之後,王善保家的就趁勢告倒了晴雯。本處有人和園中不睦的,也就隨機趁便下了些話。王夫人皆記在心中,故今日特來親自查人。”並注曰:“有正本把這句話改爲‘原來王夫人自那日着惱之後,王善保家的趁勢治倒了晴雯。他合園中不睦之人,他也就隨機趁便下了些話説在王夫人耳中……’。把這些讒言都歸在王善保家的一人身上,不如原來的寫法近情理。通行的一百二十回本更删去了這段話。”(72)從這兩條注釋也可以看出,科學研究注意版本乃是獲得正確的事實和結論的必要手段。

    從事古代學術研究需要注意版本,從事現代學術研究也是如此。嚴家炎曾指出:

    我個人認爲現代文學研究中同樣應該注意這個問題(引者案:指應注意版本)。例如郭沫若的《女神》,一九二一年八月的初版本和一九二八年的修改本就有很大的不同。有的同志説郭沫若“五四”時期已經是一名“具有初步共産主義思想的知識分子”,依據的就是一九二八年的修改本。其實,在初版本中,《匪徒頌》並無對馬克思、恩格斯的歌頌(原句是對羅素、哥爾棟這兩個資産階級人物的歌頌),《巨炮之教訓》也没有“爲階級消滅而戰”等字樣(原句是“爲自由”“爲人道”“爲正義”而戰)。因此,要真正考察“五四”時期郭沫若的思想實際,我們當然只能依據《女神》的初版本。(73)

    綜上所述,讀書、校書、藏書、科學研究都必須注意版本;换句話説,研究版本學將有助於讀書、校書、藏書和科學研究工作。

    (1) 《論衡》卷一二《量知》。

    (2) 《説文解字》第七上。

    (3) 《儀禮注疏》卷二四。

    (4) 《儀禮注疏》卷二四。

    (5) 《全唐詩》卷三九一。

    (6) 《春秋左傳注疏》卷一。

    (7) 《全唐文》卷六二四。

    (8) 《玉海》卷五二。

    (9) 《明代版刻綜録》卷五。

    (10) 《猗覺寮雜記》卷六。

    (11) 王應麟《困學紀聞》卷八《經説》引。

    (12) 《説文解字》第六上。

    (13) 《北齊書》卷四五。

    (14) 《隋書》卷三二。

    (15) 王利器《顔氏家訓集解》卷六。下同。顔引《漢書》見卷一下《高帝紀》。

    (16) 樊曄事見《後漢書》卷七七《酷吏列傳》。中華書局點校本,下引正史同。

    (17) 《漢書》卷五一。

    (18) 《書林清話》卷一《板本之名稱》。

    (19) 《宋史》卷四三一。

    (20) 《夢溪筆談》卷一八。

    (21) 《石林燕語》卷八。

    (22) 《古文獻學要略》第三章《版本》一《版本的起源和發展》。

    (23) 《漢書》卷五三。

    (24) 《三國志·魏書》卷二。

    (25) 《書林清話》卷一《板本之名稱》。

    (26) 《版本學與圖書館》,載《圖書館》一九六二年第一期。

    (27) 《書目答問》卷首。

    (28) 《思適齋文集》卷一二《石研齋書目序》。

    (29) 《目録學發微·目録書之體制四·板本序跋》。

    (30) 《顔氏家訓集解》卷三。

    (31) 《庸閑齋筆記》卷八。

    (32) 詳《古文獻學要略》第三章《版本》二《版本的重要》。

    (33) 《輶軒語·語學篇》。

    (34) 《歐陽文忠全集》卷一二八《詩話》。

    (35) 《直齋書録解題》卷一九。

    (36) 《版本學與圖書館》,載《圖書館》一九六二年第一期。

    (37) 《御製文初集》卷一一《重刻十三經序》。

    (38) 《直齋書録解題》卷八。

    (39) 北京圖書館善本組輯録《觀堂題跋選録》(子集部分),載《文獻》第十輯。

    (40) 《漢書》卷首。

    (41) 《抱經堂文集》卷一二《書吴葵里所藏宋本〈白虎通〉後》。

    (42) 《與胡樸安書》,載《國學匯編》第一集。

    (43) 《靈芬館詩話》卷八。

    (44) 《劉向校讎學纂微·備衆本》。

    (45) 《水經注與水經注疏》,載《中國文學》第一卷第四期。

    (46) 《校讎通義》卷一《校讎條理第七》。

    (47) 《四部叢刊》景宋本《管子》卷首。

    (48) 《北齊書》卷四五《樊遜傳》。

    (49) 《舊唐書》卷七三《顔師古傳》。

    (50) “郭公”見《春秋左傳》莊公二十三年,杜預注云:“無傳,蓋經闕誤也。”“夏五”見同書桓公十四年,杜預注云:“不書月,闕文。”“郭公夏五”在這裏指欠葉闕文。

    (51) 《續本四部叢刊初編書録》卷首。

    (52) 《十七史商榷》卷首《自序》。

    (53) 《觀古堂所著書》第二集。

    (54) 《石林燕語》卷八。

    (55) 《讀書敏求記》卷二。

    (56) 《藕香零拾》本孫慶增《藏書紀要》第二則《鑒别》。

    (57) 《版本學與圖書館》,載《圖書館》一九六二年第一期。

    (58) 《古書收售業務知識·概説》,載河北省文化局一九六二年編印本《古舊圖書業務知識》。

    (59) 魏隱儒《古籍版本鑒定叢談·緒言》,山西省圖書館一九七八年印本。

    (60) 《版本學與圖書館》,載《圖書館》一九六二年第一期。

    (61) 太建,陳宣帝年號(五六九至五八二年)。

    (62) 《隋書》卷三二。

    (63) 參看于乃義《古籍善本書佛、道教藏經的版本源流及鑒别知識》,載《四川圖書館學報》一九七九年第三期。

    (64) 載《四川圖書館學報》一九七九年第三期。

    (65) 《蘇學士文集》卷一三。

    (66) 見仇兆鰲《杜詩詳注》卷末《附編》。

    (67) 《杜詩詳注》卷末《附編》。

    (68) 《杜詩詳注》卷末《附編》。關於《老杜事實》的辨僞,詳見程千帆《古詩考索·杜詩僞書考》。

    (69) 《杜詩詳注》卷末《附編》。

    (70) 《目録學發微·目録書之體制四·板本序跋》。

    (71) 見人民文學出版社一九六二年版《紅樓夢》卷首。

    (72) 見人民文學出版社一九六二年版《紅樓夢》卷首。

    (73) 《現代文學研究方法答問》,載《怎樣學習語言文學》,中國青年出版社一九八三年版。

    转自《校雠广义》

  • 麻彦坤:情绪智力研究的争议与一致性结论

    自20世纪90年代初情绪智力(EI)这一概念出现并得到推广以来,学术界在揭示如何以最佳方式对情绪智力进行定义、测量,以及挖掘其在各种社会情境中的应用价值方面已取得重大进展。与此同时,关于情绪智力的争论一直存在,有时甚至充满对立。一些学者将这一概念推崇为解决组织、学校中诸多问题的万能方案;另一些学者则完全否定情绪智力的价值。总体而言,即使有研究者对情绪智力的夸大主张持怀疑态度,但仍有不少人承认EI概念具有一定的合理性。综合当前研究成果,学术界已就情绪智力的相关探讨形成四个一致性结论:情绪智力定义模糊且测量不足;情绪智力与其他概念(包括一般智力、社交技能和人格)之间的关系尚未得到充分阐明;关于情绪智力与学业表现、职场成就及生活幸福感之间存在显著关联的主张,缺乏足够的实证数据支撑;尽管情绪智力的研究前景较为乐观,但要推动这一概念获得学术界与社会的广泛认可,依然有很长的路要走。

    情绪智力定义模糊且测量不足

    不同研究者对情绪智力的界定差异较大。梅耶(Mayer)与萨洛维(Salovey)及其同事将情绪智力定义为识别情绪、利用情绪、理解情绪和管理情绪的一系列能力。巴昂(Bar-On)和戈尔曼(Goleman)则将情绪智力定义为能力和人格特征的混合体。其中,戈尔曼的定义可能最为宽泛,涵盖自我控制、情绪觉察等能力与胜任力,以及尽责性、乐观等广泛的人格特征。

    混合模型的情绪智力定义存在两个核心问题。首先,这些模型缺乏坚实的实证基础,现有研究中能够将混合模型中的各种能力、胜任力、人格特征及其他属性关联起来的证据通常薄弱且缺乏说服力。其次,当情绪智力被定义为能力、人格特征与其他属性的广泛混合体时,很难真正厘清高情绪智力与低情绪智力的具体指向。例如,戈尔曼将情绪智力定义为20多种不同的胜任力,很难想象高情绪智力者能在所有方面都表现出色,或低情绪智力者在所有方面都表现糟糕。与认知能力领域不同,目前没有强有力的证据表明,情绪智力混合模型定义的所有元素背后存在一个统一的一般因素。

    基于能力的EI模型评估通常更受学术界青睐,但这类模型同样存在问题。基于能力的EI模型主要受到两方面批评:其一,在EI定义中纳入某些情绪相关任务(如表现同理心)而排除其他任务,缺乏明确的理论依据,EI的边界始终难以界定,没有任何基于能力的模型能合理解释为何某些看似涉及情绪的任务属于EI范畴,而其他任务则不属于;其二,这些模型尚未催生出被学者广泛认可的测量工具。

    基于能力的EI测量还存在一些尚未充分解决的特定问题。与其他能力测量不同,基于能力的EI测量要求被试回答问题并完成任务,但这些问题和任务并无所谓的标准答案。相反,这类EI量表严重依赖专家评分或共识评分——衡量个体感知、理解和管理情绪的能力时,通常需要将个体的反应与专家意见或其他同类被试的反应进行比对,与专家或同类被试看法不同的人会被判定为“错误”。目前尚不清楚,在情绪领域与专家或多数同龄人看法不同的人,究竟是能力低下,还是拥有一种全新的(或许更优的)思维方式。

    鉴于定义EI的难度,人们对EI测量的有效性存在担忧也就不足为奇了。要开发出能测量戈尔曼和巴昂的混合模型所描述的EI类型的有效工具,几乎是不可能的。在将EI视为能力、胜任力和人格特征混合概念的模型中,连EI的确切含义都难以界定,更遑论开发有效的测量工具,或判断特定测量是否提供了足够的EI指标。

    情绪智力与其他概念的关系不明确

    目前仍有一些关于EI的基本问题亟待解答,例如,EI真的是一种智力吗?EI测量能提供其他相关概念测量无法提供的信息吗?EI与社交技能、同理心或自我监控等相关概念有何异同?

    针对EI是否属于一种全新且独特的智力类型这一问题,可以明确的是,EI与智力的其他方面存在一些共同特征。与所有其他智力一样,EI涉及对特定领域、特定类型信息(即情绪)的主动处理。然而,EI至少在两个方面与传统认知能力存在差异。首先,所有能力最终都是根据被试出色完成特定任务的水平来定义的,如解决数学问题、回答事实性知识问题、从阅读段落中提取意义等。构成EI的能力也涉及对情绪的特定处理(如理解、管理、感知),但通常很难判断一个人在这些方面的表现优劣;与许多其他能力不同,判断个体是否出色地完成EI类任务,可能不存在任何客观基准。其次,几乎没有证据表明,与EI相关的能力在认知能力的一般分类中处于何种位置。在厘清构成EI的特定成分与其他已知能力的关系之前,很难评估“EI是一种能力”这一命题的合理性。

    证明EI价值的一种核心路径,是证明EI测量能够预测或解释其他概念无法充分预测的结果。然而,在预测与EI相关的结果(如学业成就或职场成功)时,EI测量似乎无法提供正常人格和一般智力测量不能充分解释的信息。迄今为止,证明EI与心理学家广泛研究的其他类似概念存在差异的证据仍十分稀少。

    情绪智力的夸大主张缺乏实证支持

    关于EI的夸大主张主要包括:在决定学业成就和职场成功方面,EI与智商(IQ)同等重要或更为重要;EI与种族、性别或社会经济地位没有强烈关联;EI可被描述为一组相对容易培养的胜任力;由于情绪智力的表现方式多种多样,许多人(甚至大多数人)已经具备或可以具备高水平EI。

    这类主张对EI的流行起到了关键推动作用,而围绕这些主张的争议,也解释了为何许多学术批评对EI持严厉怀疑态度。将EI视为多种特质、胜任力和能力混合体的宽泛定义,最容易与关于EI重要性、EI测试公平性和EI培训项目成功率的笼统主张挂钩。而针对基于能力的EI版本的研究,通常会得出更为谨慎的结论。

    关于EI相关性和重要性的宽泛主张,不仅缺乏实证支持,也经不起合理性检验。可以肯定的是,EI在不同环境中的重要性存在差异,这至少表明,关于EI的主张需要进行实质性限定。例如,在某些工作中(如需要频繁与不同受众沟通或人际压力较大的工作),EI可能显得相当重要;而在另一些工作中(如许多技术类工作,其中大部分任务由个人独立完成),EI的影响则可能微乎其微。

    一些支持者对EI重要性的夸大主张是EI争论的核心,但在许多情况下,这些主张本身并未得到真正的学术探讨。例如,“EI比IQ更重要”的主张虽广为人知,但几乎没有确凿证据支持这一断言。提出此类主张的EI拥护者,基本上无视支持这些主张的文献(主要是学术文献)的匮乏,而是直接诉诸大众媒体和行业期刊,在这些平台上,强烈的主张与薄弱的证据并存的现象并不罕见。

    亟须促进情绪智力研究健康发展

    诸多争议已推动EI从一个由少数研究人员开展的相对孤立的研究领域,转变为一个热门研究话题。目前,越来越多的研究者开始认真审视EI理论、测量方法和干预措施的优缺点,为全面深入地研究EI奠定了基础。

    如果当前EI模型存在的主要问题能够在持合理怀疑态度的受众面前得到解决,且数据表明EI相比其他相关概念真正具有独特优势,那么EI将顺理成章地进入个体差异研究的主流领域。而要实现这一目标,需要开展大量认真细致的研究工作。

    能力模型支持者面临的最紧迫问题,是如何改进EI的测量方法。与EI相关的能力测量仍不完善,而更优质的测量工具将极大地推动EI的研究与实践。为EI建立扎实的理论和实证支持基础,全面厘清EI与其他能力、人格特征、偏好和态度之间的关系,开发更优质的EI测量工具,是促进EI研究健康发展的关键举措。EI研究人员应设定务实目标,即证明EI概念在预测、解释和影响一系列相关情境中的行为方面具有一定价值,并能够解释其他类似概念无法充分解释的现象。

    转自《中国社会科学报》

  • 舒国滢:理解:法教义学认识法理的基本方式

    有关法学(法教义学)的争议主要集中在这样几个方面:

    第一,从知识论上讲,法学有没有自己的稳定的研究对象?这个对象到底是什么?

    第二,法学是一种决疑的技艺(或“决疑术”),还是一门真正意义上的科学?

    第三,如果说法学是一门科学,那么它到底是一门纯粹的理论科学,还是一门实践科学,或者两者兼而有之?

    第四,从方法论上看,法学是自治的,还是依附性的,法学有没有自己独立的认识论和方法论?

    第五,法学的知识兴趣是价值关联的,还是像自然科学那样仅仅强调知识是价值无渉的?

    第六,从学科归属上看,法学是说明的科学,还是诠释(理解)的科学?从更宏大的学科框架看,法学属于社会科学,还是属于人文科学(精神科学)?

    本文打算透过法理之认识论和方法论难题的讨论,来部分地回答上述问题。

    一、重新审视法学研究的对象:法理问题

    任何一门科学都是通过其认识对象及其工作方式来确定的,科学的目的都是对其所要研究的对象找到令人满意的说明,法学当然也不例外。然而,法学到底以什么作为其认识对象,以什么作为自己的工作方式(或工作方法),这个问题历来众说纷纭,莫衷一是,至今未有定论。在中国先秦时期,法学以研究刑名法术为鹄的,秦汉以后以解释律条、法律概念或说明“法令之所谓”(“律学”)为业。在古罗马,法学(jurisprudentia)这门学问也是偏向实务工作的,主要服务于“法律解答”“撰拟契据”“协助诉讼”等事务。11世纪以后,欧洲大学开创了“大学的法学”(Die Rechtswissenschaft an den Universitäten)模式,法学的理论研究和体系建构开始兴盛。17世纪以来自然科学的巨大进展及其确立的知识(真理)范式构成了法学知识论和方法论上的样板,法学家们逐渐抛却了古老的知识传统,转向强调“科学”(公理)推理,强调知识确定性、精确性及普遍性之严格规准的实证主义。他们渴望把法学完全加以科学化或数学化,希望按照纯逻辑演绎的“几何学方式”和自然科学标准构想法律公理(逻辑)体系,意图实现“法律公理(逻辑)体系之梦”。法学在历史上形成不同的研究面向和学问追求,必然引起“何为法学”“法学为何”等等问题的争论。

    为澄清上述问题,我们先从不同的科学研究谈起。在历史上,自然科学以研究自然事态(“自然世界是什么”)为目标,它们探究真实的自然外界是什么样子的(物理),其中无关乎人对自然事态“应当如何”的价值评价,对其研究的立场是“价值无涉的”,因为从认识论的角度看,自然事态本身包含着人的认识“不可予以支配”的性质,即在本质上,对于自然事态之“实”,我们拿它没有办法,或者说:我们对它无可奈何,我们不能期待它迎合(或呼应)我们的想法、意愿,不能从语言表达的角度要求世界呼应我们的词语,它们亦不可能通过我们的认识(包括认识兴趣)而被取消或毁灭。

    相对而言,以研究社会事态(社会现象)为己任的社会科学(社会学、经济学、政治学等)在科学性质和类别的归属上要复杂一些。这是因为,迄今为止的社会科学研究杂糅着研究者们各自迥异的知识兴趣、理论范式和理论目标,其中不乏有对日常社会生活样态之因果关系的探索(社会生活世界的“是”,比如:人们之间有什么样的行为关系?人们为什么这样行为或那样行为?),或者试图模仿自然科学的法则和方法,将社会系统作为自然系统一样来加以观察,或者把社会、个人的“心理”、社会“病理”、人际关系的时间、空间结构等等作为客观存在的变量,来研究社会存在什么关系的事态,收集观察结果,构建类似于自然科学研究的“经验基础”,然后对通过经验获取的数据或经验性条件进行理论分析,试图从中“引出结论”。

    当然,亦有一些社会科学研究不完全按照自然科学的范式来考察社会事态(社会现象)。从事这一类研究的学者会认为社会事态(社会现象)是“属人的世界”“与人的理解、评价相关的世界”,故而把社会事态(社会现象)中的“人的理解”“人的评价”“行动者‘主观追求’的意义”等等作为实然存在的变量纳入科学探究的范围,此种探究夹杂着所要证明的社会、个人之难以计量的复杂(主观)心理因素,亦渗透着研究者对于研究对象(行动者的心理)的前判断、前评价和前理解,潜藏着研究者自许的“理解之意义期待”。在此种情形下,社会认知(social cognition)的客体及其相互关系背后隐匿着“情境演算”的逻辑难题,交织着社会群体或个体之间的利益冲突、价值观冲突和文化冲突(马克斯·韦伯所讲的“诸神纷争”)等等,而且这些冲突常常看起来是不可调和和不可公度(不可通约)的。显然,这一类问题的研究难以完全满足自然科学概念上的科学目标和科学理想,它们或多或少地运用精神科学(人文科学)的一些方法(比如马克斯·韦伯的“理解社会学”),尽管如此,其理论旨趣仍然是追求“是”的知识,寻找社会变化和人类历史发展内在的因果关系及其规律性。

    除此之外,还有一类学问,它们既不研究自然世界的“是”之问题(自然事态,或者自然事物存在和运行的因果关系、规律等),亦不证明社会生活世界的“是”之问题(社会事态,或者社会关系、结构及社会事件发生的原因及结果,等等),而是在社会生活世界的“是”之基础上探究如何正当(正确)处理所面对的事情(事项)的“(应然的、适当的)根据”问题。这一类问题与“属人的世界”“与人的理解、评价相关的世界”具有特殊的关联。严格地说,它们着眼于人类的(应然行动相关的)规范世界领域的问题。

    这里所谈的“事情”(英语:thing/德语:Sach)与“事态”(英语:states of affairs/德语:Sachverhalt;被陈述的事态叫作事实,英语fact/德语Tatsache)是两个不同的概念,它们两者所指不同。严格地说,只有在人类世界(或人类相关的世界)中才会存在事情,相反,自然界发生的情况可以称作事态,不宜称作事情。自然事态唯有与人相关(与人类的存在相关)或者被视为“属人的世界”才会成为事情的肇因,例如自然灾害造成房屋、道路的损坏,是“与人相关的”,需要人们去处理。广义上的“事态”包含“行为”(act)状态(比如,某人的一只手搭在椅子上)和“事件”(event),后者包括自然事件和社会事件。在日常用语中,事态与事件的用法有些微的区别:比如,在一片草坪中央长着一棵树,这是事物(树)的存在状态(注意这里的表述:事物不同于事物的存在状态,不能说“事物”就是“事态”),可以作为通常被人们所理解的(没有造成结果的)事态;房屋倒塌砸伤了一头驴,人群骚乱推翻了一辆公共汽车,则为事件(前者为自然事件,后者为社会事件)。故此,事件可以被看作事态的一个子集(类),即造成结果(特别是损害结果)的事态。造成结果(特别是损害结果)的事态的意义该如何评判、造成的结果该如何处理(如何确定事态蕴含的后果),才是我们所说的现实生活中的一件“事情”,我们用S(F→OR)来表示,意思是说:事情(S)是指某种事态(F)发生时该如何正确(妥当地)处理[即,寻找F 所蕴含的OR(后果归结)]之事项。由此可见,事情是由事态(而非事物直接)促成的,但事态本身不是事情[事物更不等同于事情,唐代法藏说“物具理而为事”, 这里的“物”不应仅指“事物”本身,而更应看作“事态”(在法藏这里,“事”与“物”显然是分开使用的,“事物”只是“物”一词的现代用法)]。从认识的角度看,事态是事情该如何正确(妥当地)处理或解决的先在条件,构成有待处理之事情的判断基础。事态作为事情的先在条件,本身内嵌着事情该如何正确(妥当地)处理或解决(即后果归结)的原因性的规定性根据(die Bestimmungsgründe der Kausalität),我们将事情之先在条件(事态)与后果归结之中内嵌的这种原因性的规定性根据(即“某个事态F发生时为何蕴含某个后果”的规定性根据)或“当然(逻辑)法则”称作“事理”(所谓“理在事中,事不在理外”,或如法藏所言“具理而为事”)。

    在法律上,现实生活中的具体事情(S)通常按照其特征相似性而被归类处理,即,同类相关的现实生活中的具体事情经过综合的方法加以提炼和归纳整理而被类型化或抽象化,上升为法律规整或法律规范规定的待处理事情(LS)。法律规范用专门的法律概念、术语(诸如“法律权利”“法律义务”“法律责任”“法律关系”等)和“若(如果)……则(那么)……”的语句结构(德文:“Wenn-Dann”Struktur/英文:if-then )对此加以规定。这种假言条件句(主句和从句构成的复合句式)表达一种由两个支命题构成的复合命题,具有假言条件性(hypothetical conditional character):“若(如果)……”表达的是假言规范命题的“前件”(行为条件或者行为构成要件),“则(那么)……”表达的是假言规范命题的“后件”(行为指令或者法律后果)。基于此,法律规范针对待处理事情(LS)一般采取两种规范语句(假言条件句)模式:(1)行为规范语句[即,有关行为人如何行为之事项(LS1)的规范语句(施为性指令语句)]。针对行为人尚待实施(指向未来的可能世界)的行为,法律规范采取指引的方式规定“行为条件”(H)和“行为指令”(OT),它们两者在规范逻辑上存在“限定”关系(行为条件限定行为指令),即: LS1(H →OT),或者:x(Hx→OTx)。这个逻辑式用日常语言表达为:在行为条件H下,行为人“应当做”“可以做”或“不得做”行为T。例如,《中华人民共和国民法典》(以下简称《民法典》)第1151条规定:“存有遗产的人,应当妥善保管遗产,任何组织或者个人不得侵吞或者争抢。”这个条文就“存有遗产”这件事作出一般的规定,它不是对“张三”“李四”等特定个人(a,b,c,d,……n)规定的行为条件,其行为条件指向不特定的主体(Hx,即“存有遗产的人”“组织”或者“个人”),此处的“遗产”不是指某个特定的物件或财物,而是对死者所遗留的一切财产、财产衍生物、替代财产、消极财产(债务)的统称。就此条件,法律对不同的行为主体(“存有遗产的人”“组织”或者“个人”)分别规定了“应当妥善保管遗产”“不得侵吞或者争抢”的行为指令(OT)。这样,《民法典》第1151条通过“当为”的行为指令引导“保管遗产”之事按照“当然(逻辑)法则”具体展开或者发生。(2)裁判规范语句[即,有关行为人已经实施的行为或者事件如何裁判之事项(LS2)的规范语句(裁判性指令语句)]。针对行为人已经实施的待评价之行为(事实行为)或者事件,法律规范采取指示裁判的方式规定“行为构成要件”(T)和“法律后果”(OR)。T和OR两者之间在规范逻辑上存在着“蕴含”(或归结)关系(行为构成要件蕴涵法律后果),即:LS2(T →OR),或者:x(Tx→ORx)。在上述逻辑表达式中,T不是指某个具体的个案中发生事实行为或者事件本身,个案中发生的事实行为或者事件可以用逻辑符号F表达,T是同类相关的F(F1,F2,F3,……Fn)之类型化或抽象化,是法律规范指令裁判者用来规范评价、判断与描述人们的事实行为(实际行为)或者事件的规范“案型”。比如,我国《中华人民共和国刑法》(以下简称《刑法》)第232条规定的“故意杀人”就是刑法上要处理的一个“案型”(T),而“张三持刀刺中李四的腹部导致李四死亡”(记为Fa)或者“王五用铁锤直击赵六头部致使赵六当场毙命”(记为Fb)等等表述的内容则属于F,若上述F(Fa或者Fb)在所呈现的特征上一一符合“故意杀人”这个案型(T)的诸要件[即:“故意”(T1)、“非法”(T2)、“剥夺他人生命”(T3)],那么F和T在逻辑上就具有了“涵摄”(subsumption)关系,表明F是T项下的一个子类(或子集,可以表达为:F∈ T),那么针对所有的人(x)规定的“行为构成要件”(Tx)就可以被用来评价Fa和Fb。如果Fa和Fb完全符合Tx,则可以得出Fa∈Tx=Ta和Fb∈Tx=Tb,也就是说:张三和王五的行为构成刑法上的“故意杀人”(T)。至于如何对待“故意杀人”(T),《刑法》第232条规定了相应的“法律后果”(ORx),即“处死刑、无期徒刑或者十年以上有期徒刑”。这样,根据逻辑法则(比如“司法三段论”),我们就可以推导出张三和王五的行为后果:Ta→ORa,Tb→ORb。这其中的法理从两方面看:(1)体现在法律规范规定的事情(LS2)中的法理或“法条中的法理”,即,“‘故意杀人’应当被判处‘死刑、无期徒刑或者十年以上有期徒刑’”的规定的根据。这个根据应从“行为构成要件”和“法律后果”两方面来理解:一是为何“故意杀人”是一种犯罪(比如,杀人行为是不正确的,因为该行为违反正义,背离人伦,破坏和平,应从规范上予以否定评价);二是为何这种犯罪应被判处“死刑、无期徒刑或者十年以上有期徒刑”(比如,杀人罪行的社会危害性大,犯罪动机至恶,出于保护社会安全和维护正义,应以重刑处置)。(2)体现在个案中的事情如何根据法条加以处理(比如Ta→ORa,Tb→ORb)的法理,即涉及为何根据某个法条来处理个案中的事情(即某个事态发生,为何依据这个法条而不是那个法条来作后果归结)并且得出F∈ T和Ta→ORa、Tb→ORb等等结论的规定根据,它们可以被称为“个案中的法理”(具有个案中事实关联性的法理)。通过《刑法》第232条的规定,可以看出,所有的裁判规范正是通过“当为”的裁判指令引导包括“故意杀人”如何处理等等在内的裁判之事按照“当然(逻辑)法则”具体展开或者发生。

    无论现实生活中的具体事情[S(F→OR)],还是它们经过类型化或抽象化而被上升为法律规整或法律规范规定的待处理事情[LS1(H →OT)],或者[LS2(T →OR)],都包含着构成事情之先在条件(事态)与后果归结或法律规范规定的行为条件与行为指令或行为构成要件与法律后果归结所内嵌的原因性的规定根据,这些原因性的根据分别被称为“事理”和“法理”。如上所述,“事理”就是日常生活中的具体事情[S(F→OR)]之先在条件(事实F)与后果(OR)归结内嵌的原因性的规定根据。相应地,“法理”(拉丁文ratio juris,英文the reason of the law),则是指法律规整或法律规范规定的待处理事项(LS1或LS2)之行为条件(H)与行为指令(OT)或行为构成要件(T)与法律后果(OR)归结内嵌的原因性的规定根据,包括法律规范规定人们在何种条件下该如何行为(可为、勿为、应为)以及所发生的事实行为与法律后果之间该如何正确(妥当地)归结的原因性的规定根据,我们也可以将这个原因性的规定根据称为“法内在的当然(逻辑)法则”。对此,我们再以正当防卫为例分析:刑法规定人有正当防卫的权利,行为人在本人或他人面临不法侵害的时候,出于保护自己或他人正当防卫的必要,采取防卫的措施,不负刑事责任(T →OR)。这个规定本身(T →OR)不是自然事物运行的必然呈现方式(自然法则),而是以“命令句”(裁判规范)表达有关“正当防卫”的应然处置方式,即防卫之“道”。这个防卫之“道”本身包含如下条件(裁判规范中的行为构成要件):(1)行为人本人或他人的生命、财产正在遭受不法侵害(T1);(2)行为人本人或他人的生命、财产遭受不法侵害时,国家(或特定的公权力机关)保护缺位,即,国家对被侵害的生命、财产不能提供有效的保护(T2);(3)不法侵害具有紧迫性,且遭受不法侵害攻击者不可避让(T3);(4)对不法侵害采取防卫行为是保全本人或他人生命、财产的唯一手段(T4)。这些条件或行为构成要件(T1,T2,T3,T4)使防卫行为具备了合理、合法、正当的基础,也是刑法规定正当防卫不负刑事责任(OR)的根据所在,即,当规范规定的条件或行为构成要件(T1,T2,T3,T4)具备时,行为人采取防卫行为保全生命或财产,法律不应将这一防卫行为作为错误(危害)行为予以否定评价并加以制裁。这就是规范规定的条件或行为构成要件(T)与其后果(OR)归结所内嵌的原因性的规定根据或“当然(逻辑)法则”(防卫之“理”)。

    只要法律规整或法律规范规定的待处理事项存在着,只要行为人的行为条件与行为指令或者法律规定的行为构成要件与法律后果归结之间的关系存在着,那么,“法理”这种原因性的规定根据或“当然(逻辑)法则”就是客观存在着的。法理不是人凭空想象出来的,不依赖于我们个人(主观)的心灵、也不依赖于我们个人(主观)对它的认识而客观存在,它必须是“源于事情的本性和客观现实的”(derived from the nature of things and objective realities),乃属于一种外在的精神性的实在(eine seelische Wirklichkeit)或客观精神实体,即“实在对象内嵌的本质存在者和意义存在者”(das dem Seinsgegenstand innewohnende Wesenhafte und Sinnhafte),它们等待人们通过特定的认识手段去发现。人类正是在对法理这种客观精神实体(客观的本质存在者和意义存在者)已然认识的基础上规定何种行为在法律上是必须的(应为)、何种行为是禁止的(勿为)、何种行为是允许的(可为),以及人们所从事的何种(事实)行为应该承担何种法律后果,等等。在逻辑上,法理[法内在的当然(逻辑)法则]的存在先于制定的法律(实在法),是法律(实在法)存在的正当性基础,一切法律(实在法)因其内在之理而立,无理不成法。这是因为,任何实在的法律若要共享“法”这个称谓,就应包含更高的、本质的真理,无理(没有法理基础)的实在法不符合法的“当然(逻辑)法则”性质,其本身可能因为法律规定上的无理的实践承诺(practical commitment,语言中的实践承诺是指以言语强调通过行动使事情成为现实)而充斥着“言行不一”的施为性矛盾(performative Widerspruch),进而丧失作为法概念应具有的本质要素构成(比如,要求规范承受者必须遵循的规范力),徒以发布者所宣称的“法律”名义存在。在人类历史上,那些缺乏法理的实在“法”甚至有可能沦为实质的“不法”(Unrecht)。

    法学(法教义学)作为一门具有明显的“实践干预”(Rechtswissenschaft als Eingriff)性质(实践性)的学问,含有改变制度实践的技术潜能[即,法学以自己的理论影响(即:指导、评判、检测和校准)现实的立法实践和司法实践,从而使立法和司法“按照科学的方式”运行],正因为如此,它就更需要以“法理”作为自己的研究对象,将“法理”作为其“实践干预”的奠基石,就法律规整或法律规范规定的待处理事项得出合理、规范、科学的结论。唯有如此,法学才有可能使自己成为一门区别于哲学、自然科学和其他人文科学的科学而独立存在。

    二、“法理”的隐在性及其认识方式

    尽管我们可以说“法理”是法律规整或法律规范规定的待处理事项之行为条件与行为指令或者行为构成要件与后果归结内嵌的原因性规定根据,不依赖于我们的心灵、也不依赖于我们的主观认识而客观地自在地存在的,但它并不是“自明的”(“明见的”),不会自动地呈现(或反映)在我们的知觉系统之中,没有可以被知觉的图像(picture)或“相”[“表象”或“显相”,包括声音之相(声相)、气味之相(味相)、体感之相(体相:如物体“轻重”“大小”之印象)等等]),也没有可以“被看出来的样子”。或者说,人们寻找法理不可能通过自己的感知系统直接“看”到(感官观察到),因为法理毕竟不同于那些物理世界的实体或事态,不同于那些“视觉客体”(可见的物体),后者有一种可以被人直观(通过感官观察或知觉/perception)的实在的性质(reality),比如,天正在下雨作为一个事态具有待人们外在观察(“看”)的诸多对象可感知元素(如下雨发生的时间、地点,雨滴的大小,雨与周遭的环境关系,等等)。当某人说“天正在下雨”这句话时,他/她实际在陈述一个与其观察到的下雨这个事态相符合的事实(事态承诺),事态及其呈现构成了其所陈述的事实的实在性基础,也就是说,外在的事态之“实”为陈述的事实之“真”奠定了基础,他/她完全可以通过(经验)证据证明事态的实在性而显示其所陈述的事实为真。与此不同,“法理”这种精神性的实在往往隐匿在法律规范规定人们在何种条件下该如何行为(可为、勿为、应为)以及所发生的行为(事实行为)与法律后果之间该如何归结的关系之中,或者隐藏在有待处理的个案事项(具有“事实关联性”)之先在条件(事实/事态)与后果归结之中,不容易通过人类直观或外观直接感知。在日常生活上,我们经常说“欠债还钱”“损害赔偿”“合法不向不法让步”“任何人不得通过错误的行为获得利益”,然而,这些语句包含有“实践承诺”,却不会像“天正在下雨”语句表达的事态承诺一样容易得到经验证据以及说明的模式之证实。这是因为,“实践承诺”乃是一种行动指引(handlungsleitend)承诺,往往带有指令(应然)性质。从语言哲学[特别是词语与世界之间“呼应方向”(directions of fit)的理论]角度看,这样的命题通常表达话语的评价性(好坏、对错、可欲/不可欲)功能、规定性功能(the prescriptive function,有关行为指导或行为承诺的话语功能)和施为性功能(the performative function,说某事即表示做某事的话语功能),具有“世界呼应语词的方向”(the world-to-word direction of fit)。

    这意味着,认识法理这种精神存在实体难以遵循“是”之意义上的逻辑法则(比如物理法则),作为认识法理结果的法学知识亦难以按照“事实真”(factual truth)的知识标准予以确立。就其原初意义而言,知识论上的“真”是针对“是”(或“在”)之对象或者能够为人所知的经验对象(世界“有什么”“是什么”或“什么发生”)的正确认识(证实)结果,相应地,有关“是”之经验对象的知识(比如物理学知识)以“事实真”(识别“是”之经验对象“真”存在)作为其知识性质的判断标准,即:知识不过是经过证实(经验验证)的符合事态之“实”的真信念,或者更加简括地说:知识被看作是一种得到证成的真信念(justified true belief,简称为JBT)。

    在这种主—客二元的知识观看来,一切自称或者主张自己的信念为“知识”的东西均以“事实真”作为判准,如物理学中的“公设”:“不可能把热量从低温物体传向高温物体而不引起其他变化”“物体受热后,温度升高,物体体积变大;物体受冷后,温度降低,物体体积缩小”,等等。即使标榜为“万学之学”(the science of sciences)的逻辑学最初也不过是确立命题之“事实真”标准以及建立在这种标准基础上的推理语言、规则和方法的学问。故此,亚里士多德在《解释篇》第4章(17a4)中指出:“并非任何句子都是命题,只有那些自身或者是真实的或者是虚假的句子才是命题。真实或者虚假并不为任何句子所有,例如祈祷就是既无真实也无虚假可言的句子。”若以此作为规准,法学上研究的法理问题和以法理为基础的法律规范语句(行为规范语句和裁判规范语句)就无从直接通过形式逻辑加以描述、分析和解答,因为一切法律规范语句都不过是一种命令句,而命令句所表述的内容不属于有关世界“有什么事态发生”的“本体论承诺”(“事态承诺”),既不可能作为(直陈句)三段论的结论,也不能作为推论的前提,它们不易在逻辑上转化为亚里士多德所说的“真实的或者是虚假的句子”(命题),也难以按照经典命题逻辑来判断法律规范语句表述的内容的真假,这样的语句之间不存在前提和结论之间真值传导的关系(即,“假如前提为真,那么结论必然为真”的推论关系,一个演绎上有效的论证不可能同时“前提真,其结论假”)。

    说到底,自然科学以及其他研究“是”之问题的科学(包括有关“是”之问题研究的社会科学)在本质上均属于“说明的科学”(science of explanation),均秉持有关自然世界和社会世界之认识的“理论说明模式”(说明的体系)。这种认识模式的特点在于“从事实(F1)到事实(F2)”,用所谓“联系的原则”或者“观念的关系”(relation of ideas),通过普遍化的证伪和证实方法以及“最佳说明推论”(Inference to the Best Explanation, IBE),在诸种事实(F1,F2,F3,……Fn)之间建立起“是”之客观因果说明(比如,用F2说明F1,用F3说明F2,诸如此类)链条,形成所谓“事实真”的一整套说明性的知识体系。

    在探究自然世界的“是”的问题时,自然科学中的实验科学(物理学、化学、生物学,等等)往往通过“控制实验”(control experiment,即,控制—对照—比较,这种方法将探究的目光投射于自然的“部分”而非其“整体”,便于将研究的对象凸显出来,以一种“有限制的但却确实可靠的”方式观察)来找到有待观察的实在世界中两个或两个以上的事实因素之间是否存在一种确定的互动关系,是否具有“因果关系的法则性质”(the nomological character of causality),据此进一步探究自然和社会的运动中的“必然性”(neccessity)“常规性”(regularity)“有序性”或“节律性”(rhythmicality),并将这些现象上升为有关自然规律(自然法则)的理论。在此方面,实验科学一方面纯粹建立在经验的基础上,特别是在实验中对自然因素(条件)的控制与观察,另一方面建立在对这种结果以数学和逻辑方式所表述的逻辑严密的衡量的基础上。比如,如果要检测某一河水是否遭到污染,自然科学的方法(比如化学的方法)是先提取(控制)目标水样,然后对提取的水样水质的COD、氨氮、Ph、溶解氧、浊度、温度等指标一一化验(实验),最后得出所测之河水是否受到污染的结论。在某些社会科学领域,社会学家们也曾经尝试用这种方法研究社会现象中“是”的问题。例如,研究者若想知道“城市人群是否有横穿马路”的习惯,他/她可以选择在城市的交通路口对经过的人群进行观察和记录,统计在规定的时间内每百人中不遵守红绿灯禁行规定的人数,就可以得出有多少百分比率的人横穿马路的结论。不过,依据此种统计学方法和其他控制实验(社会调查)方法对于社会现象中“是”的问题所得出的结论可以用于说明某些社会现象发生的原因,却不能直接被用来作为对“法理”[法内在的“当然(逻辑)法则”]的论证。例如,我们即使能够观察到城市人群中99%的人习惯于横穿马路,也不能以此作为当然(应然)理由或规范根据而主张“人可以横穿马路”,从而否定道路交通“红绿灯”设置(“红灯停,绿灯行”)的有效性,因为在规范层面上,道路交通“红绿灯”设置的规范效力比行人随意横穿马路这个行为习惯中的选择意愿(自由意志)有更强的法理基础(比如,交通安全,交通效率,等等)。也就是说,若“红灯停绿灯行”道路交通规则有效,那么,在红色指示灯亮起时,随意横穿马路的行为习惯就是不被赞许的,应在规范层面上予以否定。

    可以看出,在事实之间进行客观因果说明的理论模式(“说明模式”或“说明的体系”)不能直接用来解释“红灯停,绿灯行”的规范及其背后的“当然(逻辑)法则”性质,不能证成上述“张三持刀刺中李四的腹部导致李四死亡”或者“王五用铁锤直击赵六头部致使赵六当场毙命”为何要承担“死刑、无期徒刑或者十年以上有期徒刑”(Ta→ORa、Tb→ORb)的规定根据。所以,真正的法教义学学者(民法学者、刑法学者等)均意识到,法学和自然科学在科学性质、研究目标、分析方法和证明方式上均存在巨大的差别:法理问题根本不可能按照自然科学的理论探究图式(通过数学构造方法的自然认识图式或自然认识说明模式)来加以探究。换言之,自然科学的理论探究图式(说明的理论模型、范式和方法)不是法律科学的标准范例,试图将法学的理论观察锚定于自然科学的理论探究图式,难以解释和解决复杂的作为精神实体的法理问题。

    这就要求我们重新审视法学作为一门学问(科学)的特殊性质:在历史上,法学和其他人文科学一样将“理解”(understanding)或“理解的体系”作为认识世界的一种基本方式(胡塞尔说:“理解”或“解释”启示着“精神存在”),这一点与自然科学以及其他研究“是”之问题的科学(包括有关“是”之问题研究的社会科学)有别,因为后者是以“说明”(explanation)作为认识世界的方式(模式)。

    在汉语中,“说明”与“解释”(intepretation)经常作为同义词相互替换使用,在学术界,英文explanation一词亦常常被翻译为“解释”。其实,在语言哲学上,“说明”一件事,不等于“解释”一件事,因为“解释”涉及说话者对其所陈述之事的“理解”[在此意义脉络中,“解释”或者“诠释”是“理解”项下的概念,即施话者通过言语或语句向受话者表达的理解,而且,通常是用于文本、符号、概念(或语句中的词语)的理解]。“说明”作为一种认识世界的方式通常由两个部分组成:被说明项(explanandum,即,需要被说明的事物、事态或对象)和说明项(explanans,即对需要被说明的事物、事态或对象的说明部分),它们两者构成了对世界发生的事态进行说明的基本框架:例如,在一起事件中,如果有人问“为什么有烟?”,那么“烟”就是被说明项(explanandum),而“因为有火”则是说明项(explanans)。在这种说明关系中不存在我们后面要谈及的“解释”(intepretation),因为对于对话者(施话者和受话者)而言,对话情境中的“烟”和“火”都不涉及理解和解释。一般而言,凡以说明项(其通常作为因果关系中的“原因”,或者作为逻辑推理中的“前提”)用来揭示被说明项(其通常作为因果关系中的“结果”,或者作为逻辑推理中的“结论”)的意指而不对被说明项和说明项中涉及的其他因素(比如原因事实或结果事实)做超出两者因果连接(或逻辑推导)上的意义建构(比如,对原因事实或结果事实进行与人类的生存论相关的意义阐释或价值判断),也不对语句中用于说明的概念(语词)进行语义学或语用学上的含义“翻译”(语言的互译转换),那就是纯粹的说明(用F2说明F1,用F3说明F2,用F4说明F3,如此等等);如果在此过程中涉及评价性意义建构或概念(语词)上的含义“翻译”[即,以其他概念(语词)传达语句中概念(语词)的含义],则属于理解和解释。

    这里重点谈一下作为认识世界之方式和方法的“理解”或“理解的体系”。在日常生活中,“理解”(understanding)是一个多义词,可以是针对“道理”“心情”“意图”“意思”“情感”“概念”“事实”“问题”等等不同对象的含义领会和意义把握。从主要方面讲,理解既可以指对已存在的话语或文本的含义领会,也可以指对已经发生的事态(行为或事件)之价值性意义的把握。相应地,在哲学上,我们可以把理解分为两类:一是对于文本或语句表达以及语句中概念(语词)的含义翻译(互译转换)、意思澄清[比如,“理解某人所说的话的含义”,这相当于对他人之“理解的理解”(das „ Verstehen des Verstehens“)],二是对事态(行为或事件)及其后果的评价性意义的把握或建构(比如,“理解某事的意义”)。我们可以把前者称为“文本诠释学(Hermeneutics)上的理解”,把后者称为“认识论上的理解”[即,通过评价性意义的理解来重新识别已被经验(被感知或观察)的事情,这个过程亦可被称为“评价性认知”]。“文本诠释学上的理解”重视文本的含义,把他人(比如,文本的作者)对于世界的理解所形成的文本(文本包含了作者对其所描述的事件、人物及其行为的理解及建立在这种理解基础上的意见、观点和看法,也包含了作者的意向性、目的和意图等等)作为理解的重心,旨在揭示文本的意思(或含义)以及文本中涉及的人物和事件在人类历史之中的可能价值意蕴(意义)。在这种理解中,文本构成了理解者(读者)之理解的“视域”展开、“意义期待”“(字句)含义翻译”的基础和框限,理解者在此种基础和框限之中寻求文本的含义,或者通过对文本信息的解读(文本信息的含义解构、含义重组、含义重构)而为文本附加超越其原本含义的含义。与此不同,“认识论上的理解”则是直接针对眼前的事情[包括其中的先在条件(事态)及其后果]本身的深度认识(即,通过理解而内在地照面和审视事情的问题境况和可能的解答方案),这种认识不满足于对所发生的事态的单纯证实[即,通过证据证明事态是如何发生的,从而确证事实(事态之实)],不满足于对事物存在的某种性质或关系的了解或者对于诸种事实(F1,F2,F3,……Fn)进行客观因果的说明,甚至也不满足于因果概念上的“知其然”(knowing that)和“知其所以然”(knowing how)。理解作为一种认识方式的根本点在于:认识(理解)者从“属人的世界”(与人类存在、价值和目的相关的世界)或“与人的利益相关”“与人的价值评价相关”[“价值关联”(Wertbeziehung)]的角度重新认识所面对的事情及其中的先在条件(事态)和后果,因而把人类的“集体意向性”和评价性意义赋予所认识(理解)的对象,把通过经验感知获取并以语句表达的认识对象— —确证的事态(事实)作进一步的深度的带有实践指向的精神省察,或者进行带有“价值关联”的识别判断。在这个过程中,如果我们不对通过经验感知获取并加以陈述的事实作任何“集体意向性”和评价性意义赋予,那么被陈述的事实不过是一些用于因果说明的原初事实(brute facts)。然而,我们一旦从实践层面将“集体意向性”和评价性意义赋予原初事实,那么它就会成为一种“与人类的存在有关”的事实[评价性事实、制度性事实、规范性事实(包括法律事实),等等]。这种意向性和评价性意义赋予就是对原初事实之意义的重新认识,即理解(在此,“集体意向性”和评价性意义赋予表达了理解的一种构成性特征)。例如,“A在自己农田里收获一袋土豆”这个语句所表述的是一个原初事实,而“A把在自己种植的农田里收获的一袋土豆作为自己的财产”之表述则附加了对A收获土豆这个事实的一种理解。按照德国哲学家马丁·海德格尔(Martin Heidegger)在《存在与时间》中的说法,理解总是“与世内存在者打交道(Umgang)”,即,在与世内存在者打交道之际总是有所环视(Umsicht),这是一种“实践的观看”,在这种“看”中,物呈现为用具(Zeug),它们总是作为书写用具、缝纫用具、交通工具、测量工具等出现,于是,物作为工具就具有了“为了……而存在”的本质特性:例如,锤子是“为了钉钉子而存在”的东西(工具)。在这种认识过程中,重要的不是事物“是什么”,而是它“作为什么”。如此认识的事物的存在方式不是孤立的,它们不是通过孤立的镜像式“观看”而是通过“使用”(Zuhandenheit)来体现其存在方式。在孤立的镜像式“观看”中,桌子当然“是”桌子,但在特定的(在与世内存在者打交道的)生存处境中,它也可以(被理解)“作为”椅子或床而存在。这样,明确得到理解的东西本身具有“某物作为某物”(Etwas als Etwas)这样一个环视上的呈现结构[简称为“作为—结构”(Als-Struktur)]。所以,与“说明”这种认识世界的方式(模式)注重揭示一个事件(原因)导致另一个事件(结果)的发生之因果关系(Causality)不同,理解这种认识世界的方式(模式)更重视从人之“上手”“使用”或者“实践”角度观察事物之间的因缘关系(Bewandtnis,事物之间在存在论意义上的“关联”或“关联性”),理解者不仅仅是将意义附加于(因缘关系之中的)事物,而是通过“作为”(als)结构来揭示(因缘关系之中的)事物的存在或存在方式。尽管海德格尔从人类存在之本体论(人类存在的根本方式)角度去看待理解上的“作为—结构”,但这个“作为—结构”在认识论和方法论上无疑亦具有广泛的理论价值。比如,美国哲学家约翰·塞尔(John Searle)用“集体意向性”(collective intentionality)和“功能赋予”(assignment of function),提出他所认为的“制度性事实”(institutuional facts)之“构成性规则”(constitutive rules):“X 在 C 中算作 Y。”根据这一规则,一个原初事实中具有纯粹物理特征的事物(X,比如上例中“土豆”)在由集体意向性进行的功能赋予情景(C,即社会共同体的集体接受和承认)中,就可以被理解为(“算作”)超出其物理特征之外的“另一事物”(Y,比如上例中“财产”,依照海德格尔的“作为—结构”表达,即:“土豆作为财产”)。

    “理解”当然也构成法学认识世界的基本方式。法学上的“理解”(认识法理)与其他人文科学(精神科学)共享“理解”之认识世界的方式和方法,比如,从“属人的世界”(与人类存在、价值和目的相关的世界)角度将人类的“集体意向性”和评价性意义赋予所认识(理解)的对象(事态及其后果),采取(海德格尔式的)“实践的观看”模式,将观察和描述之“物”作为“用具”(“为了……而存在”之“物”)对待,等等。法学上的“理解”(认识法理)也可以分为“法律文本之诠释学上的理解”(法律解释)和“认识论上的理解”:前者是对国家制定的法律规范之文本(法条)规定的含义所进行的语言的互译转换,后者是从“实践的观看”角度直接针对社会生活中发生的事态引起的事情(侵权、犯罪、合同纠纷等等)如何得到规范、正确处理的原因性的规定根据的认识,即在理解和把握行为人的行为动机、意图、意向等因素的基础上,在“理由的规范空间”中对其行动的理由进行深度的精神省察和识别判断,包括概念分析、举证辩护、条件评价、结论论证、意见论辩、信念证成等活动过程。

    与其他人文科学比较,法学上的“理解”亦有其特殊之处:(1)法学上的“理解”以法理作为认识对象,而这个对象总是与面对的事情联系在一起。理解的过程不简单停留于对事情之中的事态的经验观察和证实,而更重要的是对它们作为处理事情的条件意义和分量(重要性)的评估,在“规范”的认知框架内对它们与所要进行的事情处理之间的价值关联性以及其作为引发后果发生的前提来加以分析。也就是说,仅仅知道一个事态存在或事态发生的原因(建立在自然的、决定论的“作用因”或者行为人之自由的、目的性的“心理因”)还不足以构成理解。只有在把握了这些原因“如何”能够产生相关后果(引发后果发生)的道理(“理”)之后,才能够称得上是法学上的理解。它有时需要“悬置”(悬搁)其他学科(人类学、经济学、历史学、心理学等等)的观察和探究方式,而以法学(法教义学)特有的理解方式(“理论的眼镜”,这种“眼镜”是其他科学所无法取代的)直接本质地进入规范世界(“理”的世界,或应然规整领域),从中探寻、发现法律规范/法律规整的原因性规定根据(法理),将通过理解探寻、发现的法理从内嵌在事情之条件与后果归结之中的状态(自在的状态)转化为被知的、被言语或语句表达的状态,把本体论上的法理(自在的法理)转化成为认识论上“被陈述的法理”“被言说的法理”(命题中的法理承诺),此时,法理从单纯自在的“存在方”变成了与我们的认识、行为与处事(“属人的世界”)相关的“关系方”(relata),即,它作为语句中的命题内容(法理承诺)存在,被表达在立法机关的立法理由书、司法解释文件、法官的判决书、学者的著述(论文、著作、学术报告等)、法律格言或者民间谚语之中。(2)法理之认识具有实践指向性,为法律实践提供认识基础。故此,法学上的“理解”总是与法学的“实践干预”性质以及“问题—决定”特征相关,即,法学上的“理解”受制度化推动,针对法律实践中需要处理的事项或问题,不单单提供有关法律规定之诠释能力的信息,而常常带有“实践承诺”,即,提供有关法律决定的解答方案。(3)与上面一点相联系,法学上的“理解”习惯于“就事论事”,在事情限定的语境和框架内寻找理解的理路或根据的脉络。在这个脉络中,理解者把有待处理的事情作为理解(解释)的有边界的场域(视域),而不把它在漫无边际的普遍因果关系中予以溯源考察,既不会把作为某一法律后果归结条件的事实(事态)进行无限的因果关系推论(比如,某人与妻子吵架,遂产生泄愤心理杀人,妻子不因吵架而构成故意杀人的共犯),也不会把事情中作为条件的事实(事态)与法律后果之间进行不正当(无根据)的联结(比如,把合同违约当作侵权行为处理),更不会把面对的一切事情从一开始就当作人类认识上“无解”的难题放在“具有高度理论负载”的领域(比如,道德形而上学领域)进行无休止或无限倒退的理论争论,这种争论很可能最终无法找到问题解答的知识锚点。相反,法学上的“理解”总是要求理解者先基于事情限定的有边界的场域(视域)进行“目光的往返流转”(Hin-und Herwandern des Blickes),在需要处理的事情之各个因素间寻找原因性的规定根据,对何种因素具有法理上的相关性[或者,何种因素与何种后果相关,“哪些(复杂的、兼有道义性质的或评价性的)事实具有相关性”]作出判断,从而作出与面对的事情有关的“实践上正确”的法律决定,对于那些难以达成合意的深刻的“具有高度理论负载”的问题,可以暂时搁置理论争议或采取“不完全的理论化协议”(incompletely theorized agreements)予以化解。(4)这也意味着,法学将“实践上正确”作为分析和理解现实生活中的具体事情(个案中的事情)之行为、行为条件、法律后果等等关联性因素之意义的标准。法学上的“理解”之知识兴趣在于深度地了解所面对的事情对于人的意义和价值(价值关联性,或者:事情对于实现价值的意义),其核心本质在于把握作为认识对象的具体事情中的(行为人)行为、行为要求、行为后果之间的关系,真正了解有关事情之法律规定的道理,并将这个道理通过语言表达出来作为实践(指导行为或裁决判断)的理据。故此,理解的关系应被看作一种通过认识给出行为人如何正确(妥当地)行动(如何实践)的道理(理据)的关系,并把握所关涉之事情该如何正确(妥当地)处理之“理”(道理或理据)。在这个过程中,法学上的理解者会将“实践上正确”作为理解的标准:比如,理解者会考虑行为人所想要从事的行为的伦理重要性(行为的伦理特征、后果)或者实践重要性(当为的实践方式),强调行为人应当“有价值地行事”“伦理地行事”或者行为人的行为(行动)应当具有“当价性”(使行为具有其当为的价值性质)或“使善性”[“成善性质”(good-making properties),即从伦理的角度看,行为人的行为应当具有伦理善的根据,从而使行为人已从事的行为或意欲从事的行为成善,使其有价值或者实践上正确],以此衡量行为人将要从事的行为和已经从事的行为(事实行为)的价值和意义。(5)依照上面的理解,符合伦理或规范要求的行为是值得期许的、甚或可欲的,是法律规范予以“应当”“可以”的行为指令,或者是对已从事的事实行为加以确认、保护、许可或奖励的后果归结;而与伦理或规范要求相反的行为就是无价值的(负价值的),是法律规范予以“禁止”的行为指令,或者对行为人已从事的事实行为用“制裁”“不予保护”“撤销”“停止侵害”或要求承担“恢复原状”“补偿”等等法律后果加以归结。这意味着,法学上的理解并不完全等同于伦理学上的理解,它实际上要求法律规范给行为人之有价值的行为和无价值(负价值)的行为以特有的(本体论上的)规范性质:比如,“犯罪”“罪责”“责任”等等不是指行为人之行为的纯自然存在(实体)状态,而是由法律规范(或者法律判决)所“给予”行为人之具有不同程度负价值的行为一种规范的本体论属性,从而使之成为具有法律规范力的“评价性实体”(evaluative entity)。(6)法学上的理解是一种典型的“概念依赖”(Conceptual dependency)的认知模式。认识“法理”,必须先形成一套能够用以识别并解释法律规范世界之存在体的概念(法学概念),诸如“法律规范”“法律制度”“法律关系”“法律事件”“法律行为”“法律权利”“法律义务”“法律责任”等等,理解者借助这些概念对于“肉眼看不见的”客观精神实体(法理)来进行深度的认识和把握。法学若要成为一门真正的科学,就必须先有一套能够描述并解释法律规范世界之存在体的科学概念体系,这是因为法学概念是法学认识活动(理解或解释)的基础,它们塑造了法学的思考方式和认知方式:没有法学概念,就难以形成对“法理”以及其他法律现象的理性而精确的认识,当然就不可能形成具有理论化特征的法学知识。法律科学的一项重要使命就在于建构法学概念体系。(7)法学上的理解需要将“认识论上的理解”与“法律文本之诠释学上的理解”(法律解释)相结合(比如,某个具体的个案中发生事实行为或者事件F属不属于法条规定中的T?或者:“携带盐酸抢劫”中的“盐酸”算不算作法条规定的“武器”?对于这些问题的认识都离不开“法律文本之诠释学上的理解”),特别是,当法学上的理解的对象是法律(行动)实践领域— —法律裁决/案件中的“法律根据”(ratio legis in case)时,就会更加依赖“法律文本之诠释学上的理解”(法律解释),因为,此时的“法理”是一种有“案件关联性”(Fallbezogenheit)并“以裁决为中心”或以法律适用为中心的“法理”,一种有语境限定的或“妥当的情境相关性”(angemessener Situationsbezug)的“法理”,它连接着“事实的世界”(the factual world)与“规范的世界”(the normative world),连接着具体理解者和解释者的视角与有效的规范背后的普遍的视角结构(allgemeine Perspektivenstruktur)。这就需要理解者或解释者凭借“(法学)概念之观察镜子”透视形形色色的晦暗不明的“(案件)事实/语境的帷幔”,寻求符合(案件)事实性质的认知、分析评价标准尤其是进行逻辑推论的“可接受前提”(acceptable Premises)以及论证的“可靠性”标准,在规范与(案件)事实之间进行双向对流的解释(“目光的往返流转”),即,从(案件)事实来理解和解释法律规范,也从法律规范角度来理解和解释(案件)事实,寻求“法律—事实”这一关系维度的“法理”之统一、稳定的法律科学知识(法教义学知识),以弥补因事实与法律之间的不调和、不妥当而产生的“案件事实的具体性质与法律概念的抽象性质之间的巨大鸿沟”(a large gap)以及实践(行动、决策)理论上的“逻辑漏洞”,实现案件事实之描述与普遍规范之具体化(尤其是裁判规范中作为逻辑“前件”之要素的行为构成要件的描述,以寻求对案情相关的全部妥当的规范性理由)之间的意义等值(die Bedeutungsaquivalenz),满足规范适用于案件的“妥当性”(Angemessenheit)要求。

    基于上文的分析,我们可以看到:法学是一门以“问题—决定”为中心、以某个特定的在历史上形成的实在法秩序为基础、采取诠释(理解)—评价的论证方式来探求法律规整或法律规范规定的待处理事项(法律问题)之答案及其根据(法理)的(实践)规范性诠释(理解)科学。在此意义上,法学在科学的基本分类(学科结构)上是一门(实践)规范性诠释科学或“理解的”科学,广义上属于“精神科学”或“文化科学”(die Geistes- oder Kulturwissenschaften)的范畴。

    三、法学上的理解之“真”与法学知识的生成

    如上所述,知识总是与“真”这一概念联系在一起的,“事实真”构成了一切“是”之经验对象的知识标准。作为法理之认识方式的法学上的理解难以遵循“是”之意义上的逻辑法则,亦难以按照“事实真”的知识标准来确立法学的知识标准,那么,这是否意味着法学可以完全放弃将“真”作为本学科知识(法学知识)生成的理想?若放弃“真理”的目标,通过法学上的理解获取的认识之理(“被陈述的法理”“被言说的法理”)可否被称为“不真不假”之“理”,甚或干脆被宣称为“假理”?更为严重的问题是:如果不以“真”作为知识标准,那么法学上的理解作为认识法理(乃至整个法律规范世界)的方式和方法就根本无足轻重了,它甚至徒增法学认识论上的混乱,因为失去了理解上的“真”(简称“理解真”),法学者根本无法判定通过法学上的理解获得的知识(法学知识)之性质,而且在此情形下更无法判断何种法理认识属于法学上的“理解”,何种理解属于“真理解”或“假理解”,何种为“误解”“不理解”“无法理解”“无以理解”,何种为“正确理解”或“错误理解”,等等,以至于法学研究者完全沉陷在法学的“理解的漩涡”中不能自拔。

    法学上的理解必须面对并经受“事实真”知识标准的挑战,并确立法学认识论意义上的“真”以及建立在这种“真”之基础上的知识标准。在哲学上,“真”是相对于“实”的一个概念:“实”(reality)乃本体论概念上的事态之性质,“真”(名词truth, 形容词:真的/true)则属于认识论概念上的事实之性质,被陈述的事态(事态承诺)属“实”(符合事态之“实”)才是“真的”。所以,“事实真”有一个本体论意义上的“使真者”(truthmaker)预设,即,当且仅当语句承诺的事态实际发生,陈述的命题内容(事态承诺或事实)为真,这个发生的事态就是使陈述的命题内容(事态承诺或事实)为真的存在者,即“使真者”。例如:玛丽在t 时间说“我吃饭了”是真的,当且仅当玛丽先于t时间吃饭了,玛丽先于t时间吃饭了这个事态的发生就是她说“我吃饭了”这句话为真的“使真者”。按照事实奠基逻辑,事态之“实”对于事实之“真”具有奠基(grounding)意义:当“真”以“实”为存在依赖根据时, “实”与“真”之间就具有了奠基(依赖)关系,“实”乃“真”的奠基者。在此意义上,事态之“实”奠基了事实之“真”,它是事实之“真”被给定的质料基础、语义来源和存在的“被依赖者”。

    依照“使真者”理论,我们似乎可以在类比的意义上说,通过法学上的理解而陈述的命题内容— —法理承诺(“被陈述的法理”“被言说的法理”)若与客观存在的法理(法律规整或法律规范规定的待处理事项之行为条件与行为指令或行为构成要件与法律后果归结内嵌的原因性的规定根据)相一致,即,符合法理之“实”,那么语句陈述的法理承诺为“真”:法理之“实”奠基了法理承诺之“真”。照此逻辑,如果法理承诺之“真”得到证成,那么建立在法理承诺之“真”基础上以假言条件句[采取“若(如果)……则(那么)……”语句结构]表达的法律规范内容(行为规范内容和裁判规范内容)就具有了规范上的真(normative truth,简称“规范真”) 的性质。也就是说,我们可以把表达法律规范内容的语句看作是“条件内嵌根据(理)”的语句或者(如约瑟夫·拉兹所言)“有理由……”类型的陈述(“there is reason” type statements)或“给予理由的陈述”(reason-giving statements),而内嵌根据(理)的行为条件乃是实践上“当为”指令成真的条件,也是法学上的理解为真(理解真)的“有根性”基础。这样,当行为规范规定在何种行为条件下人们“可以做什么”,这个行为条件就是实践上“可为”成真的规范条件,也是“可为”在规范上的“使能条件”(enabling conditions),它在规范层面呈现“可为”的行动域,赋予“可为”的事情成真,或容许那些预先计划的事情进入“可为”行动的范围,并致使其按照“当然(逻辑)法则”发生。这意味着,在此等条件下“可以做什么”是在规范上真的[即“规范真”],那么,若把它理解成“不可以做什么”(禁止做什么)则不符合规范真,那实际上就是理解假。相应地,在勿为的使能条件下“不得做什么”是在规范上真的,那么,把此等条件下的行为指令理解成“必须做什么”就是在规范上假的。在裁判规范规定的场合,“行为构成要件”(T)也可以看作是使“法律后果”(OR)在规范上成真的条件,而且,“行为构成要件”(T)决定着“法律后果”(OR)的性质和类别,即,有什么样的“行为构成要件”,就有什么样的“法律后果”。这里还是以我国《刑法》第232条为例,这个条文分别规定了两种“行为构成要件”和两种“法律后果”,我们分别表示为T1(“故意杀人的”)和OR1(“处死刑、无期徒刑或者十年以上有期徒刑”)、 T2[“(故意杀人)情节较轻的”]和OR2(“处三年以上十年以下有期徒刑”),假如法学上的理解把“行为构成要件”T2看作是“法律后果”OR1的规范上成真条件而将两者加以联结,说“(故意杀人)情节较轻的,处死刑、无期徒刑或者十年以上有期徒刑”,那么这个通过理解表述的内容就是假的,反之,将T1作为OR2的规范上成真条件而把两者联结起来,这个理解也是假的。若通过理解将《刑法》第232条与第233条有关“过失致人死亡”规定的“行为构成要件”和 “法律后果”予以任意切换联结,则所表述的内容更不可能为真。在个案裁决中,也存在类似的理解问题:当案件事实[Fa(F1,F2,F3,……Fn),这个表达式意指:某个人a做出了F1,F2,F3等等事实行为]在特征上完全符合裁判规范规定的某个“行为构成要件”T,这个时候,案件的裁判者(同时也是法学上的理解者)基于法学上的理解和“司法三段论”把Fa(F1,F2,F3,……Fn)归为T,得出Ta(Fa∈ T=Ta)的事实认定并作出判决(Ta→OR),那么这个针对个案事实和法律后果所作的理解就是真(规范真)的。反之,案件事实Fa(F1,F2,F3,……Fn)明明符合裁判规范规定的某个“行为构成要件”T,案件的裁判者(理解者)却把它当作其他法条中的“行为构成要件”(比如,把符合“故意杀人”的案件事实当作“故意伤害”认定,或者把符合“合同违约”的案件事实当作“侵权”认定),那么,这样的法学上的理解(事实认定和后果归结)没有让案件事实Fa与符合T的法律后果(OR)发生联结,使真正的法律后果(OR)没有在规范上成真,这样,裁判者(理解者)可能因为判决内容之承诺错误(比如,判决不该承担责任的人承担责任或者让责任人承担了不适当的责任)而为假。

    如此看来,真正的难题在于如何通过理解来证成语句中的“法理承诺”为真,即,经由理解的“被陈述的法理”“被言说的法理”在何种意义上是“真的”? 或者凭什么说“被陈述的法理”“被言说的法理”就是客观存在的法理?其在何种程度上被认为“符合”客观存在的法理(法律规整或法律规范规定的待处理事项之行为条件与行为指令或行为构成要件与法律后果归结内嵌的原因性的规定根据)之“实”,属于法学上的“真”理?这个问题的确证直接影响法律规范内容(行为规范内容和裁判规范内容)之真(规范真)的证成:当某个行为条件(H)作为“使能条件”存在时,为什么行为人只能从事行为规范上所规定的某个行为(OT),而不是其他的行为或相反的行为(比如,在“可为”的条件下能否“应为”或“勿为”)?或者:当某个“行为构成要件”(T)作为“使能条件”存在时,为什么行为人所从事的行为只能归结为裁判规范上所规定的某个法律后果(OR),而不是其他的法律后果、甚或相反的法律后果?早在1847年夏季,时任柏林刑事法院首席检察官尤里乌斯·赫尔曼·冯·基尔希曼(Julius Hermann von Kirchmann)于其发表学术报告— —《法学作为科学的无价值性》中就曾指出:“法律不单纯是一种认识,它同时还是一种感受,它不仅存在于人们的头脑中,而且存在于人们的心目中。其他学科的研究对象是没有这种附加物的。几乎在法律的任何领域,科学的探讨开始之前,情感就已经选择了答案。”

    按照冯·基尔希曼的这个说法,通过理解“寻找法理”的过程必然伴随着理解者个人主观的价值判断、利益衡量和情感论证,且可能混合着个人思想中的“意识形态”“智慧”“品味”“主观好恶”等不可观察-控制的因素,它们缺乏相应可比较、可计算、可公度的“单一尺度的量化评判标准”:比如,在现实生活涉及的事情中,“平等”“自由”“财产”“生命”和“秩序”等价值之间有没有绝对可量化的等级优先顺序?它们之中哪一个高、哪一个低?人们基于各自认同的主观价值标准来评判现实生活中的具体事情之作为条件的事实(事态)的重要性及后果的价值关联性,或者用来理解法律规则或法律规范规定的待处理事项之行为条件与行为指令或行为构成要件与法律后果归结之间的关连性,从而对于同一件事情得出完全对极的(相反的)的理解结论。比如,在不法侵害人采用暴力手段杀人、最终因防卫人的防卫行为导致不法侵害人死亡的案件中,有人看重“不法侵害人采用暴力手段杀人引起防卫人防卫”这个作为条件的事实(事态),有人会认为“死者为大”而更看重“导致不法侵害人死亡”这个作为条件的事实(事态),他们基于各自的评价立场对案件的定性以及判决结果会存在严重的意见分歧。这表明,尽管我们说本体论意义上的法理是客观存在的,内嵌在法律规整或法律规范规定的待处理事项之行为条件与行为指令或行为构成要件与法律后果归结之中,但要把它用语言呈现(陈述)出来,却高度依赖我们人类的理解以及理解的理论、概念和方法。据此,人们往往会否认法理的客观性,而将它视作通过人的理解的纯粹主观建构的产物(其理由是:“不经建构,法理不存在”),这自然会使法理认识(法学上的理解)过程遭遇“视角主义”和“相对主义”的困扰:“视角主义”会认为,理解没有标准,怎么理解都行,或者愿意(想)怎么理解就怎么理解,关键是理解者站在哪种角度(视角)理解,角度(视角)不同则理解不同;“相对主义”会主张,理解无所谓真假,“对我而言真但对你而言不真”,或者“在我的文化中是真的而在你的文化中不是真的”,或者“彼时真,此时不真”。在某个具体场合,尤其是在那些疑难案件中,理解者各自采取“视角主义”和“相对主义”,他们的立场看起来“势均力敌、难分高下”,那么双方的理解必然陷入“公说公有理,婆说婆有理”的僵局。

    为了摆脱上述困扰,我们不应将法学上的理解看作是理解者个人随意地、不经慎思地动用自我的“前见”“价值观”“品味”“偏好”“情感”以及“个人语言”(私人语言)去认识法理的主观心灵体验与感受过程。法学上的理解是“迈向科学的理解”或者“向着法律科学的要求方向的理解”,至少是朝向法理之认识“客观化方向”的理解,即,通过法学上的理解,客观的法理在认识论上得以(语言)呈现,被理解并被语言陈述的法理属于认识论上“真的”法理(法律科学的真理)。如此,法学上的理解就预设了理解者的“法理之认识参与者”角色及其理解的法则和方法,这意味着,理解者对于法理的认识绝非一个纯自我的单向法理观察、单向的语言“独白”或自言自语过程,通过理解获取的法理认识之意义也并非仅存在于理解者单个主体的心灵内部,而是在理解者与理解者之间的互动、沟通和共享中产生和维持的。由此,法学上的理解也在理解者之间预设了一种共同的语言(a common language)、概念(词语)、思考—论述逻辑、方法和规则等等,它本质上属于利用客观精神世界(或卡尔·波普尔所说的“世界3”)中的“客体”、工具和“构件”的认识活动,也是运用逻辑进行思考、在问题与答案之间建立起逻辑关系的精神省察过程。所以,法学上的理解者无论一开始是以怎样的身份、姿态和态度进入理解过程的,都必须将自己的理解不断进行方向上的调整,走“经由法律科学,通向法律科学真理”的道路。

    实现“法律科学真理”的理想并非一蹴而就的。我们也必须承认,法学上的理解对于客观存在的法理之认识在“真”这一点上并非处处都可以达到“全真”“百分之百的真”“绝对真”(绝对毋庸置疑的真)的高度,任何一个法学上的理解者都不可以把不经省察的自我对于客观存在的法理之认识结论径直地宣称为“绝对真理”。其实,法学上的理解之“真”在深度和全面性上存在不同的程度,我们把这个称为“理解程度”(“理解度”)上的“真”,这种“真”不一定是“全真”,而是“逼真”(verisimilitude)或者“适真”(being truth-apt),即,通过法学上的“最佳理解”(按照“理解度”,可以把理解区分为“不佳的理解”“较佳的理解”“最佳的理解”等等,法学上的“最佳的理解”是指在确信度和融贯性上能够满足最大化程度要求的理解),使“被陈述的法理”“被言说的法理”(语句中的法理承诺)之“真”在法律科学上不断接近或最大程度地符合客观存在的法理之“实”。进而言之,“逼真”的法理承诺最大程度地切近现实生活中的具体事情和法律规整或法律规范规定的待处理事情之问题境况,并为此种问题境况之相关法律决定的科学解答方案提供切实可行的证成根据。无疑,相对于其他同类的理论陈述,“逼真的”或“适真的”法理承诺在理论陈述上更能够推进对于客观存在的法理之认识,在理论的丰富性、逻辑性、简洁性、明晰性、可靠性和说服力上优越于其他同类的理论陈述。

    即便如此,“逼真的”或“适真的”法理承诺要想在法学知识共同体内部得到普遍承认、接受和认同,还必须经历并经得起法律科学之认识论和方法论的严格审查、检验和评判,在法学知识共同体内部形成“共同的科学确信” 和“共同的法确信”(die gemeinsame Rechtsüberzeugung),即,客观的法理本身在法学家群体(法学知识共同体)内部相互交往过程中被(主体间)共同经验、彼此确信为“真”,这种被共同经验、彼此确信的“真”是“个人和集团的可能的、以行为为导向的自我理解以及其他个人和集团的相互的他理解”意义(认识)上的 “真”。这个时候,“逼真的”或“适真的”法理承诺乃是法学知识共同体内部“视其为真”(Das Fürwahrhalten)并在法律科学上加以确立的道理,一种建立在主体间统一理解、形成共识并彼此确信理解正确的真理。不言而喻,这种特定的“主体间确信的真理”的形成需要经历一个特殊的复杂的科学化作业,这个过程伴随着从“意见”不断向“知识”或“真理”的梯度上升。

    有鉴于此,从科学的角度看,任何个人(哪怕那些享有盛名的法学家)通过理解这样一种“价值负载的认知阐释”或“评价性认知”对规范和事实之关系所进行的“识别”“描述”“分析”“诠释”,以及对于待决的法律事项(法律问题)进行的判断和提出的“主张”,只应暂且被看作体现其个人理解和主观确信的法学“意见”,而不能当然地被视为法学知识共同体共享的知识或法学“真理”,它们不能自始要求知识上的“客观”有效性,因为法学知识体系绝非所有个人的主观性意见不加区分、杂乱无章的堆积体或未经任何论辩程序和知识确认程序甄别的“意见库”,它们绝不是单个孤立的主体沉思和独白式的言说之简单汇集。所有的法学“意见”必须经历一个“法学知识确证(确认)程序”,即,透过人们相互之间理性交往以及“主体间”的对话/商谈(论辩),那些包含有“真知”或“真理”成分(“真知的片段”)的个人意见(当然也包括法学家以外的其他个人提出的意见、见解)才有可能逐渐显露出来,并可能作为在论辩中“取得优胜的意见”(有说服力的意见)在法理信念上得到巩固,被言说(提出主张)者与受众(或论辩参与方)共同接受和共同体验,然后又逐渐成为(法学)“博士们的共同意见”(communis opinio doctorum)或“通说”,进而用作观察、分析、评价和处理法律事项(法律问题)的知识(法学“真理”)基础。可以说,没有辩证(对话)推理,没有理性证成,法理之“真”面貌(实相)则难以被发现,可靠的法学知识亦难以得到确立,其很可能沦为一套“无根基的知识”。

    古往今来的法学都非常重视法学家群体(法学知识共同体)内部所确认[如何正确(妥当地)处理法律事项/法律问题]的“共同意见”(“通说”)。 在历史上,有时候法学家也像神学家信奉宗教的教义一样信守其群体认可的“权威性意见”(法学家和神学家所需要论证的问题有可比较性:比如,他们都可能面对个人信念上的争执),甚至把它们奉为法学上的“教义”(Dogma),作为处理那些(在价值与利益判断上极端对立的)疑难法律事项[比如,在租赁关系存续期间,若租赁物的所有权因为买卖、赠与、抵押等发生变动,应优先保护承租人的权益,坚持原租赁合同的效力不受影响,还是坚持“谁的财产谁做主”的观念,认为新的所有权人(买受人)有权以所有权变动为由否认租赁关系的存在,要求承租人搬离?]之(最终依据的)权威性意见。自然,如此进行专业内部作业的法学也逐渐获取了另外一个特别的称谓,即“法教义学”(德文Rechtsdogmatik,英文legal dogmatics)。但我们切不要把“法教义学”这个词看作某一民族法律文化(比如,德国法律文化)中的特定用语,它其实是一切(民族)着眼于处理法律事项(法律问题)、采取诠释(理解)—评价方式来“寻找法理” 的“法学”之代名词。这种法学有时也被称为“严格意义的法学”“狭义的法学”“单数的法学”或“原本的法学”。它基于不同的法律领域而存在,没有任何一个可以涵盖所有不同法律领域的所谓(法哲学/法理论层次上)抽象的法教义学体系。法教义学都是区分领域的,在此意义上,人们往往特别具体地使用此概念:比如说,民法(私法)教义学,行政法教义学,刑法教义学,或者,宪法教义学,等等。“法教义学”不过是上述这些采取诠释(理解)—评价方式“寻找法理”、探求法律问题之答案的各个特定学科的统称。

    德国历史法学派的代表人物弗里德里希·卡尔·冯·萨维尼(Friedrich Carl von Savigny)指出:一个国家的法律的健康成长离不开“有机进展的”法律科学的呵护,后者作为“技术要素”成就了一国法律之独特的科学生命。法教义学若要担当这样一种使命,其科学化作业必须具备一些学科规准和条件,由此才能形成法学“认知的统一建筑学”。总之,为了对现实而急迫的法律(实践)问题提供有效的、统一科学的答案,为了获得对法律生活世界的稳定的理解,法学家们不得不按照教义学的规则和方式来构建法学,形成法学的规则和范式。所有致力于将法学建构成为科学体系的法学者都应当有这样的认识,并通过自身的学术努力和贡献逐步实现法学的科学化、实现“法律科学真理”的理想。

    四、结语

    由于篇幅的限制,本文在法学的学科性质和法学的科学性问题的讨论上是浅尝辄止的。笔者注意到我国法学界目前对于何为“法理”这一概念本身的认识存在巨大的争议,相应地,学者们对于“何为法学”“法学为何”等问题的见解亦五花八门。而更堪忧的是,法学到底应称为“法教义学”、还是“法释义学”也逐渐演变为一种无谓的意气之争。本文将法学作为一门(实践)规范性诠释科学或“理解的”科学,以认识法理作为出发点,重点探讨了认识法理所需要的“理解”认识方式(“法学上的理解”),区分“事态”与“事情”、“理解”与“说明”、“文本诠释学上的理解”与“认识论上的理解”、规范上的“真”(规范真)与理解上的“真”(理解真)“逼真”“适真”与“视其为真”、“意见”与“知识”等几组概念及其关系,试图揭示法律科学与其他科学(特别是自然科学)之间在科学认识和科学方法上的差异,在此基础上寻找实现“法律科学真理”的道路。笔者深知,本文的讨论只是初步展现了法学作为一门古老且博大精深学问之“冰山一角”的问题境况,其中的论述也不免带有作者视域的局限和思考力的不足,期待法学学者们对于相关话题有更为深入的探讨。

    转自《现代法学》2025年第6期

  • 戴鑫:纸草档案与托勒密埃及的社会经济史研究

    纸草学诞生于19世纪末20世纪初的欧洲,是一门主要研究希腊罗马时代埃及(约公元前4世纪至公元7世纪中叶)纸草及纸草文本的学科。19世纪80年代,埃及考古学之父弗林德斯·皮特里在埃及法雍地区的考古活动,以及英国牛津大学古典系伯纳德·格伦菲尔和阿瑟·洪特在奥克西林库斯的发掘,使得包含希腊罗马时代埃及行政文本在内的大量纸草在千年之后重见天日。埃及源源不断的出土文献令欧洲学术界大为震撼,德国的罗马史家特奥多尔·蒙森曾预言“20世纪将是纸草学的世纪”。他的学生乌尔里希·威尔肯投身纸草研究,于1900年创建第一个纸草学期刊《纸草档案研究》,成为纸草学诞生的标志之一。

    纸草学家将同一个人、家庭、社区保存的一系列纸草整理为档案,便于开展史学研究。纸草档案兼指官方文书和私人书信,因保存者来自社会各阶层,可能将官方通信、行政文书和私人家书混杂存放。芝诺档案是现存托勒密埃及时期(公元前305至公元前30年)数量最大的档案(总计2063份纸草文本,其中1800余件为希腊语文本),所有者为考诺斯的芝诺,他曾担任托勒密二世时期财政大臣阿波罗尼奥斯的秘书,还受命为后者管理地产,负责组织灌溉近2750公顷土地。芝诺收藏了工作与生活相关的各种官方文件和私人通信,时间跨度为公元前263年至公元前229年,在近代学者重现和探讨托勒密埃及经济制度中扮演至关重要的角色。1911年,芝诺档案中的部分文本首次出现在伦敦和斯特拉斯堡。1914年冬,大量芝诺档案文本分批次流入古物市场,先后为埃及开罗博物馆、大英博物馆以及其他欧美博物馆、科研机构或私人等收藏。

    20世纪20年代,俄裔美国纸草学家迈克尔·罗斯托夫采夫利用新整理的部分芝诺档案撰写《公元前3世纪的埃及大地产》,是为托勒密埃及社会经济史研究的发端。早期研究即以希腊语纸草档案为核心史料,重点关注托勒密家族的王室经济。1939年,比利时纸草学家克莱尔·普雷欧出版专著《拉吉德王室经济》,详尽而细致地描述了托勒密王室对经济的高度控制或“垄断”。不久,罗斯托夫采夫在《希腊化世界社会经济史》(1941年)中,进一步强调埃及的“国家垄断”和“计划经济”色彩。他指出托勒密二世实施经济和社会改革,从而在埃及确立了希腊化经济体系。某种意义上来说,罗斯托夫采夫和普雷欧依靠纸草档案,共同奠定了欧美学术界关于托勒密埃及社会经济史研究的基础。

    20世纪70年代以来,纸草学家们将工作重心转向早期研究中忽视的地方经济。除了希腊语纸草档案之外,他们还着手收集、整理不同时期个别村庄或地产的相关埃及语纸草文本,按专题重新分类汇编。门西斯档案在格伦菲尔和洪特发掘的纸草文献中最为著名,保存者为公元前2世纪法雍地区科尔克奥西里斯的书吏门西斯,他详细记录了当地农业经济和行政管理情况。由于这些纸草文书出土时混杂在鳄鱼木乃伊中,门西斯档案的重建工作颇为不易。1971年,英国剑桥大学的多萝茜·克劳福德利用该档案重点分析科尔克奥西里斯的行政、土地、人口和农业状况,揭示古埃及政府试图对该地区的人口、税收、土地和农业生产进行精准测算、记录和管控,建立了一套复杂而严密的土地登记系统。

    随着纸草档案编辑重心的偏移与研究视野的拓宽,埃及社会经济史的研究被赋予新的生命力。学者们的关注点不再仅限于地方行政与经济层面,还广泛涉及个体社会生活的方方面面。比利时纸草学家威利·克拉瑞斯搜索和整理一些分散于世界各地的皮特里纸草(由英国考古学家皮特里发掘于法雍附近的古罗布,也称为古罗布纸草),出版了其中53份遗嘱类文本,展现了托勒密埃及法雍地区封地军人的家庭关系、身份、财产以及当地的农业和地产信息。美国纸草学家纳夫塔利·路易斯以特定群体为研究对象,整理汇编了兼具官方与私人性质的个人文本,以个案研究的形式再现不同职业和社会身份的希腊移民在埃及的社会生活。1998年,荷兰纸草学家阿瑟·维胡格特也以门西斯档案为研究对象,描述了更为微观的社会生活场景,关注门西斯本人的社会身份认同、工作、生活,通过信件的格式规范推测门西斯和通信人的等级关系。

    纸草学数据库建设则引领了计量分析和利用计算机进行研究的潮流,也加快了跨学科进行社会经济史专题研究的进程,增加了对人口统计、社会结构、城市化、社会关系等领域的关注。耶鲁大学和密歇根大学最先开始对收藏的纸草进行电子编目。杜克大学于1982年开始建立杜克纸草文本数据库,收录已经出版的纸草文本。20世纪90年代中期开始,欧美一些高校和科研机构开始大规模扫描纸草文本,通过互联网建立起世界范围的纸草档案库,纸草文献得以通过数字化信息的形式在网络上被查阅和检索。比利时鲁汶大学的纸草学家重视结合数据分析,探究希腊罗马时代埃及个人与社会的关系。截至2019年,鲁汶的特里斯迈吉斯托斯数据库(Trismegistos,缩写为TM)已收录680123份纸草数据,其中370086份文本记录了496702个人的信息。

    进入新世纪,托勒密埃及的社会经济史研究迎来一个新的高峰。2006年,克拉瑞斯和剑桥大学纸草学家多萝茜·汤普森历时十五年的合作,共同出版了《计算希腊化埃及的人口》。该书重点收集、编辑了从法雍至中部埃及吕克波利斯州(诺姆)一百年间(公元前250年至公元前150年)的税收类纸草文本,按照区域和税收类型划分为54组,对上述地区的人口、家庭、婚姻、职业、族群以及财产等情况进行量化分析,展现出王朝中期社会经济发展的动态图景。基于这一研究成果,鲁汶大学研究员卡嘉·穆勒尝试用社会网络分析以及地理学理论研究托勒密埃及国内外新定居点的分布情况,认为它们构成了支撑国家权力的网络,对托勒密埃及国家经济稳定发挥了重要作用。鲁汶数据库TM也于2012年建立网络分析系统,极大地推动了托勒密埃及人物志研究,可以用于分析个人、家庭、地点、人名甚至埃及语书信的关联。目前,帕许里斯档案、法雍档案、上埃及档案等多个项目仍持续进行。

    欧美学术界关于托勒密埃及的社会经济史研究在很大程度上依托于纸草文本的收集整理、档案编辑方式、技术方法的革新等,伴随着纸草学研究的开拓而延展。数量庞大且不断新增的纸草文书使这一研究领域具有独特的优势。鲁汶大学TM收录公元前6世纪至公元7世纪的档案超过500份,共计近2万件文本。据美国纸草学家范·明宁估算,到2030年时,出版的纸草文本将不少于10万件。尽管纸草文献的编辑、整理工作漫长而艰苦,但纸草学经过一百余年的沉淀、累积和更新,逐渐克服技术困难(如文献残损、勘误、确定年代和地点等)和文献内容庞杂且零碎等缺陷,档案的整理也已取得长足进展。在跨学科合作和计算机网络技术的助推下,无论是综合研究还是微观考察,都将进一步完善研究者们对托勒密埃及的社会经济和文化图景的绘制。

    本文转自《光明日报》( 2025年02月24日 14版)

  • 何芊:游戏还是工具——生成式人工智能与历史模拟

    “历史模拟”并不是一个新奇的概念。在教学中鼓励学生依照历史记录,重演历史角色或主要行为体的决策与行动,培养共情与同理心,体会历史中的能动性与复杂性,已是较为常见的模拟设计。不少以历史为素材的游戏同样作为历史模拟被引入课堂。历史游戏学者亚当·查普曼区分了两类历史游戏的模拟方式。其一是以《刺客信条》和《荒野大镖客》为代表的现实主义模拟。它们以精良的视觉效果还原了历史事件的节选片段与历史场景的局部空间,通过细节的仿真与过往的重现为玩家营造身临其境的参与式体验。其二是以《文明》系列为代表的概念化模拟。这种策略类游戏通过将历史对象、概念、进程以及历史观念写入游戏规则来模拟历史,比如《文明》系列的设计逻辑就出自保罗·肯尼迪的《大国的兴衰》。这种模拟允许玩家在规则之内自由发挥,组合出架空的历史,演绎开放式的走向。

    无论是让学生扮演历史中的行为体,还是在游戏中“亲历”虚拟的历史场景,抑或是通过玩法与规则理解历史阐释的逻辑,教学中的模拟设计都无可避免地存在着简化和泛化历史的倾向。虽然游戏化的历史与历史本身之间的关系存有较大争议,但这并未妨碍游戏化的历史模拟进入到课程教学之中。游戏与模拟的边界模糊,或者说是历史模拟的游戏化,默认了事实与假设、历史与仿历史之间不可逾越的鸿沟,这恰恰是历史课堂中接纳模拟的前提。

    将模拟视为研究工具的历史学家更多集中在计量史学及其他交叉领域,这些研究方向往往拥有丰厚的理论与数据资源。20世纪60年代,伴随着计量史学的诞生,模拟方法进入到史学研究当中。第一代计量史家罗伯特·福格尔和约翰·迈耶等人奠定了反事实推演的基础方法。这一时期模拟与历史的结合还有两种形式:一是利用文献记录为模型设计变量、提供参数设定的佐证。二是通过模拟结果与真实历史的比对来验证模型。从20世纪90年代开始,新一代计量史家进一步将反事实推演与蒙特卡罗模拟相结合,通过模拟实验,发现关键的因果关系,检验既有研究结论。历史模拟在计量史学中自证了其工具价值。历史事件没有简单重复,史学研究只能从已知过去的观察中抽丝剥茧、考镜源流,研究成果往往自成一说,高下难辨。如果真能对历史学的研究对象,比如经济发展的变化趋势、重大事件的爆发过程以及复杂系统的演化发展进行多次模拟观测,应当能帮助我们更客观地理解前人结论,更精准地揭示人类历史中复杂交错的因果关系。

    即便集成了大量历史信息,结合了既有理论与统计学方法,传统模拟依然只能构造对现实世界的简化近似。传统模拟依赖于计算机随机过程的重复实现,以此生成特定条件下针对同一对象的多种可能结果。传统模拟的特点表现为系统内的信息交互以抽象数字为表征,模型的诸多参数由研究者结合前人成果自行决定。简言之,以数理逻辑为运行基础的模拟系统仍比较简单。而牵引历史变化发展的,不仅有数据指标所揭示的机械规律,还有弥散分布的大量非理性因素。历史情境内人的情感、好恶、偏见、道德、迷信,以及这些因素以语言为载体在群体与个体之间反复的交糅共振,都在左右着人的行动与选择。非理性因素错综晦暗,难以融入相对简化的数学模型。

    生成式人工智能为传统模拟的不足带来了新的改进工具。首先,大模型具有繁复的计算结构,庞大的参数规模与海量的训练语料,足以支撑更复杂的仿真模拟设计。其次,大模型的行为选择由预训练和微调所决定,相较于原本由研究人员对参数赋值并结合随机过程而产生的模拟结果,更贴合现实。再次,大模型的模拟系统内部,信息交流可以用自然语言代替数字表征,与人类社会的语言交互模式更为接近。此外,大模型还通过对齐技术进一步向人类价值取向靠近。大模型在完成预训练之后,通过基于人类反馈的强化学习,实现与人类偏好、道德准则和价值观念的对齐。如果说传统模拟尚且是简化后的仿真,那么当下大模型对人类的模仿已几近“乱真”。比如由大模型合成的模拟受访者复现了人类被试在行为经济学和社会心理学等领域的部分经典实验结果。大模型的类人化智能在交互环境中也得到了印证。以外交谈判为核心的策略类语言桌游《外交》,讲求多人博弈之中的意图识别、谎言洞察、信任获取以及协商合作等综合能力,经过特别训练的大模型已能在网络对战中达到优秀的人类玩家水平。

    不仅如此,大模型还可以驱动多智能体的仿真模拟系统(Multi-Agent Modeling, MAS),这也是近来历史模拟所采用的方法。智能体仿真模拟原本是社会学家用来探索个体与系统、微观与宏观之间互动关联的路径:通过创建多个自主智能代理,在计算机的模拟环境中观察智能体之间、智能体与环境之间基于给定规则的相互作用,从而解释微观个体行动如何导致复杂系统演变的“涌现”现象。大模型的能力跃升,对人类智能的趋近,同人类价值观念的对齐,都进一步提升了智能体模拟对人类社会的仿真度。在此基础上,原本因化约而备受批评的历史模拟也展现出新的可能性。新一代的历史模拟将重大事件的主要参与方构建为多个智能体,利用真实的历史情境设定智能体的参数,制定智能体之间的行动规则,并通过大模型的运行环境来模拟多智能体之间的交互过程,从而分析历史事件爆发的因果机制。

    新的历史模拟在外交史和战争史领域已有初步展现。罗格斯大学与密歇根大学的联合团队以一战前夕的英、法、德、奥匈、塞、俄、美、奥斯曼等国为原型创建了多智能体系统,其中,代表各国的多智能体在结盟、备战与宣战的行为中较为准确地复现了历史中的国际关系。类似的方法还被用来模拟第一次英法百年战争期间的重要战役,以证明由智能体所演绎的将军与军士可还原战役的主要结果。从这些尝试看,历史模拟与侧重理论探索的试验性模拟不同:其一,模拟系统的有效性需比对真实历史来验证;其二,模拟对象应当采取匿名化处理,以避免大模型调用历史知识,干扰模拟系统。不过,所谓复现历史,标准尚无定论,仍由研究者自行设定。比如在战役模拟中,研究人员利用英法最终伤亡率的高低比值,与史载对照,以此判断仿真是否成功。史实与模拟之间的拟合误差,也缺乏公认的基准。在一战模拟中,国家间结盟、宣战与备战的复现,最高准确度分别为77.78%、54.6%以及92.09%。这些数值能否证明模拟成功,可能还需更多讨论。

    当然,依托于大模型的历史模拟仍然存在不少局限。首先,模拟依旧是对历史情境的抽象和简化。智能体的行动范围局限于研究者指定的有限选项,而选项设计往往紧扣论题,容易出现简化后的偏移。比如围绕战争爆发设计模拟,国家智能体的行动选项中,导向冲突的选项更多,而和平类行为不足,若是设计逻辑缺乏其他依据,那么由模拟结果得出战争不可避免的推论难以令人信服。其次,语言对模拟结果的诱导作用无法被排除。模拟的主要环节,包括智能体的参数设定,智能体之间的互动方式,以及触发行动的事件本身,都要通过自然语言的描述来实现。模拟中的智能体行为究竟是复现了决策,还是停留在语言关系推断,实难分辨。再次,通用大模型的预训练语料主要来自移动互联网时代,本就存在“近因偏见”,如果不在微调环节令模型接受历史语义训练,模拟可能难向近代以前延展。除此之外,大模型的幻觉文本、价值偏见,以及模型不定期更新导致的实验结果无法重复,这些固有疑难同样也在挑战着历史模拟作为研究方法的可靠性。

    尽管有种种不足,但新一代的历史模拟依然具有不容忽视的发展潜力。作为一种研究工具,大模型驱动的历史模拟需要更多的检视与讨论。有一部分问题可以改进:比如通过消融实验,或结合史学研究成果,能衡量或优化模拟系统中的组件设计;采用开源模型,进行本地部署,并介入微调环节,能提升大模型生成内容的稳定性,也能令模拟更贴合历史语境。即便新的模拟方法仍远不足以还原复杂历史情境,但简化的历史模拟设计已足够在教学场景中迭代传统的课堂模拟。大模型不仅可以实现原本由学生扮演的模拟,还能翻转学生的参与方式,让他们从角色扮演者变成模拟设计者。学生利用提示词,描述具体场景,拟定大模型的“人设”,并同其他同学驱动的大模型角色展开对话,完成一场基于历史的语言游戏,这无疑能激发学生主动求知的热情。总之,无论作为游戏还是工具,生成式人工智能都带来了全新的增量。

    本文转自《光明日报》( 2025年02月10日)

  • 薛其坤:探究微观量子世界

    本文系讲演稿整理而得

    欧姆定律是接近200年前,由德国物理学家欧姆提出的一个非常经典的电学规律,它说的是通过一个导体,导体的电阻与加在导体两端的电压差成正比,与流过这个导体的电流成反比。大家都非常熟悉。换一句话来说,流过这个导体的电流正比于加在这个导体两端的电压,反比于这个材料的电阻。这个材料的电阻越大,它越绝缘;在额定的电压下,它的电流就越小。

    欧姆定律讲的是沿着电流流动方向关于电压、电阻、电流基本关系的科学规律。我们很好奇,自然就想问“在垂直于电流流动的方向上,是不是也会有类似欧姆定律关于电流、电压、电阻关系的东西呢?”答案:“是!”

    这就是欧姆定律提出50多年以后,在1879年由美国物理学家埃德温霍尔发现的霍尔效应。霍尔效应实验是一个非常精妙的实验,他把这个导线变成了这样一个平板,当时用的材料是金。在垂直于这个金的平板方向上,再加一个磁场,当然沿着电流流动的方向仍然有欧姆定律的存在。但是由于这个磁场下,流动的电子受到洛伦兹力的作用,它会在垂直于电流的方向也发生偏转。

    在这样一个磁场下,电流除了欧姆定律方向的电流在流动以外,电子还在横向发生偏转,形成电荷的积累,形成电压。这个电压就叫霍尔电压,这个现象就是霍尔效应。加一个磁场就可以产生霍尔效应,那么我们自然想问,是不是不需要磁场也能实现这样一个非常伟大的霍尔效应呢?答案也是“是”!

    他发现霍尔效应一年以后,就做了这样一个试验,把材料金换成铁,靠铁本身的磁性产生的磁场,也发现了类似的霍尔效应。因为科学机理完全不一样,命名为反常霍尔效应。

    不管怎么样,霍尔效应、反常霍尔效应是非常经典的电磁现象之一。为什么呢?它用一个非常简单的科学实验、科学装置就把电和磁这两个非常不一样的现象在一个装置上完成了。

    当然了,霍尔效应非常有用。今天我给大家列举了一些大家非常熟悉的例子。比如测量电流的电流钳,我们读取信用卡的磁卡阅读器,汽车的速度计,这都是霍尔效应的应用。它已经遍布在我们生活的每一个方面,是一个极其伟大的科学发现,同时对我们社会技术进步带来了极大的便利。

    这不是这个故事的结束。100年以后,德国物理学家冯·克利青把研究的材料从金属变成半导体硅,结果他就发现了量子霍尔效应,或者说霍尔效应的量子版本。他用了一个具体材料,就是我们熟知的每一个计算机、每一个芯片都有的场效应晶体管。这个场效应晶体管中有硅和二氧化硅的分界面,在这个界面上有二维电子气。就是在这样一个体系中,在半导体材料中,他发现了量子霍尔效应。

    在强磁场下,冯·克利青先生发现了霍尔电阻,右边这个公式,=h/ne2,h是以普朗克科学家命名的一个常数,是一个自然界的物理学常数。n是自然数——1、2、3、4、5。e就是一个电子带的电量,这是一个非常伟大的发现。为什么呢?我一说就明白,因为测到的霍尔电阻和研究的材料没有任何的关系。硅,可能任何材料都会有这个,它只和物理学常数,和自然界的一些基本性能相关,和具体材料没有任何关系。因此它就打开了我们认识微观世界、认识自然界的大门。

    同时,量子霍尔效应给我们材料中运动的电子建造了一个高速公路,就像左边大家看到的动画一样,电子的高速公路上,它的欧姆电阻,平行于电流方向的电阻变成0,像超导一样。因此,用量子霍尔效应这样的材料做一个器件的话,它的能耗会非常低。

    大家今天看到的是两条道的情况,是n=2。如果n=3,这个高速公路的一边就有3条道;如果n=4,电子的高速公路就变成4条道,所以这样一种理解就把自然数n,1、2、3、4、5、6、7、8和微观世界的电子高速公路密切结合起来。大家可以看到,我们对自然界的理解,对量子世界的理解又大大前进了一步。

    冯·克利青在1980年发现量子霍尔效应以后,由于这个巨大的科学发现,五年以后他被授予诺贝尔物理学奖。

    硅有量子霍尔效应,是不是其他半导体材料也会有量子霍尔效应呢?有三位物理学家在第二年,1982年就把研究的材料从硅变成了可以发光的砷化镓,结果,他们发现了分数化的,不是一二三四了,三分之一、五分之一,分数化的量子霍尔效应,1998年这三位物理学家获得诺贝尔物理学奖。

    在我们这个世纪,大家都知道石墨烯,有两位物理学家利用石墨烯这个量子材料继续做一百年前的霍尔效应实验,结果发现了半整数的量子霍尔效应。随着量子霍尔效应的不断发现,我们对自然界,对材料,对量子材料,对未来材料的理解在电子层次上、在量子层次上逐渐加深,所以推动了科学,特别是物理学的巨大进步。

    量子霍尔效应有很多应用,今天我讲一个大家比较熟悉的应用,那就是重量的测量。我们每天都希望测测体重,重量的测量无处不存在。1889年国际度量衡大会定义了公斤千克的标准,是9:1的铂铱合金做成的圆柱体,以后的一百多年,全世界都用这个做为标准称重量。

    但是在118年以后的2007年,我们发现这个标准变化了:减轻了50微克。一个标准减少50微克是一个巨大的变化,全世界的标准就不再标准了,而且随着时间的推移也会进一步变化。因此我们需要更精确,可以用得更久的重量标准。

    在2018年的时候,国际度量衡大会重新定义了公斤的标准,那就是基于刚才我提到的量子霍尔效应,和另一个诺奖工作、约瑟夫森效应提出了一个全新的称,叫量子称或者叫基布尔称,它对重量的测量精度可以达到10的负8次方克,而且是由物理学的自然界常数所定义的,1万年、10万年、1亿年也不会发生变化。这是我举的一个大家能理解的例子。

    刚才我提到了三个不同版本的量子霍尔效应。它们需要一个磁场,就像霍尔效应一样,而且一般情况下需要的磁场都特别强,一般是10个特斯拉,10万个高斯,这是非常强大的磁场,我们庞大地球产生的磁场只有0.5高斯,我们要用的磁场是地球磁场强度的20万倍。能不能把它去掉磁场也能观察到量子霍尔效应呢?我带领的团队与合作者一起,在2013年的时候完成了这个实验,在世界上首次发现了不需要任何磁场、只需要材料本身的磁性而导致的量子霍尔效应,或者叫量子反常霍尔效应。

    这样一个发现是不是也是材料驱动的呢?是的。我在这里给大家复习一下我们所熟悉的材料。在我们一般人的概念中,我们自然界的材料只有3类,导电的金属,不导电的绝缘体,还有一个是半导体,介于两者之间。

    第一代半导体有硅、锗,第二代半导体有砷化镓、锑化汞,第三代、第四代还有氮化镓、碳化硅、金刚石等等。在研究材料和材料的相变基础上,包括量子霍尔效应上,有两个物理学家,一个是大家可能比较熟悉的华人物理学家张首晟,和宾夕法尼亚大学的Charles Kane,在这基础上他们提出了一个全新的材料:拓扑绝缘体,也就是大家在屏幕的最右边所能看到的。

    什么是拓扑绝缘体?我给大家简单解释一下。这个图大家可能比较熟悉,最左边是一个陶瓷的碗,是绝缘的、不导电的。再朝右是一个金做成的碗,是导电的,叫导体。拓扑绝缘体就是一个陶瓷碗镀了一层导电的膜。如果把这个镀了膜的碗进一步进行磁性掺杂,使它有磁性的话,它就会变成一个只有边上镀金的碗。这个边上镀金碗就叫磁性拓扑绝缘体材料。

    按照张首晟等的理论,它就可以让我们能观察到量子反常霍尔效应。但是,这个材料是一个三不像的矛盾体:它有磁性,它要拓扑,它还要绝缘,我们还要把它做成薄膜,这就要求一个运动员篮球打得像姚明那么好,跑步像博尔特那么快,跳水要全红蝉那么伶俐,这样的材料非常难以制备。为什么呢?因为大部分磁性材料都是导电的,铁、钴、镍都是导电的;另外,磁性和拓扑在物理上是很难共存的;还有一点,在两维薄膜的情况下,很难实现铁磁性,使这个才有真正的磁性。因此真正观测到量子反常霍尔效应,在实验室看到它,这是一个极其具有挑战性的实验。

    我带领的团队和另外三个团队紧密合作,我们动员了20多位研究生,奋斗了4年,尝试了一千多个样品,最后在2012年10月份,全部完成了量子反常霍尔效应发现,完成了实验。我们证明了确实在边上镀金的碗(磁性拓扑绝缘体)中,存在量子反常霍尔效应这样一个新的规律。

    今天,我特别把当时发现量子反常霍尔效应的样品带到了现场。大家可以看到,看到很多电级,电级之间有方块,每个方块上就是首先观察到的量子反常霍尔效应的样品。

    这里我再给大家讲一下制备这个材料,对原子磁场的控制,对科学发现非常重要。这是其中一个例子,我们学生制备的,采集的一些照片。中间大家会看到,拓扑绝缘体碲化铋薄膜的扫描隧道显微镜照片,上头每一个亮点代表一个原子,更重要的是,在这个范围内你找不到一个缺陷。说明我们材料的纯度非常高,我们在其他材料中也能做到这个水平。

    这是另一个拓扑绝缘体材料:硒化铋。大家可以看到,这么大的范围内,你只看到你想要的原子,没有任何缺陷,而且薄膜是原子级的平整,这为我们最后发现量子反常霍尔效应奠定了非常好的基础。

    最近,我们继续在朝这个方向努力,我们正在攻克的一个问题就是高温超导机理这个重大科学问题。我再次放了博士后制备的研究高温超导机理异质结样品的电镜照片,大家从上可以看到有5个样品,不同的颜色代表这个异质结的结合部。大家可以看到,每个亮点几乎是接近一个原子,我们制备的异质结,两个材料的结合部几乎达到了原子尺度的完美,只有这样,我们才能在这样一个非常难以攻克的高温超导机理上有所作为,我们会沿着这个方向继续努力下去。

  • 最优学习的85%规则

    文章原题目:The Eighty Five Percent Rule for Optimal Learning

    论文地址:https://www.biorxiv.org/content/10.1101/255182v1

    1. “恰到好处”——学习的迷思

    人们在学 习新技能时,例如语言或乐器,通常会觉得在能力边界附近进行挑战时感觉最好——不会太难以至于气馁,也不会太容易以至于感到厌烦。

    历史传统中有所谓的中庸原则,我们也会有一种简单直觉经验,即做事要“恰到好处”。反映在学习中,即存在一个困难程度的“甜蜜点”,一个“金发姑娘区”。在现代教育研究中,在这个区域的不仅教学最有效果[1],甚至能解释婴儿在更多更少可学习刺激之间的注意力差异[2]。

    在动物学习研究文献中,这个区域是“兴奋”[3]和“失落”[4]背后的原因,通过逐步增加训练任务的难度,动物才得以学习越来越复杂的任务。

    在电子游戏中几乎普遍存在的难度等级设置中,也可以观察到这一点,即玩家一旦达到某种游戏水平,就会被鼓励、甚至被迫进行更高难度水平的游戏。

    类似地,在机器学习中,对于各种任务进行大规模神经网络训练,不断增加训练的难度已被证明是有用的 [5,6],这被称为“课程学习”(Curriculum Learning)[7] 和“自步学习”(Self-Paced Learning)[8]。

    尽管这些历史经验有很长的历史,但是人们一直不清楚为什么一个特定的难度水平就对学习有益,也不清楚最佳难度水平究竟是多少。

    在这篇论文中,作者就讨论了在二分类任务的背景下,一大类学习算法的最佳训练难度问题。更具体而言,论文聚焦于基于梯度下降的学习算法。在这些算法中,模型的参数(例如神经网络的权重)基于反馈进行调整,以便随时间推移降低平均错误率[9],即降低了作为模型参数函数误差率的梯度。

    这种基于梯度下降的学习构成了人工智能中许多算法的基础,从单层感知器到深层神经网络[10],并且提供了从感知[11],到运动控制[12]到强化学习[13]等各种情况下人类和动物学习的定量描述。对于这些算法,论文就训练的目标错误率提供了最佳难度的一般结果:在相当温和的假设下,这一最佳错误率约为15.87%,这个数字会根据学习过程中的噪音略有不同。

    论文从理论上表明,在这个最佳难度下训练可以导致学习速度的指数级增长,并证明了“85%规则”在两种情况下的适用性:一个简单的人工神经网络:单层感知机,以及一个更复杂、用来描述人类和动物的感知学习[11]的类生物神经网络(biologically plausible network)。

    2. 计算最优学习率

    在标准的 二分类任务中,人、动物或机器学习者需要输入的简单刺激做出二元标签分类判断。

    例如,在心理学和神经科学[15,16]的随机点动实验(Random Dot Motion)范例中,刺激由一片移动的点组成 – 其中大多数点随机移动,但有一小部分连贯一致地向左或向右移动。受试者必须判断相应一致点的移动方向。

    决定任务感知判断难度的一个主要因素是一致移动点所占的比例。如下图所示,一致点占0%时显然最难,100 %时最容易,在 50%时难度居中。

    实验人员可以在训练过程中使用被称为“阶梯化”(staircasing)的程序[17]控制这些一致移动点的比例以获得固定的错误率。

    论文假设学习者做出的主观决策为变量 h,由刺激向量 x(如所有点的运动方向) 的经函数 Φ 计算而来,即:h = Φ(x, φ) ——(1),其中φ是可变参数。并假设变换过程中,会产生一个带噪声表示的真实决策变量Δ(例如,向左移动点的百分比),即又有 h = ∆ + n ——(2)。

    噪声 n 由决策变量的不完全描述而产生的,假设 n 是随机的,并从标准偏差σ的零均值正态分布中采样。设 Δ = 16,则主观决策变量 p(h) 的概率分布如图1A所示。

    红色曲线是学习之后新的曲线,可以看到其分布标准差σ比原来有所降低,使更多变量分布在了Δ=16 附近。这就说明学习者在学习之后决策准确度有所提高。曲线下方的阴影区域面积(积分)对应于错误率,即在每个难度下做出错误响应的概率。

    如果把决策界面(decision boundary)设置为 0,当 h > 0 时模型选择选项 A,当 h < 0 时选择 B, h = 0 时随机选择。那么由带噪声表示的决策变量导致的错误概率分布为:

    其中 F(x) 是噪声标准正态分布的累积分布函数,概率密度函数 p(x)= p(x|0,1)。由等式(3)可以得到β = 1/σ。即若 σ 为正态分布的标准差,则 β 精确表示了在任务难度Δ下学习者的技能水平。σ越小,β越大,技能水平越高。

    如图1B所示,无论学习前还是学习后,随着决策变得更容易(Δ增加),两条曲线皆趋于下降,从而使错误率变得更低。

    但两条曲线的下降速度是不一样的:当β增加(σ变小)后,曲线更集中和陡峭,因此学习之后的红色曲线下降速度也更快,这表示学习者对任务挑战的技能水平越趋于完善。

    由最初的公式(1) 可知,学习的目标是调整参数φ,使得主观决策变量 h 更好地反映真实决策变量Δ。即构建模型的目标应该是尽量去调整参数φ以便减小噪声 σ 的幅度,或者等效地去增加技能水平精度 β。

    实现这种调节的一种方法是使用误差率函数的梯度下降来调整参数。例如,根据时间 t 来改变参数。论文在将梯度转换为精度β的表示后,发现影响因子只在于最大化学习率 ∂ER/∂β 的值,如图1C所示。显然,最佳难度Δ随着技能水平精度β的函数 dER/dβ 而变化,这意味着必须根据学习者的技能水平实时调整学习难度。不过,通过Δ和ER之间的单调关系(图1B),能够对此以误差率ER来表达最佳难度,于是可以得到图1D。

    在变换后,以误差率表达的最佳难度是一个精度函数的常量。这意味着可以通过在学习期间将误差率钳制在固定值上实现最佳学习。论文通过计算得出,对于高斯分布的噪声这个固定值是:

    ——即最佳学习率下误差率约为 15.87 %。

    3. 模拟验证:感知机模型

    为了验证“85%规则”的适用性,论文模拟了两种情况下训练准确性对学习的影响:在人工智能领域验证了经典的感知机模型,一种最简单的人工神经网络,已经被应用于从手写识别到自然语言处理等的各种领域。

    感知机是一种经典的单层神经网络模型,它通过线性阈值学习过程将多元刺激 x 映射到二分类标签 y 上。为了实现这种映射,感知机通过神经网络权重进行线性变换,并且权重会基于真实标签 t 的反馈进行更新。也就是说,感知机只有在出错时才进行学习。自然的,人们会期望最佳学习与最大错误率相关。然而,因为感知机学习规则实际上是基于梯度下降的,所以前面的分析对这里也适用,即训练的最佳错误率应该是15.87%。

    为了验证这个预测,论文模拟了感知机学习情况。以测量范围为0.01到0.5之间的训练误差率,步长为0.01(每个误差率1000次模拟)训练。学习的程度由精确度β确定。正如理论预测的那样,当以最佳错误率学习时,网络学习效率最高。如图2A所示,不同颜色梯度表示了以相对精度β/βmax 作为训练误差率和持续时间的函数,在 β=βmax 时学习下降最快;在不同错误率比例因子下的动态学习过程,图2B也显示,理论对模拟进行了良好的描述。

    图2:“85%规则”下的感知机

    4. 模拟验证:类生物神经网络

    为了证明“85%规则”如何适用于生物系统学习,论文模拟了计算神经科学中感知学习的“Law和Gold模型”[11]。在训练猴子学会执行随机点运动的任务中,该模型已被证明可以解释包括捕捉行为、神经放电和突触权重等长期变化情况。在这些情况下,论文得出相同结果,即当训练以85%的准确率进行时,学习效率达到最大化。

    具体来说,该模型假设猴子基于MT脑区的神经活动做出有关左右感知的决策。MT区在视觉系统的背侧视觉通路(Dorsal visual stream),是已知在大脑视觉中表征空间和运动信息的区域[15],也被称为“空间通路”(where),相对的,视觉系统另一条腹侧视觉通路(Ventral visual stream)则表征知觉形状,也被称为“辨识通路”(what)。

    在随机点动任务中,已经发现MT神经元对点运动刺激方向和一致相关性 COH 都有响应,使得每个神经元对特定的偏好方向响应最强,且响应的幅度随着相关性而增加。这种激发模式可通过一组简单的方程进行描述,从而对任意方向与相关刺激响应的噪声规模进行模拟。

    根据大脑神经集群响应情况,Law 和 Gold 提出,动物有一个单独脑区(侧面顶侧区域,LIP)用来构建决策变量,作为MT中活动的加权和。不过它与感知机的关键差异在于,存在一个无法通过学习来消除的随机神经元噪声。这意味着无论多么大量的学习都不可能带来完美的性能。不过,由论文计算结果所示,不可约噪声的存在不会改变学习的最佳精度,该精度仍为85%。

    Law and Gold 模型和感知机的另一个区别是学习规则的形式。具体来说就是有基于预测误差正确的奖励,会根据强化学习规则进行更新权重。尽管与感知器学习规则有很大的不同,但Law和Gold模型仍然在误差率[13]上实现梯度下降,在 85%左右实现学习最优。

    为了测试这一预测,论文以各种不同的目标训练误差率进行了模拟,每个目标用MT神经元的不同参数模拟100次。其中训练网络的精度β,则通过在1%到100%之间以对数变化的一组一致性测试上,拟合网络的模拟行为来进行估计。

    如图3A所示,在训练网络精确度β作为训练错误率的函数下,蓝色的理论曲线很好描述了训练后的精度。其中灰点表示单次模拟的结果。红点对应于每个目标误差率的平均精度和实际误差率。

    此外,在图3B中,以三条不同颜色测量曲线显示了三种不同训练错误率下行为的预期差异 。可以看到,在误差率为 0.16 (接近 15.87%)的黄色曲线上,结果精确度高于过低或过高误差率的两条曲线,即取得了最优的训练效果。

    5. 心流的数学理论

    沿着相同的思路,论文的工作指向了“心流”状态的数学理论[17]。这种心理状态,即“个体完全沉浸在没有自我意识但具有深度知觉的控制”的活动,最常发生在任务的难度与参与者的技能完全匹配时。

    这种技能与挑战之间平衡的思想,如图4A所示,最初通过包括另外两种状态的简单概念图进行描述:挑战高于技能时的“焦虑”和技能超过挑战时的“无聊”,在二者中间即为“心流”。

    而以上这三种不同性质的区域:心流,焦虑和无聊,可以本篇论文的模型中自然推演出来。

    设技能水平为精度 β,以真实决策变量的反函数 1 /Δ 为技能挑战水平。论文发现当挑战等于技能时,心流与高学习率和高准确性相关,焦虑与低学习率和低准确性相关,厌倦与高准确性和低学习率相关(图4B和图C)。

    也就是说,在技能与挑战水平相等时以“心流”状态进行的学习,具有最高的学习率和最高的准确性。

    此外论文引述了 Vuorre 和 Metcalfe 最近的研究[18]发现,心流的主观感受达到巅峰时的任务是往往主观评定为中等难度的任务。而在另一项关脑机接口控制学习方面的研究工作发现,主观自我报告的最佳难度测量值,在最大学习任务相关难度处达到峰值,而不是在与神经活动的最佳解码相关难度处达到峰值[19]。

    那么一个重要的问题来了,在使用最佳学习错误率,达到主观最佳任务难度即心流状态进行学习时,其学习速度究竟有多快

    论文通过比较最佳错误率与固定但可能次优的错误率、固定难度进行学习来解决了这个问题。通过对训练误差率函数计算,最终得到,在固定错误率下:学习技能β精度随着时间 t 的平方根而增长。

    而相对的,在没有使用最佳固定错误率学习,即决策变量固定下一般学习,其结果会强烈地依赖于噪声的分布。不过论文计算出了噪声为正态分布的情况下的近似解,对β的提升,学习技能以更慢的对数速度增长。即若最佳训练率下,可以相当于对后者实现指数级增长的改进。二者学习增速趋势对比图如下:

    从论文对感知机和Law and Gold 模型测试,心流理论的数学化可以看出,未来研究者们去测试各种学习类型活动参与度的主观测量值,验证是否在最大学习梯度点达到峰值,“85%规则”是否有效将会是有非常有趣的。

    然而这篇论文的作用还远不仅于此,下面就本文意义做进一步深入探讨。

    6. 学习的定量时代? 讨论、延伸与启示

    学习对个体生物个体的重要性不言而喻,甚至比大多数人想得更重要。在2013年1月,《心理学通报与评论》上发表了一篇 论文①的就认为,学习不仅一个是认知过程,在更本质的功能层面是一种个体自适应过程,包括生物体在有机环境规律作用下的行为改变,并认为就如演化论是生物学核心一样,学习研究应该是心理学的核心

    然而,自心理学诞生后的诸多理论,对学习的研究往往止于简单行为操作或概念描述层面。比如行为主义研究者巴普洛夫和和斯金纳经典条件反射、操控条件反射,苏联心理学家维果斯基(Lev Vygotsky)有关儿童教育的“最近发展区”理论,有关动机和表现之间的关系的耶基斯–多德森定律(Yerkes–Dodson law)、基于舒适-学习-恐慌区的“舒适圈理论”,还包括米哈里·契克森米哈赖的“心流理论”,安德斯·艾利克森的“刻意练习”等等。

    这些学习理论,要么强调学习需要外部刺激相关性、或正向奖励负向惩罚的某些强化,要么强调学习在大周期的效果,或较小周期的最小行动,要么寻求某种任务难度与技能水平、或动机水平与表现水平之间的一个折中区域。但是却从来没有给出如何到能达这种状态的条件,往往只能凭借有教育经验的工作者在实际教学中自行慢慢摸索。

    而在这篇论文中,研究者考虑了在二分类任务和基于梯度下降的学习规则情况下训练准确性对学习的影响。准确计算出,当调整训练难度以使训练准确率保持在85%左右时,学习效率达到最大化,要比其他难度训练的速度快得多,会使学习效果指数级快于后者。

    这个结果理论在人工神经和类生物学神经网络具有同样的效果。即“85%规则”既适用于包括多层前馈神经网络、递归神经网络、基于反向传播的各种深度学习算法、玻尔兹曼机、甚至水库计算网络(reservoir computing networks)[21, 22])等广泛的机器学习算法。通过对∂ER/∂β梯度最大化的分析,也证明其适用于类生物神经网络的学习,甚至任何影响神经表征精确度的过程,比如注意、投入或更一般的认知控制[23,24]。例如在后者中,当∂ER/∂β最大化时,参与认知控制的好处会最大化。通过关联预期价值控制理论(Expected Value of Control theory)[23,24,25]的研究,可以知道学习梯度 ∂ER/∂β 由大脑中与控制相关的区域 ( 如前扣带回皮层 ) 来进行监控。

    因此可以说,本篇论文无论对计算机科学和机器学习领域研究,还是对心理学和神经科学研究,都具有重要的意义。

    在前者,通过“课程学习”和“自步学习”诉诸广泛的机器学习算法,本文基于梯度下降学习规则思路下包括神经网络的各种广泛学习算法,都急需后续研究者进行探索和验证。在最佳学习率上,论文的工作仅仅是对机器学习学习效率数学精确化实例的第一步。并且同时也促使研究者思考:如何将这种最优化思路推广到在更广泛的环境和任务的不同算法中?例如贝叶斯学习,很明显和基于梯度下降的学习不同,贝叶斯学习很难受益于精心构建的训练集,无论先出简单或困难的例子,贝叶斯学习者会学得同样好,无法使用 ∂ER/∂β 获得“甜蜜点”。但跳开论文研究我们依然可以思考:有没有其它方法,例如对概念学习,通过更典型或具有代表性的样本、以某种设计的学习策略来加快学习速度和加深学习效果?

    另一方面,这篇论文的工作同样对心理学、神经科学和认知科学领域有重大启示。

    前面已经提到,有关学习理论大多止步于概念模型和定性描述。除了少数诸如心理物理学中的韦伯-费希纳定律(Weber-Fechner Law)这样,有关心理感受强度与物理刺激强度之间的精确关系,以及数学心理学(Mathematical psychology)的研究取向和一些结论,缺乏数学定量化也一直是心理学研究的不足之处。

    而这篇论文不仅结论精确,其结论适用于包括注意、投入或更一般的认知控制下任何影响神经表征精确度的过程。如前所述,如果我们采取“学习不仅一个是认知过程,在更本质的功能层面是一种个体自适应改变过程”有关学习本质的观点,会发现它带来的启示甚至具有更大的适用性,远远超出了一般的认知和学习之外。

    例如,在知觉和审美方面的研究中,俄勒冈大学(University of Oregon)的物理学 Richard Taylor 通过对视觉分形图案的研究发现,如设白纸的维度D为1,一张完全涂黑的纸的维度D为2,即画出来的图形维度在 1~2 之间,那么人类的眼睛更偏好于看维度 D=1.3 的图形[26]。事实上许多大自然物体具有的分形维度就是 1.3,在这个复杂度上人们会感到最舒适。一些著名的艺术家,比如抽象表现主义代表人物 ( Jackson Pollock ),他所画的具有分形的抽象画(下图中间一列,左边是自然图,右边为计算机模拟图)分布在 D=1.1 和 1.9 之间,具有更高分形维度的画面会给人带来更大的压迫感[27]。

    心理学家 Rolf Reber 在审美愉悦加工的流畅度理论(Processing fluency theory of aesthetic pleasure)中[28]提出,我们有上述这种偏好是因为大脑可以快速加工这些内容。当我们能迅速加工某些内容的时候,就会获得一个正性反应。例如加工 D = 1.3的分形图案时速度很快,所以就会获得愉悦的情绪反应。此外,在设计和艺术领域心理学家域唐纳德·诺曼(Donald Arthur Norman)和艺术史学家贡布里希(Ernst Gombrich)也分别提出过类似思想。

    对比下 D = 1.3 和 15.87% 的出错率,如果进行下统一比例,会发现前者多出原有分形维复杂性和整体的配比,未知:已知(或熟悉:意外,秩序与复杂)约为 0.3/1.3 ≈ 23.07%,这个结果比15.87%要大。这种计算方法最早由数学家 George David Birkhoff 在1928 年于《Aesthetic Measure》一书中提出,他认为若 O 为秩序,C 为复杂度,则一个事物的审美度量 M = O/C。

    因此,在最简化估计下,可以类似得出 23.07% 额外信息的“最佳审美比”,会让欣赏者感到最舒适。

    当然,因为信息复杂度的计算方法不一,上面只是一个非常粗略的估计。审美过程涉及感觉、知觉、认知、注意等多个方面,并且先于狭义的认知和学习过程,因此最佳审美比应该会15.87%要大。但至于具体数值,很可能因为不同环境和文化对不同的主体,以及不同的计算方法有较大差别,例如有学者从香农熵和柯尔莫哥洛夫复杂性方面进行度量的研究[29]。

    但不管怎样,从这篇文章的方法和结论中,我们已可以得到巨大启示和信心,无论是在人工智能还是心理学或神经科学,无论学习还是审美、知觉或注意,在涉及各种智能主体对各种信息的处理行为中,我们都可能寻求到一个精确的比例,使得通过恰当选取已知和未知,让智能主体在体验、控制或认知上达到某种最优。而这种选取的结果,会使积累的效果远超自然过程得到改进。从这个意义上讲,这篇论文影响得很可能不只是某些科学研究方向,而是未来人类探索和改进自身的根本认知和实践方法。

    参考资料

    1. Celeste Kidd, Steven T Piantadosi, and Richard N Aslin. The goldilocks effect: Human infants allocate attention to visual sequences that are neither too simple nor too complex. PloS one, 7(5):e36399, 2012.
    2. Janet Metcalfe. Metacognitive judgments and control of study. Current Directions in Psychological Science, 18(3):159–163, 2009.
    3. BF Skinner. The behavior of organisms: An experimental analysis. new york: D.appleton-century company, 1938.
    4. Douglas H Lawrence. The transfer of a discrimination along a continuum. Journal of Comparative and Physiological Psychology, 45(6):511, 1952.
    5. J L Elman. Learning and development in neural networks: the importance of starting small. Cognition, 48(1):71–99, Jul 1993.
    6. Kai A Krueger and Peter Dayan. Flexible shaping: How learning in small steps helps.Cognition, 110(3):380–394, 2009.
    7. Yoshua Bengio, Jérˆ ome Louradour, Ronan Collobert, and Jason Weston. Curricu- lum learning. In Proceedings of the 26th annual international conference on machine learning, pages 41–48. ACM, 2009.
    8. M Pawan Kumar, Benjamin Packer, and Daphne Koller. Self-paced learning for latent variable models. In Advances in Neural Information Processing Systems, pages 1189–1197, 2010.
    9. David E Rumelhart, Geoffrey E Hinton, Ronald J Williams, et al. Learning represen- tations by back-propagating errors. Cognitive modeling, 5(3):1, 1988.
    10. Yann LeCun, Yoshua Bengio, and Geoffrey Hinton.Deep learning.Nature, 521(7553):436–444, 2015.
    11. Chi-Tat Law and Joshua I Gold. Reinforcement learning can account for associative and perceptual learning on a visual-decision task. Nat Neurosci, 12(5):655–63, May 2009.
    12. WI Schöllhorn, G Mayer-Kress, KM Newell, and M Michelbrink.Time scales of adaptive behavior and motor learning in the presence of stochastic perturbations.Human movement science, 28(3):319–333, 2009.
    13. Ronald J Williams. Simple statistical gradient-following algorithms for connectionist reinforcement learning. Machine learning, 8(3-4):229–256, 1992.
    14. Frank Rosenblatt. The perceptron: A probabilistic model for information storage and organization in the brain. Psychological review, 65(6):386, 1958.
    15. William T Newsome and Edmond B Pare. A selective impairment of motion perception following lesions of the middle temporal visual area (mt). Journal of Neuroscience, 8(6):2201–2211, 1988.
    16. Kenneth H Britten, Michael N Shadlen, William T Newsome, and J Anthony Movshon.The analysis of visual motion: a comparison of neuronal and psychophysical perfor- mance. Journal of Neuroscience, 12(12):4745–4765, 1992.
    17. Mihaly Csikszentmihalyi. Beyond boredom and anxiety. Jossey-Bass, 2000.
    18. Matti Vuorre and Janet Metcalfe. The relation between the sense of agency and the experience of flow. Consciousness and cognition, 43:133–142, 2016.
    19. Robert Bauer, Meike Fels, Vladislav Royter, Valerio Raco, and Alireza Gharabaghi.Closed-loop adaptation of neurofeedback based on mental effort facilitates reinforce- ment learning of brain self-regulation. Clinical Neurophysiology, 127(9):3156–3164, 2016.
    20. De Houwer J1, Barnes-Holmes D, Moors A..What is learning? On the nature and merits of a functional definition of learning.https://www.ncbi.nlm.nih.gov/pubmed/23359420
    21. Herbert Jaeger. The “echo state” approach to analysing and training recurrent neural networks-with an erratum note. Bonn, Germany: German National Research Center for Information Technology GMD Technical Report, 148(34):13, 2001.
    22. Wolfgang Maass, Thomas Natschläger, and Henry Markram. Real-time computing without stable states: A new framework for neural computation based on perturba- tions. Neural computation, 14(11):2531–2560, 2002.
    23. Amitai Shenhav, Matthew M Botvinick, and Jonathan D Cohen. The expected value of control: an integrative theory of anterior cingulate cortex function. Neuron, 79(2):217–240, 2013.
    24. Amitai Shenhav, Sebastian Musslick, Falk Lieder, Wouter Kool, Thomas L Griffiths, Jonathan D Cohen, and Matthew M Botvinick. Toward a rational and mechanistic account of mental effort. Annual Review of Neuroscience, (0), 2017.
    25. Joshua W Brown and Todd S Braver. Learned predictions of error likelihood in the anterior cingulate cortex. Science, 307(5712):1118–1121, 2005.
    26. Hagerhall, C., Purcell, T., and Taylor, R.P. (2004). Fractal dimension of landscape silhouette as a predictor for landscape preference. Journal of Environmental Psychology 24: 247–55.
    27. A Di Ieva.The Fractal Geometry of the Brain.
    28. Rolf Reber, Norbert Schwarz, Piotr Winkielman.Processing Fluency and Aesthetic Pleasure:Is Beauty in the Perceiver’s Processing Experience.http://dx.doi.org/10.1207/s15327957pspr0804_3
    29. Rigau,Jaume Feixas,Miquel Sbert,Mateu.Conceptualizing Birkhoff’s Aesthetic Measure Using Shannon Entropy and Kolmogorov Complexity. https://doi.org/10.2312/COMPAESTH/COMPAESTH07/105-112
  • 马亮:政策实验室、政府创新与新文科建设

    文章略有节编。

    新文科实验室建设对于服务公共管理的教学、研究和实践,实现官产学研用的打通和融合意义重大。在公共管理实践中涌现出的政策实验室,与新文科实验室在很多方面有异曲同工之妙,二者有进一步融合的潜在空间。本文将从比较政策创新中政策与政策试点的差异切入,进而回顾政策实验室兴起和发展的历程,探讨新文科实验室建设对于政策实验和政府创新的价值,并提出进一步建设新文科实验室的对策建议。

    一、政府创新中的政策实验与政策试点

    (一)实验何以重要

    实验(experiment)往往被视为现代科学研究的黄金标准,不少人认为它是进行因果推断的不二法门。比如,2019年和2021年两届诺贝尔经济学奖都颁发给了在实地实验和因果推断方面作出贡献的经济学家。在实验中,随机对照实验(RCTs)被认为是进行政策评估的金科玉律,因为它满足了一些基本条件,使因果推断更为可靠。实验背后的思想反映在“反事实”逻辑,即我们可以通过实验来回答“假如……怎样”的问题。

    实验的主要特征包括随机化(randomization)、干预或处理(treatments)、实验环境的可控性(controllability)、“双盲”(double blind)、实验组与对照组的匹配与比较。为什么要这样设计?原因就在于要确保实验组与对照组的可比性,确保实验效应的一致性,排除环境和条件因素的干扰,避免实验人员的偏见,并确保结果归因的唯一性。

    首先,在控制组(即反事实)与实验组的分组方面要确保随机分组,即每个政策干预对象都有同等机会被选入实验或作为对照。其次,对实验组的各个政策干预对象都施加同样的干预或采取同样的处理,这样可以更好地比较其影响。再次,为了避免其他因素干扰,通常在完全受控的实验室中进行实验,而这在现实政策实验中往往难以达到,但是人们要尽可能地模拟实验室环境。复次,为了避免心理作用等带来的影响,需要确保实验对象之间独立且互不干扰,避免信息沟通带来的实验对象污染。最后,通过将实验组和对照组的前测与后测进行比较,就可以获得政策干预带来的净效应。

    不少发达国家开展的政策实验(policy experiment),就是基于行为科学与循证决策思想,通过随机对照实验和因果推断来进行政策实验,为政策决策提供有效支撑。在政策评估中,实验设计或准实验设计有助于排除其他干扰因素,评估某项政策的净效应。同时,循证实践的崛起,推动政府决策更加科学,特别是基于科学证据进行决策更加依赖实地实验提供的严谨证据。比如,行为公共管理学的发展使越来越多的公共管理研究使用实验设计,包括实验室实验、调查实验、实地实验等。

    (二)政策试点与政策实验的差异

    在政策创新中,一直存在政策试点、示范与政策实验的路径选择问题。实验主义更多强调大胆探索,而不限于科学严谨的实验法,包括实验性治理(experimentalist governance)、分级制实验(experimentation under hierarchy)、引导创变(directed improvisation)等概念。从中国改革开放来看,国家治理的优秀经验集中表现在公共政策的试点、试验与示范。

    政策试点(policy pilot)是对某项政策方案进行测试和评估,确定其是否可行有效和可以推广。政策试点既可以是试对(预设政策方案是合适的,通过试点来为其提供证据支持),也可以是试错(政策方案的可行性是不确定的,通过排除错误方案来确保正确方案脱颖而出),但其预期结果应是开放的。政策示范(policy model/demonstration)是通过树典型、立榜样、设标杆和遴选最佳实践,通过示范项目来引领其他地区和部门。一些地区被列为“先行先试区”,更多是带有探索色彩的试验;一些地区则被冠以“先行示范区”,意味着其在引领改革方面扮演重要角色。

    政策试点、示范和实验之间有何不同?不少学者对此进行了探讨,明确了试点、示范与实验的异同。从方法论角度分析,差别在于分组与抽样、干预、环境三个方面,这使政策试点和示范都是准实验,缺失严格实验的某些关键要素,进而导致对其效果进行评估时面临的方法论挑战(如表1所示)。

    1.分组与抽样

    实验设计需要设立实验组和控制组,一般采取随机分组方式,确保二者是可比的,避免选择偏差带来的实验结果偏误。实验分组需要遵循随机抽样原则,确保分组的随机性,但在代表性和典型性方面未必合理。相对来说,政策试点强调能够代表各类地区,使试点在未来推广时有更强的普适性。为了使政策试点达到预期效果,往往会采取试点地区差异最大化的原则,有目的地选择基础条件不同的若干个地方或部门,而地域多样性可以尽可能保证试点在环境不同的地区都能够同步检验。

    实验是实验人员确定谁进入何组,“被试”是被动接受实验、处理或干预的。但在选择试点单位方面,则是双向选择而非单方面分组。试点单位的选择往往是多轮次开展而非一次性进行的,一般先是上级政府部门公开征集,然后是地方政府部门自愿申报,经过上级评审遴选后公示试点单位名单。这样一来,谁参与试点都是公开的,也就难以避免试点地区之间的相互影响,以及非试点地区的学习和模仿,进而使试点效应评估面临难题。同时,选择试点的地区数量多少、是竞争性还是非竞争性的遴选、是限额还是不限额等,都存在较大差异,也使政策试点有较强的多样性。比如,2019年中央政法委启动的“全国市域社会治理现代化试点合格城市”就属于不限额且非竞争的,只要达标即可入围。

    政策示范是由点到面或以点带面地树立典型,选取的都是成功的榜样,因此没有代表性,也无随机性可言。从中央政府部门设立各种示范城市项目的初衷来看,也有较大差异,使政策示范同实验的差异各不相同。值得注意的是,在政策实验中面临的问题是,试点地区为了得到好评,导致试点很少不成功的,示范没有不成功的。在预定结果确定的情况下,地方政府可能为了实现试点成功而使试点偏离初衷,导致试点结果不可信。

    2.干预

    在实验中,实验人员对同组被试做出相同的干预(实验、操控或处理),确保实验效应是可以精准度量和比较的。但在政策试点中,政策干预的主体和方式都有所不同,因此同实验相去甚远。试点单位不是被动接受政策干预,而是主动开展有创造性的政策创设和检验。试点地区可能同时开展多种不同政策试点,有时候是加挂多块政策试点牌子。试点一个政策选项还是同时试点多个政策选项,显然会影响每项政策试点的效果。

    试点的目的是解决不知道怎么做才对的问题,带有探索性和不确定性,所以需要“摸着石头过河”。试点单位不是作为“被试”被动接受实验,而是要强调自主性和主动性。试点单位作为实验的策划者、组织者和参与者,要积极主动地争取、组织和开展实验,而这是有别于实验逻辑的。

    试点的核心是为了试验尽可能多的不同政策方案,而不是验证一种政策方案。所以,各地都是“八仙过海各显神通”,试点的方式各不相同,并尽可能突出地方的鲜明特色。实验的干预方式是预先设定的,而试点的政策方案是即兴发挥的,各地在试点过程中也会不断调整和改变。从政策试点来看,政策目标是清晰的,但政策手段是模糊的,无论是中央还是地方都不清楚,所以政策方案往往是在试点启动后才逐渐清晰和确定的。这往往是中央指导,地方创设,互学互鉴,地方成功后即全国复制推广。比如,2013年在上海试点自由贸易试验区,很快在全国其他地区设立,进而推动一大批制度改革成果复制推广。

    3.环境

    实验要求在同样的环境条件下进行,这样可以确保实验组和控制组的差异归因为实验本身。但是,各地在资源禀赋、领导重视程度、试点单位的自主性和能力等方面都有很大不同,导致政策试点效果的归因困难,一些地区甚至出现刻意栽培的“政策盆景”。因此,试点成败不仅同试点本身有关,也同试点环境有关。比如,上海浦东试点法院员额制改革,其本身效果较好,但在全国推广时却在不少地区出现“水土不服”情况。

    实验要求“双盲”,即实验人员不知道谁进入实验组,被试也不知道自己是否属于实验组。这有助于排除传染效应,而设立安慰剂组则可以进一步排除人们接受干预的心理作用。政策试点往往是地方竞争、中央遴选和完全公开,所有地区和部门都知道谁是试点单位,试点单位相互之间也心知肚明。试点单位之间相互竞争,都希望成为中央中意的政策方案,所以往往暗中较劲,甚至“只做不说”。

    同时,政策试点可能会在多层级政府中同时或序贯进行,导致政策试点的嵌套性较强。比如,政策试点不仅有国家级试点,还有省级试点和市级试点,而这种地方试点往往是在未入选国家级试点的地区进行。地方政府也会率先培育政策试点,并为申报国家级试点打好基础,由此导致试点先行带来的评估难题。

    (三)政策试点还是政策实验?

    政策创制可以使用试点、示范或实验等模式,因此,需要关注不同政策创制方式有何异同,以及为什么不同国家采取不同路径。政策创制究竟采取政策试点或示范,还是推行政策实验,取决于政治体制与行政文化,也同决策者的观念和意识有关。当然,也不应刻意将试点与实验视为二元对立的模式,它们可能从属于一个更大的连续统一体或共同谱系,只不过采取了不同的逻辑与评判标准。基于方法论的比较显示,实验可谓演绎法指导的定量研究,而试点是归纳法指导的定性研究。实验是对一个理论假设进行检验,而试点是对多个理论假设进行比较。实验生产普遍知识,而试点生产实用知识。

    西方政治体制中,不同政策方案的选择与论证需要强有力的支持,才能避免被政党利益和意识形态干扰。比如,吸烟有害健康在今天来看是确凿无疑的,人类活动毫无疑问是造成气候变化的重要原因,但要想让人接受这些观点,却需要大量坚实的科学证据基础。因此,通过政策实验获得选民支持,对于西方民主体制尤为重要。当然,严格意义上的真实验往往可遇不可求,在很多情况下也无法在实际情形中推行。相对来说,大量政策实验都是准实验(quasi-experiment),在某些方面不满足基本条件,但是可以通过一些补救措施来对实验效应进行评估。

    近年来,我国特别强调“顶层设计”,但政策试点依然有很强的生命力。如果是需要突破既有法律法规框架的创新,就需要中央授权;如果是在既定制度框架内的创新,则可以由地方自主开展。政策试点的多样性较强,不能一概而论或“一刀切”。因此,有必要建立政策试点的分类体系,并解释中央政府部门为何设立各种试点和示范项目。比如,在为什么试点方面,试点的目标不同;在谁来试点方面,发起试点的部门不同;在谁被试点方面,选取的点不同;在试点什么方面,试的方案不同;在哪里试点方面,试点的环境不同;在何时试点方面,试点的轮次和批次不同;在如何试点方面,试点的含金量不同。

    政策过程复杂而微妙,涉及许多行动者、资源和解决方案,很难通过简单的实验加以评估。政策试点的重点不在于政策试点项目本身成功与否,或者说为了产生规模效应,而是要通过政策试点结果来了解不同行动者对政策的反应。对于中国这样的大国而言,政策创制与推广之间存在很强的张力。为了避免某项政策出台后带来的大规模失败风险,往往需要采取分级制的政策试点。政策试点推广的不同阶段也遵循不同逻辑,导致试点的推广带来不同的影响。比如,中国公立医院改革试点从2010年开始分四批进行,遴选了103个试点城市。通过和106个非试点城市比较,可以识别五种不同试点组态:再接再厉型的挑战“破冰者”、取长补短型的短板“主攻手”、一马当先型的创新“排头兵”、背水一战型的逆势“突围者”、以身作则型的区域“领头羊”。

    上述讨论表明,政策试点和标准的实验设计有很多区别,而之所以不少国家和地区的政府选择政策试点而不是开展政策实验,同许多现实考虑有关。但是,鉴于实验设计在科学研究与政策创制方面的双重价值,有必要探讨如何使其融合式发展,从而既产生科学知识也提供政策知识。在某种意义上来说,政策实验室的诞生与发展部分回应了这一诉求。

    二、政策实验室的兴起与发展

    (一)政策实验室因何而起

    近年来,越来越多的国家和城市建设政策实验室(policy lab)、城市实验室、政策创新实验室或公共部门创新实验室,对政策创新进行设计、实验、评估和推广。政策实验室日益兴起,既同行为科学(behavioral science)的崛起有关,也同循证决策(evidencebased policymaking)的流行离不开。同时,政策实验室也推动智库转型,使其从思想库走向证据库,除了促进思想创新和传播,也在开发和积累科学证据。当然,以ChatGPT为代表的新一代生成式人工智能(AIGC)技术也有利于推动循证治理,通过科学证据的加速扩散和利用来提升政府决策科学化。

    政策实验室是一种对政策进行实验的组织,主要开展政策实验与政策评估,帮助决策者回答“什么奏效”(what works)和为什么。一方面,政策实验室突出创新思维,聚焦存在突出问题与严峻挑战的政策领域,通过头脑风暴、集思广益来征集政策创意和创造性解决方案。另一方面,政策实验室遵循行为科学,采用严谨的实验设计与政策评估方法,对已有政策和政策方案进行检验、评估和完善,为政府部门修改、使用和推广政策提供专家咨询与决策辅助。

    政策实验室的先锋当属英国的行为洞察力团队(Behavioral Insights Team, BIT)。BIT在2010年由英国政府成立,后发展成为社会企业,2021年完全并入创新慈善机构Nesta。BIT最早为英国首相办公室和内阁部门服务,总结了让政策奏效的四大法宝,即EAST法则——通过让公共政策简单易懂(easy)、富有吸引力(attractive)、与己相关(social)和及时速效(timely),为很多政府部门提供了政策决策支持。此外,BIT还总结了MINDSPACE法则,提出一套通过政策干预来改变人们行为的组合拳,包括信使(Messenger)、激励(Incentives)、规范(Norms)、默认(Defaults)、显著(Salience)、启动(Priming)、情感(Affect)、承诺(Commitments)、自我(Ego),每个方面都可以形成富有价值的政策工具。BIT推动的政策创新典型案例是电子烟政策。不少国家将电子烟视为百害而无一利的“毒品”或需要严加监管的新型烟草产品,英国政府却率先将电子烟作为禁烟办法,消费者可以在药店通过医疗保险来购买电子烟。虽然电子烟可能诱导未成年人吸烟,但在前期政策实验的基础上,英国政府审慎地推动了这项政策,使人口吸烟率明显下降。

    从政策实验室的崛起与扩散来看,全球迄今已有上百个政策实验室,其中大约有65个在欧盟成员国。就澳大利亚和新西兰的调查来看,也有52家之多。政策实验室是政策创新的未来吗?从政策扩散的驱动机制来看,府际竞争与学习造就的“民主实验室”孵化政策创意并检验政策效果。政策实验室将这些政策扩散机制制度化,使其能够更加有效地推动政策创新的实验和推广,毫无疑问有利于增强政府部门的创新能力。

    (二)政策实验室的不同模式

    虽然各国政策实验室有不同名称,如创新实验室、政策创新实验室、政策实验室等,但都可以归类概括为几种主要模式。有学者从研究方法和路径的角度划分为设计实验室、开放政府数据实验室、循证实验室、混合实验室。本文从实验方法(行为科学、设计思维)以及与政府的关系(部门民营化、政府主导、政府完全控制)两个方面,对政策实验室进行分类。政策实验室的核心使命是影响政府决策,其与政府的关系会影响政策方案是否得到政府认可、重视和推广。但是,如果政策实验室缺乏独立性,也会影响其对政府的影响力。政策实验室既可以注重设计思维,聚焦政策如何设计;也可以关注行为科学,注重如何对政策进行实验与推广。

    对丹麦心智实验室(Danish MindLab)、英国行为洞察力团队(BIT)、新加坡人类体验实验室(THE Lab)这三个政策实验室的比较案例研究显示,政策实验室在实验方法(行为科学、设计思维)及其与政府的关系(部门民营化、政府主导、政府完全控制)方面有明显不同,可以采取不同模式与策略(如表2所示)。

    丹麦心智实验室是政府主导,采取设计思维对政策进行创新。设计思维在建筑设计、艺术设计等领域应用广泛,意味着要从设计的角度来重新审视政策过程,并通过设计来不断优化政策。BIT一开始是政府完全控制,但是随着迅速的发展,独立成为咨询公司,主要采取行为科学指导下的政策实验模式。新加坡人类体验实验室是完全由政府控制的机构,基于设计思维来对政策进行实验。

    政策实验室的核心职能是知识转移,而知识转移能否成功则取决于许多因素,比如政策实验室同政府部门的相互信任与合作动机,政策实验室的开放性、专家资源与制度建设等。从这些政策实验室的运作来看,它们采取了不同模式与策略。这使政策实验室在如何发现和发明政策以及如何验证和推广政策方面有显著差异,进而可能影响政策实验室的运营和绩效。

    值得注意的是,政策实验多种多样,政策实验室的运作模式也各不相同。在设计与管理政策实验室方面,需要结合各地实际情况与资源禀赋,采取符合本地实际的运作模式。比如,中国不少地方政府依托政策研究室、大数据管理局、科技产业园等载体,建立类似于政策实验室的政策研发、创新与推广平台,也是顺应和合乎全球政策实验室发展趋势的。

    三、如何建设新文科实验室

    (一)新文科实验室的定位与方向

    新文科建设需要新文科实验室的支撑,而如何建设新文科实验室就成为值得关注的问题。从新文科实验室的建设定位来看,需要明确其同传统实验室和大学智库的不同,以及其在支持政策实验方面的潜力。传统实验室往往是服务单一学科的,且主要是以科学研究为服务对象,在多学科交叉融合和服务政策创新实践方面的作用较弱。智库也称思想库,更多发挥的是决策支撑,而在科学研究和知识创新方面的能力较弱。新文科实验室建设毫无疑问要有别于传统实验室和智库,并需要探索新的发展道路。新文科实验室与政策实验室服务目的不同,却有很强的融合式发展潜力。新文科实验室建设要加强同政策实验室的对话,借鉴政策实验室的创新模式,推动二者融合式发展。

    实验主义的内涵丰富,科学严谨的政策实验不是唯一路径。政策实验室有不同模式,科学实验也同样需要因地制宜。中国政策试点的多样性与特征意味着要坚持实用主义的政策实验理念,坚持“验以致用”,通过打通官产学研用来使政策实验发挥效果。

    从政策实验室与政府创新的关系来看,政策实验室可以扮演不同角色。它们既可以服务于科学研究与学术发表,也可以服务于政府决策与政策评估。一个重要问题就是,如何实现二者兼容。从具体分工来看,实验室开展原创性实验研究、证据库汇总和编译科学证据,而试验田则复制推广政策创新。这意味着要打造政策实验平台,通过科普和服务输出政策经验,推动研究证据向政策实践转化。因此,新文科实验室可以借鉴政策实验室的经验做法,更多关注如何对政策实践进行评估,如何开展政策实验,如何创造性设计新政策等。

    近年来,行为公共管理学发展迅猛,通过共同设计与合作开展实验研究,揭示公共管理行为的内在逻辑。从新文科实验室建设的需求来看,这意味着要打通试点与实验,加强政策试点与政策实验对话,使决策者和研究人员可以谋求共同语言。因此,加快新文科实验室建设,推动实验知识的翻译与转化,加快实验得到认同与推广,将有助于实现这些目标。

    同时,新文科实验室建设也需要朝着数字化与智能化方向发展。在数字时代,借助大数据分析和人工智能技术,政策实验将会加快发展。比如,互联网企业流行AB测试,可以在大规模用户中快速进行不同方案的实验。类似地,敏捷监管强调要建立“监管沙箱”,在金融科技等前沿领域进行政策实验。诸如此类的发展都意味着,要推动新文科实验室与政策实验室的融合式发展,既为发展和检验社会科学理论提供平台,也为推动政策实验和创新实践提供支撑。

    (二)研究启示与未来展望

    政策实验室和新文科实验室有深化合作乃至合二为一的潜力,因此需要关注二者如何进一步加强合作并推动实验室服务科学、研究和实践。展望未来,可以重点研究如下问题。

    首先,当前各地建设的新文科实验室都有很强的本地特色,往往同本地政府、大学和学科等有较强的联系,也在很大程度上塑造了不同实验室的独有特征。有必要对这些新文科实验室进行类型学研究,将其进行分类和比较,推动新文科实验室发展方向规划。从试点、完善到推广,新文科实验室建设也遵循我国一般政策试点的逻辑,有必要对试点实验室进行跟踪监测、考核评估和优化完善,为其他高校和机构建设新文科实验室提供启示。

    其次,新文科实验室的发展进行到了一定阶段,但是如何对其评估还缺乏较好的指标和方法。各个新文科实验室都有不同的历史条件、前期基础、学科渊源等,并非在同一起跑线上,也难以用一把尺子“一刀切”。这类似于对政策试点的评估,需要避免试点必成功的陷阱,也要避免偏颇的考核“指挥棒”导致的行为扭曲和弄虚作假。因此,既要明确少数共性和通用指标,又要允许各个新文科实验室特色化发展。

    最后,需要对其他国家哲学社会科学实验室的建设与运行进行分析和比较,探讨其对中国新文科实验室建设的启示。与此同时,也要进一步提炼我国新文科实验室的特征,凸显其在自主知识体系建构方面的作用,加强同其他国家哲学社会科学实验室的交流合作,并为其他国家提供可资借鉴的经验,比如推动跨国实验室数据开放、算法共享等。

    本文转自《中国社会科学评价》2024年第2期

  • 徐义华:甲骨学研究的基本领域及主要成就

    甲骨文发现已有120多年,经过数代学者的努力,甲骨学已成为一门成熟的国际性学科。甲骨学研究可以分为四大领域:第一个是基础性领域,主要是资料整理;第二个是研究性领域,主要包括文字考释、甲骨自身规律研究、商周史研究、商周汉语研究四个部分,另外,甲骨的考古学考察、西周甲骨、甲骨学术史、甲骨文书法艺术等领域也值得关注;第三个领域是工具书的编纂;第四个领域是近年来兴起的新领域——甲骨文研究的电子化和智能化。本文主要介绍甲骨学研究性领域和新领域。

    甲骨学研究性领域

    甲骨文的研究性领域,情况大致如下。

    一、文字考释

    文字考释是甲骨研究的第一步。1904年孙诒让写成《契文举例》,这是第一部甲骨文字考释书。此后最有影响力的学者是罗振玉和王国维,尤其是罗振玉,释读常用甲骨文字数百多个,使甲骨刻辞基本得以通读。继罗、王之后,贡献最大的是唐兰和于省吾,不仅考释甲骨文字众多,还发展了文字考释理论。

    70年代以后,以裘锡圭在文字考释方面的成就最高,其著作《古文字论集》影响很大。此后,大批文字学著作也涌现出来,如刘钊《古文字考释丛稿》、陈剑《甲骨金文考释论集》、蒋玉斌《殷墟子卜辞的整理与研究》等。经过学者努力,已有一千多个甲骨文字得到释读,甲骨刻辞已可通读。

    二、甲骨自身规律

    甲骨自身规律主要是指甲骨的整治、卜辞的刻写、刻辞的种类等知识。

    1.甲骨文例

    甲骨文例主要是指刻辞在甲骨上的格式、行款、布局等。1928年胡光炜《甲骨文例》首先对卜辞行款进行研究,此后董作宾《骨文例》、胡厚宣《卜辞同文例》、张秉权《论成套卜辞》等文发表,对卜辞的分布、行款等作了更深入的探讨。80年代以后,学者的研究更为细致,如李旼姈《甲骨文例研究》、孙亚冰《殷墟花园庄东地甲骨文例研究》等对文例进行了综合性研究。

    2.分期断代研究

    分期断代是确定卜辞时代,将其转化为史料的前提。1930年,董作宾发表《甲骨文断代研究例》,提出了世系、称谓、贞人等十项标准,并把甲骨卜辞划分为五期。从此,甲骨文的大致时代得以确定。

    董作宾的五期分法还存在一些不足,为此,有学者提出了分组分类的方法。陈梦家在《殷虚卜辞综述》中提出“组”的概念,影响巨大。后来,李学勤、彭裕商、林沄等学者撰文讨论,黄天树《殷墟王卜辞的分类与断代》和彭裕商《殷墟甲骨断代》等书出版,新的甲骨分期理论逐渐完善。

    3.甲骨整治与卜法制度

    在利用甲骨占卜之前,商人会对甲骨进行剖解、钻凿等一系列整治,这是重要的研究内容。

    罗振玉就将钻凿作为重要内容,到20世纪60年代,贝冢茂树最先用钻凿形态论证卜辞的时代,后来许进雄撰成《甲骨上钻凿形态的研究》等论著,全面地分析钻凿形态及其与分期断代的关系。80年代后,钻凿的价值被进一步认识,周忠兵《甲骨钻凿形态研究》、赵鹏《殷墟有字甲骨钻凿布局与占卜形式探研》等书出版。

    卜法很早就被学者关注,1929年,董作宾写成《商代龟卜之推测》,该文介绍了商人从取龟到契刻再到收藏的整个过程,后来宋镇豪《殷墟甲骨占卜程序的追索》、朴载福《先秦卜法研究》等也做了研究。近来,李雪山《嬗变与重构:商代甲骨占卜流程与卜法制度研究》出版,对卜法研究起到推动作用。

    4.甲骨缀合

    甲骨容易破碎,把破碎的甲骨拼合起来即缀合。1917年,王国维缀合了一版甲骨,首开先河。第一部专门的甲骨缀合著作是曾毅公于1939年出版的《甲骨叕存》,此后郭若愚、张秉权、严一萍等都出版了缀合著作。2000年以后,甲骨缀合获得更大进展,蔡哲茂《甲骨缀合集》《甲骨缀合续集》、林宏明《醉古集》、黄天树《甲骨拼合集》第一至五集等先后出版。

    缀合方法不断改进,蔡哲茂提出关注同文例,黄天树提出甲骨形态学,都极大促进了甲骨缀合工作的进展。

    三、甲骨文与殷商史

    甲骨文研究的一个重要方面是认识商周史。最早利用甲骨文解读历史的是王国维,他于1917年发表的《殷卜辞中所见商先公先王考》及《续考》,标志着甲骨文研究进入“史料时期”。

    此后,甲骨文的史料价值被发掘,胡厚宣《甲骨文商史论丛》、丁山《商周史料考证》、李学勤《殷代地理简论》等著作都产生了很大影响。20世纪80年代以后,利用甲骨文研究商史的著作大量涌现,彭邦炯《商史探微》、朱凤瀚《商周家庭形态研究》、杨升南《商代经济史》、宋镇豪《夏商社会生活史》、刘源《商周祭祖礼研究》等著作问世。最值得关注的是宋镇豪主编的《商代史》,该书从政治、军事、经济等多个方面对商代历史做了综合研究。

    四、甲骨文与汉语史

    甲骨文用于商代汉语研究,主要包括两个方面,一方面是语法研究,另一方面是语音研究。

    1953年管夑初出版的《殷虚甲骨刻辞的语法研究》,是第一部甲骨文语法著作。西方学者探讨甲骨文语法较多,如吉德伟、倪德卫、高岛谦一等都发表了论文。20世纪80年代以后,甲骨文语法研究蓬勃发展,沈培、张玉金、喻遂生、杨逢彬等都出版了相关著作。用甲骨文研究语音出现较晚,1984年赵诚发表《商代音系探索》,初步拟出商代音系。此后,陈振寰、管夑初、郭锡良、邹晓丽等也都做了这方面的研究,取得了一定成果。

    除了上述几个方面,甲骨学的考古学考察、西周甲骨、通论性和学术史研究、甲骨文艺术化转化等方面也是值得关注的。

    甲骨文研究的信息化

    甲骨文研究的电子化表现在三个方面:一是成果发布的网络化,二是甲骨资料库的建立,三是甲骨文研究的智能化。

    许多甲骨文研究成果选择快捷的网络发布,例如,中国社会科学院先秦史网站成为甲骨缀合成果集中发布的网站。

    甲骨文资料库不断建立,多地学者都参与其中。在港台地区,香港中文大学建立了“汉达文库”,成功大学建立了“甲骨文全文影像数据库”,“中研院”史语所建立了“甲骨文数位典藏数据库”等,都提供甲骨图片和释文,并有检索服务。在大陆地区,有中国国家图书馆的“甲骨世界数据库”、中华书局的“殷墟甲骨文数据库”、安阳师范学院的“殷契文渊”,其中“殷契文渊”不仅将甲骨原始资料上网,而且建立了字形库和文献库。

    早在20世纪60年代,美国学者周鸿祥即试验计算机缀合甲骨,并取得一定成果。随着人工智能的发展,计算机在甲骨缀合、文字识别和校对重片方面取得很大进展,有学者开始尝试用计算机考释文字。莫伯峰《人工智能在古文字研究中的应用及展望》、李春桃《基于人工智能技术的古文字研究》等成果,揭示了新技术在甲骨文研究中的前景。

    本文转自中国社会科学报

  • 劳东燕:法学是一门可寄予个人抱负的专业

    当年我参加高考的时候,报考志愿是在分数出来之前,也就是根据自己预估的分数填报的志愿。本来我那时的理想是成为一名企业家,想报企业管理方向的专业,结果被一句“哪个企业等着你去管理?”的质疑所打击,临时改弦更张而报了法学专业。

    90年代,法学不是热门专业,从学科发展来说基本上还处于幼年状态,彼时被称为“幼稚的法学”也不算很离谱。

    回看这三十年,法学一跃成为文科专业中为数不多的热门,细想起来倒也在意料之中,符合社会发展的基本规律。不难发现,但凡是趋于复杂化的社会,都不可避免地要选择通过法律的社会治理。纵观中外历史,这一点具有客观规律性,不以人的意志为转移。

    社会变得越复杂,法律也会越复杂,专业门槛自然也水涨船高。这在法学理论中被称为双重复杂性的挑战。

    由此可见,专业的热门与冷门,个人职业选择的明智与否,说到底还是取决于社会的发展趋势。毕竟,个人的职业生命有几十年,而专业的选择经常会产生路径依赖的效果,看长远而非短期,得出的判断往往更为明智。

    法律与新闻之类的行业,虽说也可能在特定时期遭遇低谷,但只要社会想发展,人们对社会发展抱有起码的信心,这样的行业就不可能长期地处于低谷状态。

    当然,彼时选择法学,于我而言完全是一种偶然,并没有考虑得那么长远,也谈不上是深思熟虑的结果。人生的很多关键时刻,往往是由偶然的因素决定,尽管事后看来似乎偶然中存在一定的必然。

    走进法学这么多年,我从未后悔过选择这个专业。

    因为后来读硕又读博,整个学法的过程比较漫长,之后的职业也一直没出法学领域,所以我应该算得上是资深的法律从业者。作为法律行业的过来人,在此报考志愿之际,想谈几点个人的切身感受。

    1. 法学是一门可寄予个人抱负的专业,从中很容易找到所从事职业的社会意义。

    当然,并不是每个从业者都必须如此,你也可以只把它当成一种谋生的工作,这完全是个人的自由选择。之所以要强调这一点,是因为到一定年龄阶段后,当解决了基本的生存问题,人就不可避免地想要满足更高层次的心理需求,对人生意义的追寻不可避免。

    2. 对法学的兴趣可以在学习的过程中进行培养。

    在中学乃至大学时期,大多数人其实并不确定自己是否适合学某个专业。

    就我来说,一直到大学,都没觉得自己适合学法学,当时只是公法领域的课程学得不错,但民商法之类的就学得一般。一直到读研时,由于思维与写作能力受到较多的肯定,才确定自己适合学法学,兴趣与自信也是在过程中慢慢培养起来的。

    对个人的职业选择来说,倘若能将热爱与擅长相结合,自然是上佳;如果没有这种幸运,将自身的擅长与至少不讨厌的专业结合起来,也是不错的选择。

    3. 如果选择法学专业,那么在专业课程以外,一定要努力拓展自己的知识视野,对其他人文社会科学的知识都有所涉猎。

    在法学之外,我对社会学、政治学、制度经济学、人类学与社会心理学等,都有比较强烈的兴趣,甚至一度对社会学的兴趣还超过法学,因为觉得法学匠气太重,过于技术化,思想性不够。

    尽管早期我对其他学科知识的涉猎,完全只是业余爱好,并没发现对学法有什么帮助,但在从业多年后,有一天突然就有豁然开朗的感觉。底层的理由其实很简单,法律是用来调控人的行为,并且是在社会中运行的,不了解社会,不了解人性,也就不可能真正地理解法律。

    4. 如果选择法学专业,务必努力提升自己的写作能力与口头表达能力。

    对学好法学来说,写作能力是第一位的,即便口头表达能力稍逊也关系不大,法律行业更为看重书面写作能力。这种写作能力,不只是指文字表述准确流畅,还有论证能力,包括提出依据进行反驳与立论的能力,以及逻辑能力,即能够条分缕析逻辑严谨地展开论理。

    在提升自身写作能力的同时,训练口头表达能力也比较重要,这种口头表达能力不是指口齿伶俐,而是能够清晰有力地组织语言进行表达。学生时代,我也曾经怯于在公众场合发言,后来是通过在听讲座时每次都要求自己在问答环节进行提问,来逐渐克服对发言的内心胆怯的。

    愿每一位同学,或早或晚都能遇到适合自己的专业。

  • 张天祁:高考志愿选大学还是选专业?他们的研究给出了答案

    高考结束后,又到了为报志愿争论不休的时节。每年总有一些问题被反复提及,但从来没有答案,比如,选大学还是选专业?

    理想答案当然是,名校的热门专业,但是实际情况是,多数人只能二选一。

    强势专业和好大学都会给人未来的发展,尤其是职业发展带来助益。但到底哪一方能带来更大的助益,一直是个报志愿方面的难题。这个问题当然没有标准答案,即使是指导报考的老师,往往也建议综合考虑学生的兴趣、能力特质等方面。这样的说法当然中肯,但没有给出一个明确的参考标准,等于把难题又丢回给了考生。

    今年一项美国的研究中,作者们尝试回答学校和专业哪个对收入影响更大这个问题[1]。他们发现,专业学科对毕业生的未来收入有着更为显著的影响,超过了大学本身的品牌效应。收入差异中由大学造成的比例约为21%-22%,而由学科造成的比例约为60%。

    也就是说,不考虑个人兴趣、城市发展等更复杂的选择条件,单从工作收入来看,专业比大学更重要。

    尤其是STEM(科学、技术、工程和数学)专业,带来的经济回报尤为突出。在毕业后偿还学生贷款的第一年,STEM专业的毕业生比非STEM专业的同学平均多挣31%,相当于年薪多了大约1万美元;到了第二年,这个差距进一步扩大到32%,STEM毕业生的中位数薪资达到4万3千多美元,而非STEM专业的同学只有3万多一点。

    另外,在偿还贷款的第一年,加州理工学院(Caltech)位列大学中预期薪资榜首,其毕业生的中位数薪资为64,123美元。然而,如果将视角转向具体专业,电气、电子和通信工程专业的毕业生薪资表现更为亮眼,他们的第一年平均中位数薪资已经超越了加州理工学院的水平,达到64,546美元,而它只是期望薪资第三高的专业。足见专业选择对于起薪的重要性。

    当然,专业比学校更影响未来的收入这个说法还是太过于笼统了。这项研究还表明,读STEM专业带来的收益是因学校而异的,在收入中位数偏低的学校,STEM专业和其他专业的起薪差距能达到60%。在收入中位数偏高的学校,比如佛罗里达州迈阿密大学,STEM专业的起薪和其他专业的差距没有那么夸张,在18%左右。

    而对非STEM专业来说,大学的水平可能对未来的发展更重要。大学录取率如果提高10%(入学标准放宽),就读非STEM专业的学生起薪将会有0.5%的下降,而STEM专业学生则只有0.1%的下降。

    根据这篇论文的结论,选择专业和大学应依据不同情况来定。如果主要考虑收入,选择一个收入潜力高的专业可能比进入一所顶尖大学更为关键。对于STEM领域的专业来说,由于名校所带来的额外收入溢价相对较小,所以在分数有限的情况下,不必过分追求名牌大学。

    对于其他专业的学生而言,大学的品牌和水平可能对收入有更大的影响。
    不过,西北大学普利兹克法学院的黛博拉·韦斯(Deborah M. Weiss)觉得,一端是高收入、数学含量高、对职业有用的 STEM 领域,另一端是低收入的人文学科领域,这种分类过于简化,数学训练并不是拉开专业之间收入的唯一因素。她与合作者们的一项研究提供了更为详细的分类[2]。

    例如,在整体收入溢价比较高的商科中,会计学的收入溢价是所有专业中最高的,可以单列一档。金融/营销提供的溢价相对高,工商管理、人力资源管理、旅游管理之类的专业,和社会科学大类中的公关管理专业差不多,可以说会计拉高了整个商科的溢价水平。而在整体溢价比较低的社会科学中,经济学仍然能带来高收入。
    在STEM领域里,也能分出理科与工科的区别。作者把STEM进一步区分为工程(计算机工程、电气和电子工程、机械工程等),物理科学(物理、化学),数学和计算机科学,以及平均收入相对低的其他STEM专业。其中,工程类专业的溢价最为突出,仅次于会计专业。也就是说,工科比理科溢价更多。

    其中的差距,一方面来自技能。作者团队使用了超过2200万份简历数据,从中创建了精细的专业分组,并基于这些分组计算出不同专业在数学推理和书面表达这两项技能上的重要性得分,进而分析了这些技能与专业收益的关系。他们发现,书面表达和数学推理是大学培养的两种主要职业技能,与需要书面技能的工作的专业相比,需要数学技能的工作的专业从选择性中获益更大。

    影响专业和收入的另一方面,则是专业的职业特异程度,简单来说就是“专业对口”的程度。职业特异程度高,意味着这个专业专注于某一特定职业领域,提供高度专业化培训,直接与特定行业或职位相匹配。溢价最高的专业,比如会计、工程、护理都属于对口程度高的一类。这些专业不仅需要在课堂上学习,也需要实习经验或者考取相关证书获得资质。

    作者们发现,对于收入潜力相对低的专业(人文类、艺术类、商科中的管理类、经济学/国际关系以外的社科类、社会服务类),学校名气对收入的影响一直比专业更重要。对于数学和计算机、物理、经济学、金融/营销、生物等收入溢价比较高的专业,如果就读的学校能从中等提升到名校,那还是选大学对收入的帮助更大。至于学会计、护理和工程类专业的学生,对大学的要求最低,哪怕学校提升两档,也是专业对收入的帮助更大。

    当然,这两个研究都是基于美国数据的研究,不可能直接套用在国内的情形上,但是一些原则还是可以借鉴。

    即使同是STEM领域,选择工科专业时相比理科可以更看重专业。如果选择人文或者社科专业,那就需要更看重学校。作为211大学的两财一贸(中央财经大学、上海财经大学、对外经济贸易大学)部分专业录取分数线连续多年超过多所985大学,也说明在财会领域,学生和家长心中选专业要重于选大学。

    高薪的代价会40岁之后显现

    学科差异之所以能对工资有如此大的影响,是因为不同专业直接关联到特定行业和职业路径,这些行业和职业的薪酬结构差异很大。在某种程度上,选择专业也就是在选择职业。起薪高或低的职业差距不仅在钱上,而是整个职业生涯的轨迹和形态都会有不同。了解到两条职业道路的区别 ,应该比单纯考虑行业薪资要更有参考价值。

    哈佛大学的两位学者利用2007年至2019年间来自在线招聘信息的详细职位描述,开发了一个模型,探讨了工作经验回报与技能过时的关系。他们发现计算机、工程和商业等应用专业的大学毕业生,虽然起薪更高,但是收入溢价相比其他专业也下降的更快。

    计算机和其他工程类专业能带来更高的起薪,主要是因为在本科四年的学习中学到能用在工作中的知识,进入相关领域的工作后可以快速获得回报。比如58%的计算机毕业生从事与计算机相关的工作,相比之下,生命科学和社会科学专业就业很分散,没有一个方向超过10%。

    然而,程序员、工程师、技术员之类的工作,本身就是技能更新比较频繁的工作。于是随着时间推移和技能过时,毕业生收入溢价会迅速下降,这是这类工作本身的特点。

    作者发现,即使并非相关专业的毕业生,从事计算机相关工作或者工程类起薪溢价达到40%左右,但在十年内下降至 20%。比如计算机专业58%的人从事与计算机相关的工作,相比之下,从事其他行业的计算机或者工程专业毕业生,收入溢价会随着时间提升,因为他们的行业 经验能够积累下来。

    不止是STEM专业,偏于应用的商科专业往往也有这个趋势。相反,那些学习基础学科比如生物学、文学的学生,收入溢价会随着年龄的上升而上升。计算机科学、工程和商科专业的学生在 20 多岁时的收入远高于生命/物理科学和社会科学专业的学生,但这种优势在 40 岁时就大大减弱了。

    根据2009年至2017年美国社区调查(Integrated Public Use Microdata Series,IPUMS)的人口加权平均年薪数据,23岁时工程和计算机科学毕业生起薪超过4万美元,而社科毕业生只有不到3万美元。但到40岁,双方的年薪都来到了10万美元上下,其后也没有再拉开差距,尽管工程和计算机科学类的工资一直要高一些。

    起薪高的代价是总要学习新技能,哪怕是人到中年也不能避免。在计算机以及工程领域的工作中,需要新技能的技术密集型工作所占比例基本稳定在41%左右,无论是最初级的岗位还是需要12年经验以上的岗位。这意味着,有四成STEM方向的工作者在求职时,很可能面对已经工作了几年甚至十几年还要从零学起的情况。相比之下,其他工作只有20%多的岗位需要更新技能。

    这导致了更高的退出率。26岁时有58%的计算机和工程专业的毕业生从事相关工作,但50岁的时候有18%左右的人已经转向了非STEM的管理工作。社科专业的毕业生则没有经历这样的波动。

    高薪但有更多挑战,更早赚到大钱,中年时更可能面对转型的问题,这是读热门应用专业的毕业生更可能出现的职业轨迹。其他专业的职业道路则更平稳,一步一步逐渐积累经验提高薪资。在国内,那些所谓弱势专业的毕业生还有自己的特殊优势。

    俄亥俄州立大学社会学系和香港中文大学社会学系的两位学者,利用中国综合社会调查(CGSS)2003到2018年三次调查的数据,考察了哪些大学专业的毕业生更倾向于进入体制内。

    研究发现,那些职业特异性较低且盈利性较弱(人文、社科,数学、物理、生物等基础学科)的专业毕业生,更容易端起铁饭碗,进入政府机关、事业单位和国有企业工作。而且随着市场化的深入,这些专业毕业生进入体制内的比例更大。作者认为这和毕业生的意愿有关,因为在市场上缺乏竞争力,所以这些毕业生更愿意追求体制内的工作。

    不过,这也可能和体制内的招考要求有关。2023年的国考中,法学、计算机、统计学、经济学、审计学、数学、新闻传播学、会计学、金融学和财政学占到了招录最多职位的专业前十,其中七个都是社科或者文科专业[5]。

    对于选择了名校,没有选择热门专业的学生,选调进入体制内也是一条可能的路。选调生不限专业,基本都是面对“双一流”中的世界一流大学建设高校,这无疑利好名校学生。

    另外,各地有时会进行限定专业的定向选调,有时会选中一些相对冷门的专业。比如海南曾经定向选调文化旅游类专业毕业生,包括社会体育指导、文物与博物馆、数字人文、艺术与设计学、艺术学、文化产业、民族学、中国少数民族艺术等等[6]。

    追求高薪还是追求稳定,也可以看作是另一种形式的选专业还是选大学。热门专业往往能够带来较高的薪酬,特别是诱人的起薪。而对于有意向进入体制内工作的学生来说,如果能进入名校,可能还是选学校更加重要一些。

    1.Muse, W. B., & Muse, I. (2024). College Selectivity, Choice of Major, and Post-College Earnings. Journal of Economic Analysis, 3(2), 33-51.
    2.Weiss, D. M., Spitzer, M. L., Cronin, C., & Chin, N. (2024). Why college majors and selectivity matter: Major groupings, occupation specificity, and job skills. Contemporary Economic Policy, 42(2), 278-304.
    3.Deming, D. J., & Noray, K. (2020). Earnings dynamics, changing job skills, and STEM careers. The Quarterly Journal of Economics, 135(4), 1965-2005.
    4.Yao, M., & Han, S. (2024). Who earns the iron rice bowl? Major marketability and state sector jobs among college-educated workers in urban China. Chinese Journal of Sociology, 10(2), 167-191.
    5.何书瑶,连俊翔,熊程心子(2023).不同专业考公“上岸”难度数据揭秘,这些专业机会为何较多. 上观新闻
    6.海南省2024年度定向选调应届优秀大学毕业生公告. (2024, April 22).

  • 刘云杉:自由选择与制度选拔:大众高等教育时代的精英培养——基于北京大学的个案研究

    01 引论

    1979年,英国70岁的高等教育协会主席John Fulton爵士访问北大,当北大领导介绍历年录取新生的分数均高于其他院校时,客人插嘴说:“我很理解。你们北大,就如英国牛津、剑桥一样 。全国家长,都渴望把他们的子女,送来读书。全国顶尖学生,也无不以能进入北大为最高理想。因此,你们招来的学生,都是拔尖人才。我感兴趣的是,这些拔尖学生,在你校的四年或更长时间毕业出去,他们在各行各业中,是否仍是拔尖人才呢?”[1]

    在这严峻的提问下,北京大学的本科教育一直在变革之中。

    北京大学的本科人才培养定位在变化,从“专业人才”到“文理基础学科的人才培养”[2],再到宽口径、厚基础的本科人才培养,以及“领导型创新型人才培养”(2013年),继而是“培养能够引领未来的人”(参见《北京大学本科教育综合改革指导意见》,2016年4月5日北京大学校长办公会审议通过)。在这四十年间的话语变更之中,交织着若干不同传统、不同旨趣的教育理念,其后是北京大学建校120年以来所形成的独特的教育传统:民国时期的“专业教育为主,通识教育为辅”办学模式与博雅教育理念,1950年代仿照苏联的工程技术为主的专业化模式,1990年代引入美国大学商科、法科主导的职业化模式,还有近十年通识教育的强力推进。

    改革集中体现在新旧两套教改十六字方针上。1988年提出“加强基础、淡化专业、因材施教、分流培养”。这是对移植苏联的专才培养模式的纠正,具体措施包括:拓宽专业面,淡化专业界限,真正贯彻学分制,执行灵活的教学计划。低年级(一、二年级)按相近专业或系进行宽口径的基础教育,保证基础素质训练,造就后劲;高年级(三、四年级)按个人志趣、学习状态和工作去向,分流选学不同课程,以适应社会不同的需要。北京大学要培养研究与应用两类人才:前者要少而精、高层次;后者量较大,也要宽口径、厚基础。基础学科也要联系实际,培养应用人才。(《北京大学本科教育改革研究与实践》,见王义遒主编:《文理基础学科的人才培养》,北京大学出版社2005年版,第42页。)1994年制订的《北京大学改革和发展纲要》提出的人才培养的目标与规格是:

    北大要着重培养两种规格的人才:一是能够从事教学、科研等学术性工作的基础学科人才,将来成为专家、教授、学者,其中少数人能够成为国际学术前沿的带头人、著名科学家,达到诸如诺贝尔获得者的学术水平;二是培养一批社会主义建设迫切需要的高层次应用型和复合型人才,成为政府各级公务员、企事业单位的专业人员或管理人员,其中少数人经过长期实践能够成为领导骨干,进入国家党政领导人的行列。(参见《北京大学改革与发展纲要》,1994年7月,收入王义遒主编:《文理基础学科的人才培养》,北京大学出版社2005年版,附件1—8,第48页。)

    2014年提出新的教改十六字方针:“加强基础,促进交叉、尊重选择,卓越教学。”其中,“加强基础”一以贯之。淡化专业体现为以下几步:其一,从以“专门化”(“专门化”设置是学习苏联的结果,把学科分为三级,学系、专业、专门化。专门面很窄,例如,大学物理专门化的目的,按照物理学的不同部门,为科研机关、工厂实验室和高等学校培养高级物理干部。见杜勤等:《北京大学学制沿革[1949—1998]》,北京大学出版社2000年版,第24页)为单位招生,到以学院/系为单位招生(2002年开始按学科大类招生与培养),再到学部内自由转专业、全校自由选课(2016);其二,压缩必修学分,尤其专业必修学分。淡化专业背后是本科教育培养目标重新定位,本科任务并非培养专家,而重在打基础,练就素质。“尊重选择”替换了“分流培养”:“要通过多样化与个性化的培养方案和模块化的课程结构,以及荣誉学位、本硕连读与联合培养项目等为学生的学习与发展提供更多的选择。要注意加强院系的合作,通过提供丰富的辅修和双学位培养方案、转系转专业、学科大类平台课等为学生的跨学科学习提供更多的选择和更为广阔的发展空间。(”北京大学教务部汇编:《北京大学本科生教学手册》,2014年9月。)

    2016年1月,某理科院系负责教学的院长(D03)陷入困惑中:一门8学分的基础课,他读本科时课堂教学时间为144课时,教学时间18周;2003年,教学时间降至16周,这门课教学时间降为128课时。现在,教务部要求学分减半,这门基础课将用80课时完成。学时减少,教学要求不降低,只能浓缩教学内容,要求学生自主学习其它内容。这一改革措施实施一段时间后却发现,学生课后没时间读书!只要看一下大幅度增加的双学位人数,就知道原因了。

    曾在美国大学任教的教务部领导(D01)是改革坚定的推动者,他主张:
    毫无疑问,北大应立足精英人才的培养。人才一般有两类:青蛙型与老鹰型。我们长于培养青蛙型人才,专注于具体问题,研究面较窄;但如何培养老鹰型人才——既是某一领域的研究专家,又有很高的眼光,能领导学科和引领社会的发展,这就需要我们大力发展通识教育。

    某人文学院院长(D05)指出:我们的问题是在一套苏联的专业教育的组织架构上移植美国文理学院的本科教育模式,这其间有北京大学已经形成的教育传统,譬如以人文教育为核心的博雅教育(liberal arts),围绕自主科研的专业教育(Professional education)与研究生教育(graduate education),还有以通识为基础、基于广泛严格学术训练的现代职业精英教育(learned professions)。在一所研究型大学的本科教育中,这些传统与力量如何平衡?

    本文的研究对象正是置身这一场变革之中的本科学生,通过他们所体受的制度、他们所作出的选择来考察研究型大学中本科教育的本质与功能,准确地说,在高等教育大众化时代,精英究竟如何培养?本文将仔细讨论:这些“拔尖”的学生究竟是谁?他们是如何被选拔到北京大学的?在本科教学改革中,他们究竟如何学习?培养方案、教学计划、考评制度的调整对他们产生什么样的影响?他们是如何做出选择的?在专业、课程、导师、社团、实习、交流、考研等既按部就班又环环相扣的培养与教学制度中,他们究竟受到什么样的教育?制度如何塑造他们的心性与惯习?

    从这些具体问题出发,自2015年11月至2017年9月,笔者做了大量的访谈、座谈,访谈对象包括6个院系负责本科生教学的院长(D01-06)、5名学校招生与教学部门的领导(M01-05)、6位教授(P01-06);还组织了18场次涵盖6个学部63名2016、2017届本科毕业生(FG01-18)的焦点团体座谈,学生分组讨论拔尖计划、竞赛保送、贫困专项、转专业等问题以及成绩后30%的学生面临的问题,并在此基础上做了24个深度个案,这些案例来自元培(YP01-04)、理科(S01-05)、人文(L01-08)、社科(SS01-04)、经管(E01-03)等学院和学部。

    支撑这一研究的还有以下工作:其一,与北大教务部合作进行的2016届、2017届本科毕业生质量调查研究,包括大规模的问卷调查,以及大量的、深度的访谈、座谈。其二,参与李猛主持的本科教学改革方案的课题研讨中,无论是文献的阅读、对院系领导的深度访谈,还是与渠敬东、强世功等数次讨论,都为经验层面的研究奠定了理论基础。

    02 精英选拔的多重逻辑

    赵状元(FG07-2)沮丧地承认:他真的学不懂专业,他就是那个被“分流者”,不过是以自由选择的形式完成的。赵状元有辉煌的学习成绩,他是省高考理科前10名,他“莫名其妙”地来到了这所以严酷著称的理科院系,身边80%的同学都有竞赛背景。高考中优异的理科成绩,在这里,却完全不行。

    赵状元所在的学院,一半学生来自保送(竞赛优胜者),有二成多学生来自自主招生(多有竞赛背景),剩下二成来自高考。教师们强调:理学院拔尖人才中不乏高考生的案例,只要努力,竞赛生的领跑优势并非不可超越。(据教务部珠峰计划的数据显示,在该学院2013—2016届毕业生中,“拔尖计划”占全体毕业生人数的13.1%,其中,保送生占拔尖计划68.4%;自主招生占23.7%,普通高考生占7.9%。)赵状元认为:“我们学院科研在全球名列前茅,它适合且只适合竞赛生,它不应对高考生开放。高考生与竞赛生在一起,完全是一场龟兔赛跑!科学是高淘汰的精英教育,一将功成万骨枯,金字塔耀眼的尖顶下是不同层级、众多的‘炮灰’,高考生不过是面目模糊、仅有统计意义且被做大的‘分母’!”

    赵状元的故事后涉及招生中的两种主要选拔模式:一种是开放、自由的竞争模式即高考模式,另一种为体现学术精英选材标准的举荐模式即竞赛与自主招生等模式。这也涉及在招生中对“什么是一流人才”的不同认识。借用布鲁贝克的二分法,一种是基于认识论基础的判断,一种是基于政治论基础的判断。[3]基于学术场域内在逻辑的认识论标准所选拔并培养的是智力的德性——好奇心、虚心,求知虽难毕竟可行的信念、耐心、勤勉、专心以及精确性。[4]换句话说,找到那些“眼睛发亮”“灵魂有光”的人。另一种是政治论的逻辑,大学从来就不是高居社会之外的“象牙塔”,北京大学要培养“社会公认”的优秀人才:不仅要培养杰出的学术精英,还要培养职业等级与社会地位中的高位者,即未来的职业精英与权力精英。政治逻辑要求精英的开放性,它体现为高考招生录取上的公开性、透明性以及分数面前人人平等。实践中却被扭曲为“唯分数论”,招生没有理由不招“分数最高的人”。高考及分数成为不同社会阶层、利益团体重新洗牌的核心机制,它体现为优质教育机会上的高竞争,教育过程中的高筛选以及核心利益中的高垄断。

    关于招生对象,《北京大学改革与发展纲要》中这样阐述:“必须招收一流的学生,给予一流的培养,出一流的人才。”(参见《北京大学改革与发展纲要》,1994年7月,收入王义遒:《文理基础学科的人才培养》,北京大学出版社2005年版,附件1—8,第48页。)“一流的学生”首先是各地高考的状元们,这些万里挑一的幸运儿正是严酷的高考竞争的优胜者。置身于差异悬殊的社会等级结构中,自由竞争的高考在开放与封闭、在权利与资格之间陷入困境:“高考分数膨胀,成绩区分度下降,成绩呈现高分段偏态分布,甚至出现一个分值竟然有三位数考生的现象!”(M01)

    高考的高利害性与成绩的低区分度构成冲突,膨胀的分数的之下,才智平庸者与才华出众者之间良莠难分。招办主任(M01)苦恼于考试的科学性不够:“高考成绩主要建立在长时间、大规模的重复训练上,它甚至连智商都不足以说明,它更多代表学生对知识的熟练程度、细致与严谨。”

    严酷的竞争带来了第三重逻辑:市场逻辑。高校招生变成一场依据分数高低进行的拍卖,状元及其分数成为招生市场竞拍中的标的物,手持高分者待价而沽,交易的条件为高额的奖学金和所谓的热门专业;分数成为他们讨价还价的资本,通过精巧的计算换取自己需要的东西,甚至随时根据出价的多少任意变换自己的承诺(M01)。市场的旨趣是“得与失”,他们生怕分数的购买力没有用“足”用“够”。在招生场域,分数不仅成为流通货币,甚至成为新宗教,分数拥有了超越分数的价值。

    自由选择的第一环是入学之前的专业选择上,据招生部门的观察:
    考生在选专业时,首先是用足分数,根据分数选专业,完全或基本不考虑兴趣,或许不知道自己喜欢什么,甚至不知道自己不喜欢什么;二是盲目跟风;三是不愿意选择基础专业,喜欢选择看得见摸得着,能够直接与就业挂钩的具体专业,特别是哲学、历史、地质、考古等一些所谓“冷门”专业面临无人问津的危险。[5]

    正是出于对政治逻辑与市场逻辑的纠正,自主招生希望打破高考录取分数的唯一性,为一部分综合素质优秀、学有特长但不一定能在高考中发挥出色的学生提供机会。自主招生原本应基于认识论的学术逻辑,实践中却逐渐异化为各高校提前圈定、争夺生源的工具,甚至演化为“二次高考”。[6]

    根据多位理科拔尖学生的个案与访谈合成,我们来看一个典型的理科拔尖学生的成长史。首先,严格选拔,特长突出。他们多出身于名牌中学的理科竞赛班或实验班,在中考甚至提前至初二、初三,他们已崭露头角,表现出优异的竞赛成绩与突出的学科特长。这就出现了一个奇怪的现象:一方面,基础教育被要求减负,学习越来越宽松;另一方面,拔尖人才的选拔与培养越来越提前。普遍的宽松学习与严酷的竞赛选材构成离奇的张力,在对理科人才的遴选中,天分好、智商高、对学科有特别的兴趣,这是标准。“特别的兴趣与突出的表现”体现着有对智商与天赋近乎神秘主义的推崇。在这神秘面纱之下,因材施教与拔苗助长合谋,中国年轻一代以自由选择为名,体受越来越严苛的选拔。竞赛要有突出的特长,高考不能有明显的短板,在巨大的不确定性下,多数考生都是两条腿走路,在“扬长”与“避短”之间、在“特长”与“均衡”之间小心地维持平衡,身心承受巨大的压力。人的均衡发展意指“心—手—脑”的和谐发展,孩子大脑承载着超常的数理能力,“心”与“手”的发展能否跟上“脑”的发展?还是“心—手—脑”的协调将面临巨大的困难?

    其次,高强度、目标明确的任务性学习。在多数名牌中学,竞赛班是特殊的群体,高一将高中理科全部学完,高二开始专攻竞赛;有的中学,成绩前50名的学生拼竞赛,这意味着他们的目标锁定北大、清华等“985”高校;排名50~100名的学生瞄准“211”高校,100名之后的学生就进入一本、二本等地方高校了。不同的班级,学习目标不同、师资配备不同、同伴群体不同。学习是在高竞争、高压力下进行,他们不能、也不愿意放弃竞赛,这既是一个高荣誉的学习项目,也是集中优质资源的教育项目,还是一次额外的机会:竞赛优胜者进国家队,这意味着或者提前拿到录取通知书,或者获得自主招生的减分承诺。他们开始习惯这种集训队般严筛选、强竞争、高挑战与高功利的任务性学习。

    布迪厄以“总体制度”剖析法国名牌高校入学考试中的预科班,这些制度被设计来彻底转变学生们的心智、身体与自我,以适应精英学校和通过这些学校所要达到的权力位置的要求。精英学校用苛刻的工作时间表训练学生,以频繁的考试及残酷的竞争压力将学生和他们的家庭隔离开,更为重要的是将这些学生同其他学生隔离开,用一种“选择性禁闭”挑选并培养精英,既给予他们严酷的苦行,又赋予他们某种卡里斯玛的特征,使他们成为学生中的贵族,具有某种尊严感、荣誉感乃至义务感。[7]

    在大多数同学仍在填鸭式地被动学习时,他们被要求主动进行探究性学习。早在中小学,他们就开始了专业学习,他们像强悍的狼一样,有明确的方向感与兴趣,有多年训练所植入的主动、活跃的心智惯习,在强挑战面前,他们中的优秀者拥有了智力活动的“强度”,这是教育性教学的一个关键特征。智力的强度首先表现为专心致志,他应当明晰地把握每一件事,全心全意地献身于每一件事,以便正确地、透彻地把握它、领会它,这体现了教学的彻底性原则。[8]竞赛生所表现出来的“浓厚的学科兴趣”实指他已经摸索到学科的规律,掌握了学科的风格,风格是一种专业学习的馈赠,不仅有对学科知识的审美感,还有一种发自内心的热爱与赞美。[9]一位数学竞赛获奖者回忆:
    小学六年级第一次看一本数学史,虽然不能都看懂,但很入迷;中学期间反复阅读这本书。在我看来,数学是一个神奇的世界,一个充满简洁的力量与旋律的美的世界。在这个独立的王国,我既能感受到立法的力量,又在其中深感安足。(S03)

    这些提早进入专业的学习者,如今来到推进通识教育改革的大学。他们需要什么样的教育?自主探究与竞赛选拔使他们与学科、与大学建立了或强或弱的联系;他们如鱼得水,进实验室,参加专题讨论课,做本科研究。大二、大三,他们多出国交流,在世界一流大学的实验室做研究,发表SCI论文。他们既是学徒,更是潜力无限的科研新人,他们的目标是全球最顶尖的研究机构。他们需要平台、资源与支持;他们需要导师对问题的判断、见识与智慧——深度专业化所带来的审美感与常识感;他们在读书会上的相互启发、相互督促。他们阅读科学史、阅读名人传记,他们拥有一个自足的科研世界。

    他们以消费心态选修通选课,专业之外的知识,多是杂乱的开胃甜点,或是社交中的谈资、点缀生活的趣味,但这些知识能否进入心智结构,化为积极的养料,又面临不确定。一束强光之下,四周景物黯然。他们选择性地忽略了自己特别倾心的狭小范围之外的东西。加塞特在论及野蛮的专业化时,不无忧虑地指出:
    他是一个科学家,一个专家,他通晓自己方寸天地中的一切,但对自己专业之外的知识又知之甚少;文明使他变成一个专门人才,结果把他禁锢在自己的局限之中,他从未意识到自己的边界。[10]

    专业知识与技能如果不能化为见识、判断与智慧,如果不能转化为智力上的虚心与开放,同样会导致心灵的封闭,而且是一种更严重的智识上的冥顽不化:他们既失去了倾听的愿望,也失去倾听的能力,他们以孤绝卓然的姿态,走向离群索居。知识之于其心智,是异化的工具;他之于群体,是既骄傲又脆弱的存在。

    他们的优越感或许是不自觉的,他们眼睛总是注视那些能给予他们启示、灵感,能给他们激励与挑战的更强的人。他们或许相信,很多人被召唤,但很少人被拣选。他们拥有这个资格,在他们的禀赋、才能与努力面前,世界没有给予否定性的限制,而是激励他们更快地成长。在科研表现的赛场上,他们是百米冲刺的短跑选手;在科学探究的马拉松中,在人生的马拉松中,他们能跑多远?他们将面临什么样的选择?他们被这样期望:世界展现了无限的可能,他们辛苦获得的禀赋与才能成为他们征服世界的工具,知识就是力量,是塑造人生奇迹的力量。这是现代版的“鲤鱼跳龙门”——龙门之后是神秘的科学世界。他们心无旁骛,快速且强悍地成长着,这禀赋与才能甚至还成为一种特权,“碾压”众人,他们被称为“大牛”“大神”“学霸”由来于此。

    在他们的成长中,求真与逐利交织在一起。在他们的热情之中,有献身的热诚也有索取的欲望,有内在的热情也有外在的利益。他们面临专业探究与人格养成之间深刻的冲突,为了在专业领域里快速地崭露头角,他们不得不缩小工作领域,在一个日趋分歧的路径中越走越远,越走越细,他们将如何获得完整性——人格的养成?舍此,他们将在封闭的训练中走向枯竭。所谓专业的特长如果是以苦役、贱役的形式来养成,如果特长的获得是以牺牲均衡发展为代价,在全球科研市场中,他们可能也只是跨国学术市场中的科研技工,不过是童子操刀——柔弱的精神、偏执的意志挥舞着一把锋利的刀。

    当然,真实成长比这个简洁版更模糊含混,充满着分岔,等待他们选择:以竞赛生身份进入,却对学科没有兴趣,过强的竞赛败坏了他的胃口;或以竞赛为捷径,竞赛资格仅为博取新机会。习惯竞赛的表现型短跑选手,如何面对真实科学研究的非功利与不确定、风险与失败?神秘的天赋论究竟能支撑他们走多久?

    “龟兔赛跑”中的赵状元,把中学时代大获成功的学习方法小心地用在大学学习中:
    从不翘课,多做往年的考题,平时多找老师答疑。用尽洪荒之力,专业成绩达到70多分。再用大类平台课的成绩拉高绩点;用通选课、政治课让自己绩点更高。策略是精心选课,尽量扬长避短,打听好哪一门课给分好……最后GPA还可以。(FG07-2)

    “尊重选择”解放了赵状元,他领悟到:
    “清华的规则是:学不好,你还有心思学别的?!北大的规则是:学不好,还不赶紧学点别的!努力很重要,但选择比努力更重要。”

    他大三选修了经济双学位,毕业后去商学院读研究生。他由衷地感慨:“改革的方向很好,学部内自由转专业很好,未来全校自由转专业更好!目前的多种培养套餐不错!老师的时间与精力都有限,不应该平均分给每个人,应该确保做科研的人。”(FG07-2)

    赵状元的专业学习困难在其院长的解释框架中是这样的:
    学生总体学习能力下降,会背着书包上课,课下读书却不会;减了学时后,他不是说这部分没讲,我自己去研究学习;而是闲着也是闲着,我去读个双学位,经济这么热,就读个经济双学位吧。一届160个学生,修经双的有50多个,占三分之一。最有可能的是,学不下去的人,没有目标的人会分流。(D03)

    他们学院提出的培养方案分为四种套餐:第一种,修习了必修课外加大量的数学物理课程,这是科研型的培养方案;第二种,按部就班学完学院所有课程的中间的学生,这是原来的培养方案;第三种,因为学科交叉很厉害,还有一些学生可以去学工学院、环境科学的课程,这是应用型的人才培养方案;第四种,修了三门核心课程外,剩下的任意选,将来可能做的事情和专业完全没关系。(该理学院近四届的学生中,83.2%选择继续深造,其中有46.7%选择出国深造;国内读研的比例为36.5%;拔尖学生出国读研的比例是87%。)

    赵状元自主选择了套餐四。

    03 广泛涉猎与学有专攻

    另一位理科院系的院长(D02)很疑惑:专业课要从80多学分压缩到60学分以下,只能精炼出最核心的部分,这是专业教育的最低要求。学院目前大概有四分之一的学生会继续做科研,他们会多选择学一些本专业课程——并不是要把他们都培养成科学家,培养专家的思维已经变了。挤出来的学分在理学部内部任选其他学科课程,组成不同套餐。但有学生喜动脑不喜欢动手,强硬要求他们上实验课,就很难适应——不能为交叉而交叉,为跨学科而跨学科。强调尊重学生选择,但所有学科都有门槛,进入都有困难,如果怕过不了门槛就转专业,这将是一个大问题。总之,大学四年,掐头去尾,在不到三年的时间里,如何又搞通识又搞专业……

    事与愿违,教学计划中学分压缩后,学生却更忙了。

    钱博雅(YP01)7个学期修了232个学分。她选了中文系应用语言学方向,大二开始修了历史的双学位;大三又从语言学转文学。她主修学位170学分,双学位53学分。她的课程套餐包括:数学、经管、新闻、史双、中文还横跨语言和文学,其间还到台湾交换了一个学期。毕业时,她评价自己抗压力超强:“学这么多还活了下来!经管是被迫学的,财务会计很无聊,混了个及格;社科也是混个学分。历史中国部分认真学,世界史部分就混学分……”(YP01)

    在钱博雅庞杂的课程套餐背后,是专业教育与通识教育结合的艰难。通识教育是与专业教育并列的另一套知识体系吗?是靠跨专业、跨学科学习去实现的吗?院系与专业的壁垒可以靠学生对课程的自主选择去突破吗?

    学生普遍的忙碌与教学计划的变化有什么关系?教学计划包括学分与课程结构,即学分的数量与分布、课程的类型与选课的要求,它是落实人才培养规格的基本制度。在教学计划的调整中,有以下四个变化(参见附录1):
    其一,缩减毕业总学分要求。1990年的教学计划四年制各专业总分数是155~180学分,1995年调整总学分降至150左右。到2003年本科培养计划,要求学分减少到130~140之间。2014年的教学计划中,总学分在140分左右。另外,学分对应的教学时间也在变化,自2002年9月起,教学时间由20周减少到18周,1学分对应的17学时减少为15学时。
    其二,教学组织原则的变化。教学计划调整的基本原则是从按专业组织教学向按院系(或学科大类)组织教学的转变,以实现在院系(或学科大类)内进行低年级的通识教育、基础教育和高年级的宽口径专业教育。大类平台课与素质教育通选课要求不低于28学分。2016年的教学改革方案中已经取消大类平台课,修订后的培养方案中,通识课程与公共课程、专业核心课程、专业基础课程和专业限选课程、专业选修课程与其他学科的必修或限选课程之间的比例原则上为3:2:3:2。(参见《北京大学2016年本科教育改革实施方案要点[试行]》,载《北京大学本科教育综合改革指导意见》,2016年4月5日北京大学校长办公会审议通过。)
    以历史系中国史专业教学计划为例(参见附录2),可以发现压缩学分,学时数减少。如“中国古代史”,1990年教学计划中为12学分、204课时,2014修订为8学分、120课时,课堂教学时间只占1990年代的62.7%。又如“中国现代史”,1990年6学分、102课时,2014的教学计划为4学分、60课时;再如“中国历史文选”,1990为8学分、136课时,2014仍为8学分、120课时。课堂教学的精简要求学生课下有更多的投入。
    降低专业必修课学分和学时之后,低年级的通识教育与基础教育凸显“广泛性”与“选择性”。专业教育与通识教育表现出时间上的相互挤压,学生被迫修习内容庞杂的课程,他们究竟能从课程中学到什么?(哈佛大学在检讨课程改革所标榜的“广泛性”与“选择性”时指出,学生需要在跨度很大的领域之间进行选择,课程目录跨度大,知识体系缺乏内在统一性,不同学科之间就只能进行勉强的协调,最后课程演变成哈佛学生所谓的“煞有介事的各种学术动机盘根错节的网络”,大学四年的课程周旋于不同教授的学术领域之间,到头来却学无所成。参见刘易斯:《失去灵魂的卓越》,华东师范大学出版社2007年版,第20页。)高年级宽口径的专业教育,设置灵活的课程模块,为不同发展取向的学生提供选择。譬如,物理学院的课程设计为深度和广度不同的三类课程模块,分别适应三种人才培养目标,即培养专门从事物理科学研究的人才、具有宽基础的物理知识背景的人才和具有物理知识的应用型人才。[11]
    其三,近半数学生修习辅修/双学位。1987年开始增设辅修/双学位制度,旨在培养培养复合型人才。2016年全校设有26组辅修/双学位专业,全校有1169人获双学士学位,154人获辅修证书(其中,双学位学分为40~50学分,辅修学分为30学分),全校近50%的学生同时完成双学位/辅修课程。其中,获得经济双学位的学生占所有双学位的比例为56.59%。(《北京大学2016届辅修双学位毕业情况统计》显示,获得国家发展研究院经济学双学位/辅修的人数为730人,加上经济学院与光华管理学院,所有修习经管类双学位/辅修的人数为747人,占到全部双学位/辅修毕业人数[1323人]的56%,而文史哲三系双学位/辅修人数合计占比仅为7%。校园流传,“课业闲暇修经双”俨然成为与“图书馆上自习”“康博斯啃鸡腿”相并列的北京大学“三俗”之一。)这意味着近半数的学生实际修习的学分是在180~190之间。
    其四,教育经历日渐丰富与多元,学生更忙碌了。本科科研与出国交流、实习,以及第七学期的保研、推免与申请出国,重要课程与成绩主要集中在前三年。(参见附录3)减学分并未减课程门类,本科生前三年每学期选课门数高达8~10门左右(修双学位的学生达到10~20门/学期)。

    所有的这些措施直接导致课程数量膨胀:课程门类多、单门课程学分小、总学分要求高。因此导致课程量大,课程内容庞杂,课程之间的系统性、连续性受到挑战,知识与时间均易碎片化。

    我们的学分实在是太多了,基本每个学期都要修20多个学分,平均每天都有3—4节课。文科课程文献阅读量相当大,老师要求一节课,课后要配三个小时的研读,如果要认真做,一个学期跟下两门课就不容易了。(FG12-2)

    我跟过一个老师的课,每周一次课阅读一百页上下的英文文本,阅读时间要占六七个小时。如果要写作业,还要反复读,需要更多的时间。一周三四门这样的课,每门课五六小时,课下研读就需要20多个小时;可是,这样一门课学分也就2学分!因此,我们还要再选修7—8门课,才能凑够学分。理工科院系的实验课程学分减半,从前期准备到后期报告撰写,有的实验课要求每周投入5小时以上,可是,它只值“0.5学分”!(FG02)

    北京大学毕业所需的140学分分布在60门课程上,每门课程平均2.33学分,这就意味着一门课程课堂教学时间平均不足35学时。一位哈佛回来的教师说,他在哈佛念本科时,一个学期修完4门课程已经累得不行(P01)。哈佛大学毕业要求的128学分分布约32门课程,每门课程均4学分;斯坦福要求180学分分布约在30~40门课程,每门课程学分在4.5~6之间。(参见北京大学教务部:《2014版北京大学本科生教学手册》;Harvard University: Handbook for Students 2016—2017;Stanford University: Major Requirements 2016—2017。)教学管理者(M02)介绍:学分制是移植美国的经验,在美国学分对应的学时数有严格的规定,一学分要求每周投入3小时,其中1小时课堂学习,2小时课后工作。

    “一个上午如果只有2小时的课,这个上午就只干了一门课的事,时间全都打散了。”(FG08)课下投入时间更不足,据北京大学本科毕业生质量调查(2016)显示,本科学生上课时间平均为每周20小时,课外相关学习时间14.8小时,课上与课下学习时间投入比例为4:3。2017年的调查显示1小时的课堂教学时间所对应的课余投入仅为0.67小时。

    多数同学的策略是:在精力允许的前提下选择几门确有所获的“虐课”,再搭配一些投入时间少、给分高的“水课”,这就是“水课”为什么受欢迎的原因。在焦点团体讨论中,学生们说:
    我为什么要选水课?一个学期那么多门课,有水课,我们才能活下来。(FG18)

    我们要有刷绩点的课,这就是“水课”,上课讲讲ppt,考试考考ppt……ppt就是骗骗他,跟看电影似的,看时高兴,看完就忘,能记住多少?有的课,前两周去听听怎么考核,轮到小组报告时,大家一起做一做,不想做的,搭个便车。考前突击背一背,拿个“正态”;或者多背三天,分数上90完全没问题。我现在修了100多学分,高质量的不到20个学分。学生们对高质量是有定义的,知道什么是好课的,修完后自己综合能力提高的就是好课。(FG12)

    学生需要水课才能活下去,为什么“虐课可以学到东西,通选课却反而越水越火”?(FG09)学生们怎么对待通选课呢?

    上通选课的心态是学校强迫我们去学,我们常遇到的教学是教科书式的,介绍一下人物生平,他有什么思想1234,他做出什么贡献ABCD……譬如XX课,一个老师主持,许多老师来讲,跑龙套式的,……好处是让我们对学科的概貌有了解,不完全没收获,但一个学期下来,还是有点空落落的,很鸡肋。(FG09)

    这涉及对通识教育的理解——通识教育与通识课程之间是什么关系?通识课程的主体——文理素质通选课开设于2000年,当时被称为本科生素质教育通选课。它吸纳了1990年代素质教育理念下的文理互选课、艺术选修课的学分。通选课的上述缘起,使它易被诟病为通俗课——用浅显的方式向非专业学生讲授一些有趣的问题以及学科里的非科学的故事和史话——或通论课——泛泛地讲授本学科的整体概念、结构与方法,点到为止。[12]直到2010开始建设通识教育核心课。

    通识教育在设计上仅在形式上关心自然科学、社会科学、人文科学等六个领域,老师们上课时应该换位思考:一个人文学生,他学自然科学时,需要学的是什么?教师上课时,应该尽量基于门外汉的经验与视角去讲这个课;要把学科真正的趣味与力量,传递出来,能简单地让外行听明白,而不是把我们当成这个专业最菜的学生来教。很多通选课其实是把学生当作专业之外的菜鸟来教。(FG18)

    通识教育不在于课程门类的多与杂,而在于学得透彻。如何才能教得透彻?学得透彻?既能学进去、得到精髓,又出得来、回到自己的经验生活中化为力量?最基本的一条是不能简单地追求数量:
    不是扔一堆书,既不知道为什么读,读后也没有深入的学习和讨论。作为文科生,真正的本科教育是学会怎么挑选书,一本经典,把它读透,用不同的方式阅读,批判性阅读,细致地讨论,用不同视角重构论证,这对学生的能力挑战更高。(SS04)

    怀特海提出两条教学的基本原则:“其一,不要同时教授太多科目;其二,如果要教,就一定要教得透彻。教授大量的科目,却只是蜻蜓点水地教授一点皮毛,只会造成一些毫不相干的知识的被动接受,不能激起任何思想的火花”。[13]这是一种“支离破碎”的知识。

    通识教育是以最快的方式直击一个学科的思维,进而提升能力。能力与知识是什么关系?有悬浮于知识之上的能力吗?为能力而能力训练的课程可靠吗?能力源自“知识的利用”:

    一门人文经典课,找十多部最重要的经典阅读,好的老师不是复述一遍材料,而是引导学生怎样去理解、去阅读材料。老师需要向学生解释:为什么要读这本书?这一章节在学术史及相关领域的位置与贡献——在它之前讨论的问题是什么?它的背景是什么?它回应了什么?拓展了什么?它最新的进展是什么?这些线索让一本书的阅读有了问题感。通过一篇文献,可以对一个领域有基本的把握。(SS04)

    通识教育的前提在于“闲暇”——心无挂障,不役于物。它需要以精、少与慢来达到深入的理解、能力的提升、性情的涵养。在课程数量的膨胀、知识的庞杂、时间的紧张下,学生身心陷入忙碌与焦虑中,与“闲暇”已相去甚远。

    与老师们的本科时代相比,如今的校园到底发生了什么变化?

    老师当学生时,研究宋史,每天看一卷,一段时间就把一本大部头看完了,二十四史从前到后,看得透透彻彻,这是他做学问的功夫。老师常说,一定要有定力,要专注。我想遵照老师的建议,140多个学分,一学期学三四门课,看十几本专业书,滴水穿石,能做出扎扎实实的学问。但一看室友,都修30多学分!我有顾虑啊,万一学问做不出来,其他路也全堵死了!……我们现在哪能像老师当年那样坐得住!校园有各种诱惑,社会有各种压力,我什么都想占全,多数同学心态都这样,尽可能地一直往前冲……就怕有一天,突然发现自己被整个世界淘汰了!(L01)

    钱博雅所在本科学院,旨在探索跨学科的人才培养模式。她最想进入的却是专业学院的学霸圈子,多个院系的课程选择已经让她们白天在不同的课堂、教室中穿梭。一个宿舍四个人,四个不同的专业,跨学科交流只剩下宿舍——这个夜晚睡觉的地方,在这个共处的空间里,共处的时间却极有有限,能把他们拉到一起的共同活动与兴趣更为稀缺。

    在忙碌而碎片的校园时空中,他们朝向不同的目标,擦肩匆匆而过。

    04 考评权力下的表现技艺

    精英的本意就是极少数人,精英的产生正是以对多数人的严苛淘汰为前提的。

    这是一个由各级各类“状元”组成的群体。考试既是他们证成加冕的盛典,又是塑造着他们心智品质、身心惯习的日常战场。身经百战的他们,个个身怀绝技,人人出手不凡。如同老练的猎人,一进入森林,就能嗅出猎物的蛛丝马迹;他们能敏锐地踩准各个得分“点”,又能凭直觉谨慎地避开细小的丢分“坑”,分数战是高妙的出题者与精明的答题者之间过招,鲜有失手。在北京大学,分数又成了高手之间的过招,胜负难料。

    学不懂专业的赵状元,凭借一身应试的好技艺,在专业之外的各种考试中保持不俗的战绩,既填补了专业落下的“坑”,又成功地开辟了一番新天地。

    在教学计划调整的同时,北京大学的考试与评价制度在“严”与“活”两个维度上既明确又谨慎地调整,它体现着对学业完成、知识掌握的尺度与要求,它与教学计划共同落实着人才培养的规格与标准。

    学生们所说的成绩的“正态分布”究竟是什么?又从何而来?1980年代,考试评分标准清晰,维度单一,考试是考查学生对知识与技能的掌握程度。1998年的考试模式改革中,首次引入了“末位淘汰制度”,要求一门课程最后的成绩评定中,优秀率(85分以上)不超过20%,不及格率(60分以下)1%~10%。1999—2006年之间,相关规定各门课程最后确定的总成绩应该呈正态分布,原则上优秀率不超过20%,超过30%则整体成绩无法登录;不及格率不超过10%,超过15%则整体成绩无法登录。(参见《北京大学本科生考试工作条例[征求意见稿]》,2005年11月10日发布;北京大学文件校办258号关于印发《北京大学本科考试工作与学术规范条例》的通知,2005年12月6日第592次校长办公会讨论通过。)2007年又出台新的规定,优秀率一般不应超过30%,不及格率一般不超过10%。(参见《北京大学本科考试工作与学术规范条例》,2007年8月28日第657次校长办公会讨论修订,校发2007第 151号。)这一标准一直延续至今。这就出现整体成绩两头小、中间大的正态分布特征,它既体现着“严”的传统,又是以同伴之间的相互竞争来实现。

    考试成绩“正态分布”原则的确定意味着考试评价不仅考察对知识掌握,更要评价学生在群体学习中的相对位置。“正态分布”是“norm”(规范)的数学形态,它准确地体现着福柯的“规范化裁决”,它不再是一个自然的分数,而是一个人为的秩序。其后的制度逻辑是:大学课程的成绩是相对成绩,是同时学习这门课程的学生之间的成绩的比较,分数成为学生们竞争的稀缺资源。学生所说的“被正态”即指在此人为秩序中的重新排序,或者说分数成为群体中人与人相对竞争的工具。

    福柯指出:考试把层级监视的技术与规范化裁决的技术结合起来。它是一种追求规范化的目光,一种能够导致定性、分类和惩罚的监视。它确立了个人的能见度,由此人们可以区分和判断个人。[14]

    “正态分布”由来于教学实践中总结出来的规律,据多年从事本科教学的理科教授(P03)的观察:

    再优秀的一群人,只要重组,自然形成新的等级,20%~30%的优秀者,他们会非常主动地学习,不需要老师操心;最后的20%~30%,你拖着他们走,都很难;最重要的是中间的大部分,制度如何引导他们。(P03)

    社会科学教授(P05)引用“二八定律”解释理科教授揭示的特征:
    任何一组事物中,最重要的只占20%,其余80%都是次要的:管理学认为企业80%的利润来自20%的项目;经济学认为20%的人手里掌握80%的财富,心理学认为20%的人身上集中了80%的智慧。二八定律启发我们如何设计好考评制度,选拔出最优秀的人。(P05)

    教学院长(D03)建议:
    我们要提高退学率,第一年至少要有5%的退学率。总会有学生被淘汰,考试不及格,他会很痛苦,过去他是最好的学生,习惯被捧着……我们强调以学生为中心,但人文关怀不是妥协。我们要坚持一个原则,大学学习是痛苦的,要克服困难才能完成。否则只会越来越妥协,学分越来越少,课越来越水。一所好大学的本科教育,是提供有挑战的课程与任务,鼓励学生积极向上,帮助他们努力实现最大价值,学校所考虑的学生发展应该定位在此。(D03)

    福柯揭示了考试的实质:考试成绩的正态分布建构了一个比较的体系,既能度量总体现象、描述各种群体,还能计算个人之间的差异以及这些人在某一片“居民”中的分布:[15] 在与他人的比较中,在整体的分布中,学习者个人被度量、被评价、被描述。尽管优秀率已从20%提升至30%,实际操作中默许为不超过40%,分数虽在膨胀,但竞争却没有减弱。“只要守住40%优秀率,每个人都会拼了命地相互比、相互学”(FG13)。

    除了学生群体分数的“正态分布”,学生个体的成绩实施绩点评分制。与国际接轨,1999年开始采取4分制为基础绩点的等级制评估[16](参见附录4):这意味着将百分制过细的评价尺度放宽,在过细的评分标准中,得分点自然细、碎、密。等级评估引导学生不再计较于一分一厘的得失,90分实为最高分值,这意味着学生不必再费力将成绩从90提高到98,有效地纠正了学习效应的“内卷化”——分值越高,投入越大,提升越小,从制度上拒绝盲目追求高分,考前刷题、过度训练等做法,这也意味着可将学生的精力与时间从低效率的重复学习中解脱出来。

    2007年北京大学实施平均学分积点,采用新的计算方法(参见附录5)。GPA的分值由等级制又变成一条连续的、精美的曲线,这是北京大学理科教授们的独创。对比而言,新方法有三个变化:其一,粗化的等级评估(99版的10个等级制)被还原成分值上的连续体,绩点差异从小数后1位变为小数点后2位的差异,重返评分的细密化;其二,各分数段的斜率不同,百分制与绩点的换算率不同,低于84分,绩点加速下降;高于85分,绩点减速上升;其三,满分值从90又被提高到99。

    2007年对等级绩点评分的修改,将模糊化的等级评分重新“精确化”。然而,精确化(precision)绝不等于准确(accuracy)。课程绩点=课程考试成绩×课程学分。在选修制中,学生平均成绩是不同课程中所得分数的平均值,学生不是在同一条跑道上赛跑,而是奔跑在不同的道路上,互不相干。[17]互不相干的课程成绩拉在一起有什么意义?

    学年或总评学习绩点=所学课程学分绩点之和/所学课程学分之和。所有课程参与GPA的计算,就课程对绩点的贡献来看,除了学分大小有差异之外,课程的其他特征都被夷平了:无论课程的必修与选修、专业与通选等分类特征,还是课程的难易度等分级特征,在一些院系的综合评价中,绩点评分涵盖学生工作等“隐形课程”,这意味着课程边界被打破。不同形式的课程都走进校园,平等原则与宽容原则一起建构了一个规模庞大、供给丰富、类型多样的课程超市。

    面对正态分布与绩点评分叠加的考评权力,学习者如何自由选课?绩点如何具有“能见度”?如何运用谨慎的选课来实现自己的策略?理科院长(D03)介绍了一个案例:
    有一个绩点高达3.89的学生来申请奖金学,(我们)一看,几乎所有难的、具有挑战的课程,他都巧妙地回避了,所以成绩单很漂亮。再追问为什么不选有挑战的课?他说,那不是他的兴趣所在;什么又是兴趣?他的逻辑很简洁:兴趣就是被承认,如果不被承认,就说明没有胜任力,自然也就没有兴趣。我得出结论,他不是对知识感兴趣,而是对分数感兴趣,对绩点感兴趣,他选所有的课程都非常有针对性,都是为了绩点。我坚决主张,不给他奖学金,如果我们奖励这样的学生,鼓励这样的做法,我们学校就完了。(D03)

    这就出现了选课的技艺,从斜率来看,GPA定位在3.6,考分即不低于84分,这是相对理性的投入,虽有优秀率的限制,优秀率又在不断地上调。期待适度、宽紧适度的分数评估为学生自由选择留足空间:在理性、精明、甚至积极的忙碌中,用勤奋的多样化学习来逃避持久、深入且专注的学习。学生们这样介绍他们的认识与策略:
    绩点是为了评估人、筛选人而设计的既不准确,更不完美的工具,这个工具既不能反映心灵的品质或者灵魂的品质,也不能反映一个人的学术水平。但绩点不能变成一个逆向淘汰的机制。为确保虐课的时间投入,要学会挑水课。用选课来规避低分的出现,每学期选三四门感兴趣的,认真学,哪怕给分有偏差也能承受。剩下六七门,策略就是选水课,期末综合绩点就不会低。(FG18)

    “水课”不仅指内容稀松,更指分数宽松;如果内容水,分数严,同学选课就有上当感。这就出现了对课程“性价比”的评估,即学习投入与学习产出之间的关系。在课程的性价比背后,学生与课程、学生与教师之间的关系,已经是超市中的顾客与商品、顾客与商贩之间的关系。

    我认为现在的绩点评分是鼓励学生往下走而不是往上走的制度。譬如,数学要求最低是学B,那谁会去学A,学B考90,学A考70,学C考100,那我肯定学C……绩点就是鼓励学生都去学C。难度大的课程,绩点应该乘以1.2,设立荣誉课程,大学的氛围应该鼓励学生努力向上。(这一提案已开始落实, “在学生中积极营造自主学习、自我挑战、实践创新的氛围,条件成熟的院系可通过设立‘荣誉学士学位’和相应的制度,激励学生选修更具有挑战性的荣誉课程并积极参与实践创新,为培养优秀学术人才搭建更高的平台。”见《北京大学2016年本科教育改革实施方案要点[试行]》。)(D05)

    教师批评的“下行”策略,从学生的角度来看,他们有“填坑”的压力。经济学院要求修4门数学课,累计17学分。一名高中读文科的经济学院学生,数学课程绩点没有超过2,一门5学分的课,如果只得了70分,就意味着要用两门2学分的90分以上课程去拉,这就是所说的“坑”。作为“坑”的课程,分值只要低于70分,绩点加速下降;作为“拉”的课程,分值高过85分,绩点减速上升,这就是所谓的“绩点边际伤害递增”——一门课所造成的“坑”要用5门、甚至10门课程的绩点去填。本科四年,他不能申请出国,不敢修双学位,只做了一件事——孜孜不倦地挣分填坑(E01)。

    当课程的专业边界、课程的难易度被忽略,不同学生基于不同的知识基础、不同的学习期待来到同一个课堂,如何在同一门课程中对其进行考评?例如在大类平台课中,既有跨学科学习,也有跨年级学习,学生选课时不仅要挑课程内容,也要挑选同伴群体,选择的难度系数增大,一招不慎,满盘皆输。以下是一封BBS上关注度颇高的投诉信:
    我的成绩并不突出,在学院处于中游水平,希望能够保研本校的研究生,并且我相信,以我的能力和水平,只要认真和努力,就可以获得应有的机会。这个学期,我希望能够提高自己的成绩,接近目标,却万万没有想到,被自己喜爱的法理课打破了希望。这是4学分的大类平台课,课上非专业的学生有很多,我的成绩只得了61分,绩点1.15。
    我承认,作为一个外来院系的同学,在学习法理之前没有任何法学基础,根本无法与那些专业学院大四选课的同学相提并论。当初选课,是基于对法学的兴趣和扩宽视野和知识面的考虑,也不知道会有这种结果。在这门课上,我投入很多,借来上几届同学的笔记和资料,并通读了课程要求的教材和任课老师的著作,好好复习。

    在学业成绩之外,不同院系综合测评的方式不同,有的院系在GPA中加入综合测评,鼓励学生多参与、多服务。一些学生按照学生工作是否参与评分以及分值高低,决定投入的多少——精心计算“得与失”的理性化逻辑贯穿校园生活的每一个细节。一位社会科学的同学(FG05)谈到:“我们院的做法是,在综合测评上,班长、团委副书记和部长加分不能叠加。我当过一个,可以加0.01,后来我又当了副书记,就只加了0.015,有些得不偿失。一入学,学长们就会传经,毕业时要保研、要出国,所有的努力都要使自己的各项指标有亮点。”(FG05)

    如果说“正态分布”用高手之间的过招来确保“严”,“绩点评分”则以自由选择来体现“灵活”;前者用度量、区分来判断个体学习者的位置,后者则利用度量与区分的繁复与灵活,寻求新的自我定位。前者不得不接受的被比较、被定位的“可视性”,在群体的厮杀中尽显惨烈;后者则谨慎运用绩点的灵活组合,重新赢得在群体中的“能见度”。竞争由严酷厮杀,到兴趣的诱惑、策略的谨慎,更为温和而狡黠。

    在考评权力的科学与细密、表现技艺的理性与灵活的共同推动下,任何细小的、能增加荣誉的指标都被放大。托克维尔这样剖析平等导致民主制下人人多怀奋进之心而少有大志:
    所有的人不管能力如何,都不得不在同一个筛子上过来过去,统统经过许许多多预备性的小小实习或训练,从而浪费了自己的青春,使自己的想象力消失。因此,他们不再认为自己有能力充分享用他们有望得到的好处了,而他们终于有能力做一番大事业时,则已经失去了兴致。[18]

    社会给了他们宽阔的舞台,校园没有限制他们的前途,他们自己却缩小了目标。

    05 继承人:寻找与从游

    在大众高等教育中,许多家庭与学生将上一流大学看成是孩子美好前程的“敲门砖”,许多教授却远离、甚至鄙视没有学术氛围的外面世界。[19]师生之间追求的生活目标各异,教师仍是校园里的常驻居民,校园却成了学生的“驿站”。他们穿过本科教育这个“门厅”,是拿到打开专业学院钥匙,还是获得进入职业生涯的通行证?他们是要走进学科之内,成为学术继承人呢?还是借这四年时光,叩响某个圈子的门铃?他们究竟要成为谁的继承人?

    在这所学校,最精英的那群Top Student,一个共同的特征就是最早就明确地知道自己要什么,选择的路不同,挑战也不同。

    要走学术,就盯住Top five 学校。一个即将去哈佛读古典学的同学,他很早就清楚要做学术,关键在于申请国际名校,他绩点超高,在大学四年学了拉丁语、古希腊语;自学了德语和法语。他非常专注,四年就干这一件事,他百分之一百入校第一天就全力投入。

    要想年薪百万,成为人生赢家,就盯住大投行或咨询公司,这一行核心竞争力在于有含金量的实习。

    如果选择仕途,我一个师弟一入学就明确要混学生会、混团学(社团),要在这个江湖里混得风生水起,出人头地,这一行的难点在于要明白自己的身段是否够软,要善于鞍前马后,任劳任怨;凌晨三点大佬电话打来,我们喝多了,你来接;于是颠儿颠儿跑去接了……然后他就真的混出头了,运气非常好,未来很可期。(FG16)

    这是学生们用他们身边事例中展现出的不同的成功目标与路径:他们来路不同,去处各异。短暂的校园时光,他们选择进入不同的圈子以及不同的生涯发展轨道。众多“圈子”的出现,表明象牙塔中的共同体已经裂变;“圈子”的运作,揭示着象牙塔之外的逻辑既侵蚀又重构了校园生活。

    对职业取向的学生,实xi是大学学习的重要内容。学位不断膨胀、学历持续贬值,实xi的履历、研究生的文凭,都是职业市场的符号资本,也是身份的重要指标。“条条大路通CS(计算机科学),万般唯有金融高”,职业市场中对本科就业吸引力最大是高盛、花旗等顶级投行,“少数去顶级投行的‘大佬’把薪酬的平均数拉上去了——对这一群体,再读研究生,是一项得不偿失的投资。”(E02)根据出路的不同,学生不断地选择重组学习经历与课程模块。在高等教育大众化的压力下,复合应用型人才或跨学科培养项目有丰富的组合:人文背景加经双,适合咨询岗位、客户服务岗位;理工科背景交叉金融,针对金融机构的研究岗位有竞争力;新传叠加社会,为培养深度报道的记者量体订身。

    一个哲学专业的同学,目标是投行,他修了经双,大一暑期就去一个经济杂志实习,他的过人之处在于选择做市场,从偏门进去,一步一步往上走;他做过两三个咨询的实xi,人文的本科让他能说会写,尤其长于说服别人,取得客户信任,他已经进入很好的咨询公司,可以独立跑项目了;他又跑去做投行,为了“得到”大三暑期的入职前实习,甚至休学一年。他最终如愿以偿,拿到了香港投行的实xi机会,他也将在那里开始他的事业。(L02)

    对这一群体,如何在有限时间里,使自己的履历可视性更强,亮点更突出?“你的价值在于你过往的经历,实习既是对职业经验的熟悉,更重要的是获得机构的承认——这是你的市场价值。”(E01) 履历上的亮点实为符号资本,其运行逻辑是荣誉法则——超拔于众人之上的更有显示度的指标,它的竞争既是严厉的,更是隐秘的。它需要精英圈子内的榜样示范、观察体悟、不经意地点拨以及关键时刻的提携或推荐。

    室友一进大学,家人就推荐她到了投行实xi。老板亲自带她做深度项目,言传身教。做了一段后,她对投行产生了厌倦,投行搞的是人情,要察言观色,拿捏分寸,总之,大客户就是上帝。学霸出身的她,不愿屈尊去适应这一行。大三中期,她临时决定转金融工程,强大的校友圈给她同样精确地指导,学长推荐她申请到国际投行的金工实xi岗位,她又报了国际名校一些著名的网课,还拿了证书。终于她拿到普林金工的offer。她真的很厉害!(E03)

    多数同学还在懵懂迷糊时,他们清楚地知道所要的目标,以及达成目标的不同路径:从一个明确的、可操作性目标开始,逆向推导每一步,具体到每个时间点所需要完成的任务,整个规划都清晰、简洁。 他们的风格是:直击目标,不走弯路,理性简洁,既不想入非非,更不允许失败,理性的生涯规划让他们快速成长。

    外企中的投行,以本科毕业的身份比较好进。捷径就是大三的暑期实xi,只要表现出色,通过答辩,拿一个return offer,可以直接入职。为了大三的暑期实xi,大一、大二就要开始实xi。(E01)

    履历中的符号资本不仅体现在求职中,更延伸至教育场域,在任何竞争性的选拔中,履历的符号价值均被凸显。教育机构在此已经蜕变为人力找寻中精明理性的“猎头”,猎头的筛选逻辑是清晰的,评估与预期一个年轻人的潜力与未来,依据在于他已经获得的成就,他未来发展的限度取决于他过去的努力与资格中。猎头筛选的操作逻辑是简洁的,一群申请者之间如何排序,需要简单的、可比较的数字与符号,这既可量化、一目了然且程序公正,——这即是市场逻辑所培育出的“履历书写技艺”。福柯曾剖析规训权力对履历的书写:

    长期以来,普通的个性——每个人的日常个性——一直是不能进入描述领域的。被注视、被观察、被详细描述,被一种不间断的书写逐日地跟踪,是一种特权。一个人的编年史、生活报道、死后的历史研究,是他的权力象征仪式的一部分。规训方法颠倒了这种关系,降低了可描述个性的标准,并从这种描述中造就了一种控制的手段和一种支配方法。[20]

    “履历书写技艺”的出现再一次颠倒了福柯上述的规训权力,成为一种主动告白的技艺,迎合检查与评估这一新的权力运行方式,每个人的个性与特征以定量的数字与指标、定性的成就与奖励,以及各种荣誉性的符号来计量、描述,目的在于评估出高低,裁决出胜负。

    在检查权力/告白技艺下,有限的校园被拓展延伸至外部世界的不同层面,校园生活变成多重轨道的折叠:第一轨道是以文凭为表征的学校人才培养规格与教学计划;第二条轨道是自我成长,如何认识自己,如何寻求朋友,如何确定自己的志趣,如何进入社会,这是一个缓慢的、尝试的过程;第三条轨道对应于实习、各种资格考试与证书,以及其后的见识与人脉,构成与知识学习并行的另一重要的学习与实践的台阶,它既是学生职业能力成长的重要环节,也是用心经营的职业敲门砖。

    职业取向的学生再反思自己的本科经历时指出,只按照教学计划与学院的规定来做,根本就没有触及成功的秘笈:
    学校里所学的都是屠龙之术,与我们的需要有什么关系?例如,毕业两三年后,我们有机会、有能力去影响货币政策吗?不可能!最急迫的实务知识只有靠自己去实xi,从做中学。学校课程希望培养我们看问题的方法,但不重视基本实务。理论知识决定你走多远,可实务知识决定你能否进入,没有实务的东西,你根本就进不去。(E02)

    “蚓无爪牙之利,筋骨之强,用心一也”,来自乡村的孙学商(E03) 完成了近乎脱胎换骨的蜕变:
    我从农村考到北大,入学时学校发的校园卡,是全家第一张银行卡。我知道的差距,我会努力去弥补。第一个差距是英语,入学时是哑巴英语。从大一到大三,一千多天,我每天都坚持30多分钟的听说练习,从不耽误。刚开始,我连一分半钟的英语都听不完,因为听不懂,硬着头皮反复听。慢慢开始听VOA,听TED Talks,一步一步,可以大胆说话,可以流利地交流,还争取到去美国的交换机会。第二个差距是言谈举止,风度修养。金融是服务业,长得漂亮、具有文化资本的学生更有优势:见多识广,与人交往更有自信,气质与金融、投行等职业领域更契合。(E03)

    她中学接受的是“应试教育”,除了教材与课本,很少有其他读物。学校推行的通识教育给她打开了一扇扇精彩的窗口,她投入了极大的热情去上通识课,她的阅读也充满着计划性,大四开始选择主要文明国家中最有代表性的作品,一个国家一个国家读,以获得对世界文化地理的真切感受……离校时,她的借书证上显示本科期间总借阅书目为35本。

    视野的差距比纯教育质量的差距更令人绝望,这不是你自己造成的,而是你的出身造成的。不少同学在这种差距面前,泄气、抱怨、拖延、懒散,自我放弃……我不愿意这样,我一直在努力。我高考成绩是我省被录取学生的最后一名,现在是年级前30%。我对自己的进步是满意的。但是,和直接去投行的同学相比,差距是隐性且巨大的。重要的是我不知道如何去弥补。大学四年,我无论怎么苦学都难以弥补的差距,这是人家长期熏陶和积累的资本。我想慢慢改变,最好的方法就是多跟他们在一起,可是这种机会并不多。(E03)

    临近毕业,她才开始明白室友整天在忙什么,对商科学生来说,实习i履历与校园学习如同行走中的两条腿,哪儿短了,都是跛足。她选择继续读研:
    读研对我究竟意味着什么?知识上的增长不过是从中级宏经到高级宏经,如果不从事专业学术研究,这个增长可以忽略不计。对我来说,未来二三年最重要的是做更有含金量的实xi,再以研究生的文凭去找更好的工作——去国企与私募,硕士是准入资格。(E03)

    知识真能改变命运吗?同一个校园,同一张文凭能给我们同样的出身吗?学校里的逻辑能够抵御社会的逻辑吗?这是贫困生焦点小组讨论中学生们困惑:
    今天凌晨,我看到朋友圈的一条帖子:有时候你不努力都不知道什么叫绝望。——好像被戳到了痛处,刚入学时,信心满满,我从农村来,我的中学也没法和你比,但是,我和你来到同一所学校,——奋斗十八年,我和你终于成了同桌。但慢慢认识到:虽然同在一个校园,同上一门课,我们之间横亘的差距是难以缩小的。尤其是视野,前十多年的环境与经历所形成的视野的差距是实实在在地存在的,你认为好补吗?所学的知识看起来不都是客观的知识吗?不都一样选课吗?不都在努力地学习吗?我们只有在一些硬的课程(譬如有标准答案的数学课)差距不大,但在一些较“软”的课程里,譬如论文写作的角度是否新颖、切入问题的角度是否刁钻?是不是有些独特的想法,口试时是否能说会道,这些需要综合能力的地方,立刻就看到差距。(FG15)

    这里的“视野”差异正是布迪厄的“文化资本”:“成功地将先天特性的特权地位与后天获知的成绩结合在一起”,形式上是个体不同的天赋、努力与欲求的结果,实质上主要是以家庭为单位积累并传承的。[21]他们对个人努力的确信遭遇到文化资本排斥,“某种根植于经济和政治秩序的物质性中的历史性任意裁断的社会秩序,经过自我的转换,成为一种智力的贵族统治,每一处外在呈现都反映这种统治,经由社会炼金术的运作机制,社会等级制得以自我掩饰起来,好像是一种人的成就的度量表。”

    体现文化资本的“视野”指知识所转化为人的见识、趣味、辨别力与判断力。长期的熏陶潜移默化地影响人的认知图示、审美趣味以及性情倾向。 文化资本如同一扇玻璃天窗,看似没有障碍,透明敞亮,只有用身心去撞击,在失败的疼痛中才体会到排斥的不露痕迹。

    “什么是真正的不知道?就是你不知道自己不知道。”(FG15)

    学校能给他们新的出身吗?他们要跻身哪个圈子?成为谁的继承人?

    在这样的尝试、观望与选择中,教育该如何发生呢?传统中教育发生于师生之间的从游,“从游既久,其濡染观摩之效,自不求而至,不为而成。”[22]如今的师生关系更似梅贻琦所比喻的“奏技者与看客之关系”,看客如不得其妙,趣味索然,或左顾右盼,心猿意马,奏技者还去追逐讨好不成?没有教师的引导,学生与知识、学科、专业的关系变得更为复杂了。这就涉及一个严肃的问题:学生的自主学习能够替代教师的教育吗?对于大多数学生,制度如果不鼓励他们进入一个学科,获得深度的学习及相应的教育价值,而是允许他们自由地“转专业”,任何学科都有门槛,在“转”的市场逻辑下,学科门槛的高低宽严将如何调整?如果他们不跨入任何学科门槛,在DIY的积木搭拼式的课程套餐中,他们又将获得什么样的教育呢?

    为什么同样的文本,有人读得津津有味,入迷入神;而换一个人,可能索然无味,完全不得其法?这就是学科的门槛:如鱼得水,兴趣盎然者,已经跨入学科的门槛;格格不入、味如嚼蜡者,即在学科门槛之外,或是不得其门径,彷徨在外;或是主动选择,不入学科之内。布迪厄的洞察富有解释力:在学习者的偏好、特长、志趣与学科知识之间,在学习者的心智结构与学科的文化结构之间,有无“亲和的默契感”或者说是“选择性的亲和感”?这是“选择/选拔”的核心机制,这个机制体现在学生一方是基于兴趣与志趣的选择,体现在学科一方则是对学习者的严格筛选。跨入学科之内的“亲和的默契感”体现为浓厚的专业兴趣,这并非专业学习的前提,而是深度的专业学习的结果。它需要课程精心的安排,需要教师的用心引导,需要学习者专心地琢磨,慢慢品味出学科的滋味与精髓,使躺在书本上的静态的知识真正化为自己的一部分,学科知识与人的情感、意志与经验融合在一起,发生化合作用,创造出“新人”—— 这是学科文化的教育价值,学科的思维与眼光如何转化为学习者观察与思考问题“活”的视角,“日用而不察”的概念,以及可靠的知识传统?进而形成生活风格乃至生命态度?即由专业达通识,准确地说是在深度的专业学习中达到通识教育的目的,这是人的教育中最艰难的地方。

    这需要学习者“泡”(长时间的浸泡)、“炖”(煎熬与磨砺),更需要教师们——不是作为知识的生产者,或者是一个匠气十足的专家;而是既活在学科之中,又将学问化在自己身上的教师们——在日常的生活与学术研究中,身体力行地示范与教导。他的见识与判断,他的选择与坚持,他的信念与价值,这才是最真实、最有力的教育。春风化雨、润物无声,获得表层的知识与技能是容易的,教育中真正的困难在于学习者内在动力与热情的培植,以及判断力、辨别力与意志力的养成,它需要学习者“从游”于教师身边,观察、服从与追随。

    在自由选择下,“长时间的浸泡”很难成为对学习者的制度要求。浸泡需要不被打扰,挡住外在的诱惑,一心一意地将自己放进去,先舍弃,再获得。然而,在评估制度所孕育的成功文化看来,这是一种“不计得失”的非理性选择。研究与教学之间的冲突本来就是一个棘手的问题,自由选择想借学生的脚投票,使院系与教师更投入教学。实践中却非常复杂,甚至南辕北辙。

    例如,教师们把学生当作未来的学者——学术继承人来培养:
    人文学科的教学非常精英化,老师预设学生以后搞学术,培养目标都是学术人才,上课的内容完全朝着专业化的道路走。教学中,老师常也只关注那些能跟上老师的思路、能与老师对话的学生,对多数普通学生,对想就业或转专业的同学,老师不太注意,甚至不大看得起。(L01)

    教师们不难以激赏的目光关注那些深谙学科滋味的“准学术继承人”。在进入学科之后的师生关系中,从游乃是典范,如同天空的雁阵,朝一个方向,以大致相当的速度飞翔,他们之间更多是精神与趣味上的同气相求,彼此呼应。但多数普通学生学习的困难、入门的犹豫,制度能否认真地体察、理性地引导?大鱼前导,小鱼尾随,当小鱼不能游、不敢游时,制度安排谁来当教练?当小鱼不愿意跟着大鱼游、在游来游去地试错时,能对自己的选择负责吗?

    虽然学校在推行“导师制”,甚至有院系规定导师每学期与学生见面谈话不少于四次,但是没有共同的活动,没有自然形成的共同体,制度化的师生联系机制常徒有其形。教师办公室的门还开着,预留了office hour,有需要,可预约;老师们还组织了读书会,有能力、有兴趣者可参加,事实上,有自信参加读书会的本科生是极少数;“能够主动去找老师讨论问题的,都是学有心得、学有所获的同学。如果我一直没有跨入学科的门槛,我能与老师主动谈什么?”(FG03)

    高考没有考历史的李人文(L08)被录取进了历史系,高考报专业时,她填报的是社会科学。北京大学历史系的成就让她敬畏,身边同学都似有浓厚的兴趣,她直觉这个水域并不适合自己的生长。

    历史系同学的基础差别很大,有的同学入学就读二十四史、《资治通鉴》;有的同学除了上课,下来不大读书。我介于两者之间,不时还有下降的危险。

    她在参与公益服务中找到了自己的“存在感”:编稿件、写公文,(我)发现自己比较擅长,也能获得肯定,逐渐开始往学生工作方面倾斜。大二上又修了法律双学位,投入专业学习上的精力变少,大二上绩点很低。随后调整学习策略,只选了三门专业课,其他选了大类平台课。因为精力更加集中,大二下学期专业课成绩提高了,大类平台课成绩也都不错,逐渐恢复了信心。(我)认识到专业与双学位无法兼顾,就把法双退了。(L08)

    李人文在专业、双学位与学工之间,不断触摸水域的深浅,小心地调试:
    大二下开始分专业,历史系分为中国和世界两个方向,中国又细分为古代和近现代史两个方向。我选了近现代史,一是因为中国古代史和世界专业史门槛很高,一个需要古文基础好,一个需要外语(好),中国古代方向门槛尤其高,基本都是学霸。因为中国近现代和现实联系更密切,(这)让我更有兴趣。分专业之后,我的专业课分数都不错。保研时又面临再次选择:一是自己不适合学历史,二是还是想学社科。为什么说不适合学历史?按照刘知几有史家三长论——史才、史学、史识,针对我自己,我认为自己史学薄弱,掌握的历史知识太少,史才、史识更难具备。特别是史识,如果没有老师的点拨,我很难在历史和现实中建立联系,这是我一直以来的困惑。如果再继续读本系的硕士,可能会更专更精,对自己整个人的提升却不大。再反思自己,很难克服只见树木、不见森林的状态,也很难将历史和现实建立联系,归根到底还是自己基础不扎实,不能融会贯通。于是保研时转了社科,准备走职业路线。(L08)

    本科的历史学训练给她这样的影响:
    一是使人不虚妄,虽然很难达到以史为鉴的境界,但心里有历史的尺度,虽然上面的具体刻度可能模糊不清;二是增强判断力。比如看到信息,会下意识地去看出处。结合第一点,我觉得比较幸运的是虽然难以达到“真”,但可以驱除许许多多的“假”。(L08)

    未跨入学科之门的学生如同“小蝌蚪找妈妈”,在不断找寻中,磕磕跘跘地完成自己的“蜕变”。在人文场域,需要老师与课程的“引导”;也需要自己的“体悟”与“实践”,李人文在从游与寻找之间,慢慢完成了自己的“蜕变”。

    06 自由选择:试误与成长

    周竞赛(S05)本科毕业时,父亲批评他:“冶游四年,不学无术”。

    周竞赛自幼热爱科学,竞赛拿到一等奖。他被理学院严格挑选出来,再经过严格的培养与教育,有望成为学术“继承人”。

    他曾有浓厚的专业兴趣,他不喜欢刷题,习惯自己从教科书的原理出发,通过实验、推理,探索学习的过程。一进入大学,期中考试就栽了,高数只考了50分,登录成绩是开了根号的75分。这门5学分的课程让他整个一年都在“填坑”。大一上修了23.5学分,上课与实验时间加起来每周约45小时;实验课从早上10点一直做到晚上;大一下有两门实验课。学习压力太大,有同学甚至每天只睡3~4小时,困了趴在桌上睡,醒来继续写……刚从高三过来,学习的辛苦并不是最大的障碍。

    理学院对他提出更严格的身心要求,“继承人”的塑造需要付出更高昂的代价:强制学生遵循一丝不苟的学习方法,严肃朴素的生活习惯,以个人生活的极大牺牲,实践在知识学习和社会交往两方面的禁欲苦行……[23]科学场域正是用这样的方式将“惯习”——与科研相适应的性情倾向,体现在人身上的历史——烙在其成员的身上,成为他的第二天性。面对这个“锻造”的过程,周竞赛疑惑了:
    “这不是我想要的大学生活啊!我想象的大学生活,可以读自己想读的书,可以交友、恋爱……”(S05)

    科学场域的教育主要发生在实验室里,如同蜂巢一般,围绕科学研究,组织严密、分工有序,它的教学模式是严师高徒模式。科学场域需要他全身心投入,可他不再把这看成是一个充满意义的世界,他把苦恼告诉师傅,他想学管理。师傅听了,真诚地说:“先拿到科学博士,再从事管理也不晚。”他有些愤怒,他把这称为科学的“沙文主义”:“万般皆下品,唯有科研高。在老师眼里,为什么要去修‘乱七八糟’的经双?这完全是功利的选择,孺子不可教也!”(S05)

    与外部世界的丰富有趣相比较,实验室的生活太单调乏味了。周竞赛决定背弃严厉的师傅,慢慢且坚定地从被他喻之为“斯巴达式”的教育中退场,他成为理学院中的“转行党”。放弃科研,这种挫折感是双重的:
    不是智力有问题,就是品德有问题,师傅说:这意味着不敢面对挑战,不敢正视困难。转专业真的意味放弃与懦弱吗?对自己的兴趣是否忠诚?成绩不如人真的是努力不够或者智力有问题吗?(S05)

    周竞赛们陷入了两难:承认是对信心的致命打击,不正视就找不到适合自己的选择,他们不敢怀疑自己以竞赛获奖或高考高分进入时,做了一个错误的专业选择,因为那意味着对自己的否定甚至是背叛。他也不愿面对“态度有问题”之后,来自专业的承诺、责任与义务等的责难,他更不会正视“忠诚自己的兴趣”中的“兴趣”是真实的还是虚妄的?——这是他可以说服自己的唯一理由。

    他们还遭遇到来自同学的蔑视,转专业这件事在同学中意味着心理上乃至身份上低人一等,学生群体中存在着撕裂。

    决定留在理学院但不再做科研后,理学院一切评奖以及别的机会都与我无关了,我不能得到学院任何积极的培养。它只是给了我自由,即不禁止,不阻碍,但没给任何引导。我后来做的一切,好像是自己偷偷地,不能光明正大地放在台面上讨论,我过得到底如何,没人过问。(S05)

    他在叛逆的内疚与诱惑的吸引中艰难地走出第一步,大二开始修经济双学位。经济双学位不像师傅所鄙夷得那般不堪,他喜欢社会科学的思维与视角,帮助他认识与理解身边的社会与人事。他开始对专业课彻底“放水”,他踏出去的脚步迈得越来越远。大三开始,他接手了一个濒危的社团,他的热情与投入使社团重新焕发活力。利用社团这一平台,他能自然结交家乡与北京的本省籍精英;社团给他一个实验场,他仔细地学习待人、处事、识势,他体会到了权力与金钱的力量,他看到权力怎么做事,也看到金钱怎么操作权力。社团使他提前走上社会的大舞台,他开始站起来,体会到做事的能力,成长的力量。他选择了一个社会科学院系继续读研,准备读完博士之后,出来创业。

    学工教会我的是通用的能力,知识是固定的,能力是迁移的,我“不学无术”而“活动于社会”是找到了成长的法门。知识与能力是成长的两条腿,缺一不可。(S05)

    他在专业学习之外,摸索适应社会的能力与成长逻辑。他先似一个弃儿,后像一个浪子,纠结地成长。大学毕业时,从校长手里接到“理学学士”证书时,他感到愧对世界一流理学院中最扎实的专业教育,他没能把一个专业学透学通。短暂的愧疚之后,他又充满热情地瞄准下一个目标。

    游历的不仅仅是从实验室中出走的周竞赛,郑古典(L05) 用“试错”来定位大学的意义:
    我的兴趣就是三分钟的热度,这想搞搞,那也想搞搞,这是性格特征。85%的同学都不知道自己想要什么,我现在差不多知道想要什么了,用了四年来试错,试错完了,该毕业了。你再也没有这么丰富的资源、这么多的机会去尝试了。(L05)

    她来自一所著名中学的文科实验班,以全市前10名的成绩考上北京大学。郑古典从小接受素质教育:
    幼儿园就有英语口语,高三时晚自习还看小说《三体》,看英文电影“Rain Man”,玩游戏。与那些来自封闭的县中,能适应高强度的训练且坚韧不拔的同学相比,我绝对不会用坚韧和不懈努力这类词来形容我自己。(L05)

    回顾四年前的入学动机,她有四重考虑:第一,北京大学的本科文凭;第二,学习基础学科,本科学的专业与今后的职业没什么关系,要打下扎实的基础,因此选择基础学科;第三,父亲告诫她,北京大学的校友人脉很重要,要求她加入社团,认识一群官二代、富二代,这很现实。第四,大学四年,应该留下一段自由的青春回忆,很开心地玩了四年。

    毕业时,再评估本科四年,她用“浪”来描绘自己的状态。“浪”首先是一种心气,她挑战成功者,她曾经是他们中的一员,她深谙成功的标准与成功的策略:成功者的选择是基于成功的考虑,在自己胜任的范围内不断用成功重复成功,或者固执地待在自己舒适的区域内用舒适延缓舒适。她选课都是基于兴趣,她敢于选择最新的培养模式,她参与跨学科项目,她不在意课程的难度与分数,选了很多挑战大、难度高且得分虐的课。

    “浪”还是一种探索与叛逆,要敢于按照自己的节奏走,探索形成自己风格。她以既独立又依赖、既理性又任性的方式,与父母的权威、与制度的规范对话:
    从小到大,花精力最多,做得持续最久的一件事就是和家长进行博弈吧,这是我人生的权利。之前家里管得严,刚入学的时候,天天就是玩。经常喝酒,喝到一两点钟;然后去混混社团、混混BBS;然后想干嘛就去干嘛,混团学,打游戏,又做实习……然后,大三就结束了,才开始说,要不然就出国算了;然后,又开始准备出国……(L05)

    “浪”并非她个人的状态,而是一个时代的风尚以及这一风尚下教育所滋生的一代人的基本性情。托克维尔在分析民主对人的性情影响时,指出有一种无知是由于知之过多而造成的[24]:
    他们的生活被即兴的力量所支配,他们往往在这种力量的支配下去做他们没有学会的事情,去说他们根本没有理解的话,去从事他们没有经过长期学习的工作。他们不能对每个目的都有清晰地认识,所以容易安于一知半解。他们的好奇心既永无止境,又是容易得到满足,因为他们所热望的是尽快知道很多东西,而不是深刻地认识这些东西。他们没有时间,而且主要是没有兴趣去深入研究事物。注意力不集中的习惯,应该被视为民主精神的最大缺陷。[24]

    大众高等教育充分尊重这即兴的力量,以及这既永无止境,又安于一知半解的好奇心,他们被尊称为“消费者”。以“尊重选择”为名,大众高等教育既满足又培养新的教育消费者,既诱惑又塑造着他们的欲望与惯习。消费者热衷于追求的过程,他们总喜欢尝试新的,不同的事物,他们喜欢的是追逐本身。在“浪”的飘飘然中,未来、方向感成为有问题的提法,未来被理解为“现在”,“现在”用种种选择既敷衍了未来,也回避了过去,时间的链条被消解为一系列的叠拼的、断裂的“片段”,在一个个细碎的、没有因果关系、没有前后连续性的片段中,他们忙碌地消费着、体验着、迷失着——这就是成长吗?

    我就这搞搞,那搞搞,如果在国内找工作,随便找个月薪八千、一万的工作混一混;如果出国,申一个不算名校的名校,找个不太热门专业混一混。其他同学呢?他们学习很认真,成绩也不错。但不也是这门课学一学,那门课听一听,社团弄一弄,恋爱谈一谈……其实也是这搞一搞,那也搞一搞,然后,他们可能就是比我多挣两千块钱,或者去的学校排名高些,专业热些……他们那么努力,最后结果不也差不多吗?(L05)

    理斯曼(David Riesman)在分析社会结构与社会性格的关系时,提出了富有启发的视角:当社会心理不再是“匮乏心理”而是“富裕心理”时,极易出现“他人导向”的人格特征[25]。他们主要的心理约束是一种无处不在的焦虑,其控制装置很像雷达——敏锐地捕捉时尚与潮流,既与时俱进,也随波逐流。

    一个人可以在试错中成长,一个群体呢?都需要在试错中成长吗?制度给他们提供什么保护与引导?而非仅仅是允许其试错?教育的作用呢?它不应简单复制市场的自由选择逻辑,教育制度不同于一般制度的教育性如何体现?它应引领社会风尚,而非迎合社会风气,教育的权威在于引领社会,引领的根基在哪呢?

    中国教育一直在检讨年轻一代批判性思维不够,我们从小被鼓励大胆质疑,但很少被要求小心求证。随意地批判什么、怀疑什么是容易的,我们真正的困难在于选择相信什么,没有可以相信的东西,就没有办法在这个基础上继续往前,无论是科研,还是做别的事情……(S02)

    如果我们的教育不能为成长中的心灵安置一台“心理陀螺仪”——内在导航的动力机制,让他们既有航行的方向感,也有可以锭锚的方位感,而仅仅是用所谓的批判与怀疑精神“把诸神和英雄投射在洞穴岩壁上的影子从想象的心灵中抹去,这只会抽掉其精髓,削弱其力量。学生们甚至在没有任何信念之前,就学会了怀疑一切信念。”[26]他们变得头脑空洞,心灵空疏,准确地说,生命真正的困境在于不知道可以真诚地相信什么,确定什么,在推倒一切的虚无中,生命的热情如何寄托?自由选择可以是持续地选择,用后一个选择推翻前一个选择,在教育的消费中张显所谓的自由个性;自由选择更可能是不做选择,准确地说是从众,用大众的选择代替自己的选择,用社会的流行代替自己的判断:
    为什么要选商学院?因为既不知道热爱什么,也不知道不热爱什么,不幸高考成绩又这么高,有什么理由违背父母期待、挑衅社会的常识?(E01)

    进而,再用成功遮蔽成长,所有的热情都被调动,角逐于分厘得失之间,小心地回避困境,谨慎地避开挑战——如同在试卷中小心地绕开丢分的“坑”,精明地找全得分的“点”,填写人生的试卷同样需要精明的“眼光”:他们是既谨慎又轻佻的书写者,他们是看似活跃的教育缺席者,他们也是看似成功的失败者。

    当然,更多的选择是延缓选择,甚至是延缓一切。与忙碌症相伴随的拖延症,同样如流感般流行:用茫然来面对茫然,用焦虑来逃避焦虑:
    将来怎样无所谓,就算有一个目标,也会特别拖延,快乐一时是一时,明天的痛苦给明天吧。(FG13)

    拖延是把今天从对未来的担忧中解放出来,活在当下的慵懒、轻松与焦虑中,时间同样失去了连续性,挫折是细小的,但每时每刻都在。

    吴不为(L03)来自乡村,大学一二年级,他认真学习,成绩不错;参加户外协会,足迹踏遍京郊山水,谈了一次恋爱……“大三以后开始颓了,突然感觉整个人很懒散,不太清楚自己想干什么了。”(L03)他的本研论文写庄子,毕业绩点在3.3左右,算中等偏下,够保研资格,但他不愿意像多数同学那样用读研来延缓选择。他主动选择了去支教两年,他希望用两年时间想清楚,他到底要干什么。他是一个消极的退却者吗?他是一个积极的行动者吗?都是他,真实的成长或许就是这样。

    “心理的陀螺仪”究竟如何置放?它需要舍弃,才能获得;需要服从,才有引导;需要学习,方得教育——将自主的个体接续到传统中,在谦卑中感受伟大的力量。

    丁修远(SS04)是理学院的学生,入学后确定自己希望从事的是基础学科,转专业成功,同时降级为社科院学生。大二开始修社会学双学位,毕业时原本想直接申请古典学方向的博士,因为准备不充分,又延缓毕业一年,“不应该着急,慢慢积累,再有一个时间能够缓冲一下,能够写出足够好的研究。”他用六年时间完成了本科学习,中间出国交换过一学期,修了221学分,经历了从自然科学到社会科学,再到人文学科的跨学科学习。他明确了研究方向,找到了一生从事的志业。

    我真的耗费了最宝贵的六年时间才找到了真正的研究问题,最后一两年才慢慢开始知道应该如何去学习,怎么样去听课,跟哪些老师学习,怎样去看书,怎样做研究,这是一个非常漫长的试错过程。(SS04)

    六年的本科经历不仅是学习中的寻找,更是不断地辨析,甚至背弃家庭及其后社会的期待:
    我来的地方比较偏远,我的家庭对高等教育的期待不过是社会流动的跳板,用我们地方的老话就是“兴盛了”,家人看你上北大了,就是要当大官了,挣大钱了……庆幸的是,这些年我的(价值观)有了很大的改变。

    本科培养了一种独立思考的能力,不是人云亦云,在浮夸或拜金的社会,能找到让自己定下心来、自己想干的事情,这是我最大的收获。人生是一场很漫长的赛跑,北大的自由与包容给了我这个空间,对自己心境有一种磨炼,不太计较一时的得失。(SS04)

    在这里,他找到了传统,找到了伟大的老师。他感受到了神召,即韦伯意义上的以学术为志业,这是一种与“天命”——个人不得不接受的、必须使自己适从的、神所注定的事。[27]在这里,他是被拣选,而非自由选择。这是一份激情,一种奇特的“陶醉感”:
    没有这份热情,没有这种你来之前数千年悠悠岁月已逝,未来数千年在静默中等候的壮志——全看你是否能够成功地做此臆测——你将永远没有从事学术工作的召唤,你们应该去作别的事情,因为凡是不能让人怀着热情去从事的事,就人作为人来说,都是不值得的。[28]

    07 结语

    本文讨论的问题聚焦于研究型大学本科教育中的人才培养。在北京大学的案例凸显了通识教育与专业教育的关系。随着素质教育、通识教育、博雅教育的话语不断变更,在专业人才、复合型人才、跨学科人才的不同定位中,通识教育与专业教育出现形式上冲突、实质上割裂的状态:在有限的学分与学习时间之内,两者之间有竞争关系,如果通识教育仅仅体现为“广泛涉猎”,略知皮毛,实际上更有可能“博而不通”,专业教育也将“专而不精”。

    这需要我们重新认识通识教育与专业教育的关系。通识教育与专业教育并非割裂,通识教育既不是专业教育的基础或土壤,也不是专业教育的结果。通识教育与专业教育之间是彼此融合、共同成就的一个过程。怀特海指出:“在学习中,不存在一种课程仅仅传授普通文化修养知识,而另一种课程仅仅传授专业知识。为普通文化修养教育而设置的科目,都是需要专门学习的特殊课程;另一方面,鼓励一般心智活动的方式之一,就是培养一种专门的爱好。不能把这种浑然一体的学习过程进行分割。”[29]

    通识的核心观念是“文化”:即“以文化人”,是知识对人性的培植,它常是深度学习与专业学习的馈赠。我们在人才选拔中所强调的“浓厚的学科兴趣”,在学科文化结构与个人心智结构之间“亲和的默契感”正是专业学习的馈赠:那些“眼睛发亮”的学生们,他们不仅在知识的精确阶段上求精,更突出的是在“综合运用”阶段,他们获得了掌握原理之后的自由感,他们可以不再拘泥于知识的细节,而是获得规律运用中的力量感、风格体验后的美感。通过高强度的学习,不仅由“专”走向了“精”,进而将学科知识化为人性的塑造与人格的养成。本科教育的核心是人的教育,塑造新人是其最核心的使命,教育的任务不仅是认识外在世界,参与或建设外部世界,更重要的是在我们身上建设一个新的教育世界,即不断提升人性,培植道德人格。

    教学与育人不是割裂的,而是一体的,它要求所学的知识一定要能回返铸造人的智力与心灵:它要和人的感知、情感、欲望、希望,以及调节思想的精神活动联系在一起。只有让人既能浸入其中又能回返于人的知识,才是有意义的知识;否则,仅是外在的信息,一个人拥有再多的信息,再见多识广,对他的智力生活、对他的内在精神世界也是无用且无趣的。

    通识教育是一种融入专业学习中的能力教育,如何获得知识背后的能力——激发求知欲、提升判断力,对复杂环境的控制力以及运用理论知识对特殊事例做出的预见与判断。[30]这是通识教育的内涵,如何引导学生真实地学习,将外在的知识化作自己的经验,将躺着的知识化为认识的力量,大学教育的目的正在于此。它是深度学习所获得的判断、见识与审美,它建立在学科基础上,是对学科风格的感知与欣赏, “风格帮助人直击目标,富有远见,提升力量,而不陷入细枝末节之中,不被不想干的事物所打扰;风格是专家所独享的特权,风格是专业化学习的产物,是专业化对文化的特殊贡献”[31]掌握了风格即掌握了学科的精髓。通识教育不仅体现在审美层面,还在智慧与信仰层面,智慧来自于知识运用所获得的自由感,责任感来自于知识所赋予个人的力量感,敬畏感来自于感受到的传统——让个体和超越自我的东西融合,对价值的认同会给生命增添难以置信的力量。如此,才能从“眼睛发亮”提升为“灵魂有光”:所学懂的知识让他感受到发现世界的喜悦,所学的东西在帮助他理解生命中所遭遇、所筹划的一切“发生”,这个学习的过程既安静又激动人心,既困顿又壮丽。学习的过程必须是专注且深入的,兴趣必须在此时此刻被激发,能力必须在此时此刻训练,人格在此时此刻被涵养。教育需要细节,需要艰苦的训练,这是一种需要在细节的掌握上耐心又耐心的过程,是沉浸于时间之流中自然而缓慢的过程,学习无捷径。

    然而,在大众高等教育的背景下,在学习者自由选择的消费逻辑下,“艰苦的训练”与“刻苦地努力”易被回避,主导选择的与其说是“兴趣”,毋宁说是极易与兴趣混淆的“有趣”或“诱惑”。“有趣”与“诱惑”正是杜威所批评的“用快乐去行贿”,在这样的诱惑中,学生的注意力不能持久地集中,意志力不会得到培养。“提供多样化的选择”要区分于“令人眼花缭乱的诱惑物”,如果这投向外部世界的形形色色的兴趣不能再回转过来,再形成人格的统一性,从而具有“教学的教育性价值”,就会出现赫尔巴特所担心的状态:“我们是否会跌入轻浮的境界呢?轻浮者每时每刻都是另外一种人,至少他每时每刻都染上了别的色彩,因为他本来就根本不是固定的。他热衷于表面印象与幻想,从不把握自己,也从不把握他感兴趣的对象。”[32]因此,他需要严格的教育:他需要专心致志的活动,他应当明晰地把握每一件事,全心全意地献身于每一件事,不应当把各种各样杂乱的痕迹刻画在他的心灵上;他还需要审思,审思将一种专心活动与另一种专心活动汇合起来!人格的形成正依赖于专心,依赖于审思,依赖于积累。[33]学生主动的学习、自由的选择都不能替代教育。他既需要明确的培养计划、稳定的学院文化,以及教师的权威引导。

    在这出教育改革的大戏中,演员是学生们,故事的主要情节是基于学生成长的自由选择,情节的关键却是制度的选拔,而这出剧所讨论的主题则是大众高等教育中精英究竟如何培养。导演却是两股既无形又无处不在的力量:教育的逻辑与理性化的逻辑——两者之间的对峙、交锋、抗争、妥协,主导着故事的起承转合。舞台已不再局限于象牙塔内,而是置身于社会的中心,高等教育已深度卷入、嵌套于社会的多重逻辑之中,它已经成为国家发展、全球竞争的核心机制。

    另一方面,理性化还表现为消费主义重构了校园教与学的日常活动,这体现为学生的“自由选择”:无论是专业选择的冷与热,还是课程的性价比,绩点评分的理性经营。更进一步,在以“学生为中心”的自由选择下,师生关系被扭曲为“奏技者与看客”、课程贩卖者与用脚投票的消费者之间关系,教育的权威性被解构了。消费主义还体现为充分尊重一知半解的好奇心,用体验替代探索,用成功遮蔽成长,用“即兴”的片段组合消解时间的严肃性与心智的专注性。

    教育的逻辑在顽强地抵御着,它体现为对学生兴趣与志向辨析的细心、“广泛涉猎”与“学有专攻”间平衡的小心,“由专业达通识”背后化育的耐心,以及对继承人锻造培养的精心中。当然,它直观地显现于学习者对知识的沉潜与入迷,它体现为舍弃与获得、选择与拣选、服从与引导的成长中,个体接续于传统后所获得的自主性以及谦卑地服从中所传递出的伟大力量中。

    教育的逻辑还表现为教育者理智的清明与务实的谨慎,这是一所承载着伟大传统的学校。我们希望这艘巨轮能凭智慧与勇气走出一条新路。近一个世纪前,鲁迅先生在纪念北大建校27年时,写过这样的话:

    北大是常为新的,改革的运动的先锋,要使中国向着好的,往上的道路走。[35] 

    本文原载《北京大学教育评论》2017年第4期。

  • 饶毅:生物专业适合普通家庭、智力一般的学生

    作为生物学教师,特别是需要注意招生工作和学生毕业出路的老师,十几年来,我一直关注生物学学生的生源和就业情况。

    高考后,很多人希望知道学习什么专业意味着什么,而各种跨界的意见谬误很多。

    生物学适合于普通家庭、智力一般的学生选为本科学位,毕业之后可以有多种选择、而且适合一般家庭出身的智力中等的人。

    生物的职业前景跨度较大:做的好,可以有高尚的追求成为造福人类、取悦自己的伟大科学家;做的一般,可以成为生物技术产业的普通从业人员。

    1)科学智力特高,可以做纯数学家或理论物理的学生不宜学生物。

    生物很多需要实验,而生物应用的数学也是简单而又简单,不适合这批学生,因为他们不会有特长而被实验所烦恼和耽误。当然,这是指很少一批人,不是任何中学的数学尖子都能算作这批人的行列。需要与北京大学的数学系的学生比较,如果进不了每年全国数学前100名,恐怕就不要认为自己可以做纯数学家。也就是说全国大多数高中数学第一名并不能保证可以成为纯数学家。当然可以用数学里面最简单,简单到一部分纯数学家认为不是数学的统计,统计是很多认为自己可以做数学家,但后来发现不可能而可以用于很多职业的一门技能。也许,统计是全部科学中有着最广泛职业应用的学科。

    生物只在很少的时候和学科发展节点出现过非常聪明的人起关键作用的情况。如1886年的孟德尔、1953年的克里克。其他时候,不是不需要一定智力,但作用较小。

    成为数学家,在中国还必需在少数几个高校念本科,否则也就可能荒废。

    成为生物学家,在中国很多大学念本科都可能。特别是,中国有些农业大学也是优秀科学家的摇篮,这一点很多人想不到。农业大学的遗传分析,教的比很多生命科学学院和几乎全部医学院都更好,这种农业大学培养的本科生就更好。例如,中国农业大学本科毕业成为真正科学家的可能性大于协和医学院(强调:真正科学家)。

    我和施一公改变了北大清华的生命科学教学,一方面是真正懂科学的老师大大增加,一方面我们强调教学改革,从以前的背书填鸭教学,到需要思考。但是,我们教学改革的成效,还需要时间、需要历史证明是否有效:北大清华的生命科学本科生是否就确实因为我们的教学而不同于其他学校。

    2)家庭社会经济状况不够好(指大学期间和大学毕业后马上需要接济家庭经济的学生),学生物会有困难。

    3)家庭社会经济状况特别好的学生,是否学生物,取决于个人爱好。但生物不能带来家庭的简单预计,不会很容易出人头地,也不会很容易升官发财。如果家庭社会经济状况特别好的家庭父母开明,后代有自由选择。如果家长有不良预期,就不会很舒服。

    4)对于智力一般、家庭经济状况一般(不需要在大学期间和大学毕业后几年内接济家庭经济)的高中毕业生,学生物不用特别智力、不靠后台,主要是自己一辈子靠自己努力。

    5)学生物在本科生后每一个阶段的预期很稳定,也不费钱,还长期有一般的经济保障。从研究生开始,一般就不用家庭负担。

    6)本科生物内容有,而且不学不会,学了就有专业基础。不像有些专业,学了与没学对以后的职业没有太大差别。

    本科生物的核心是遗传学、生物化学、分子生物学、细胞生物学。这些课程需要一定的大学化学基础。而数学和物理基本是高中程度的复习(当然可以以大学版本出现)。

    如果学习不够好,可以反反复复多学这四门课,反反复复读四本教科书,也能胜任技术员工作。

    当然,如果学的更多、懂得更多,基础更好、前沿更好,前途更好。

    7)如果生物学本科毕业后出国读研究生,不仅比其他专业都容易,而且不需要家庭负担,全部学费可以由外国学校或院系、实验室支付,还有足够自己和配偶生活的助研费。

    8)如果留在国内读研,现在也比较容易。生物学大量缺乏优秀研究生来源。以前出国的很多,现在即使出现转折,从北大清华开始都有相当一些留在国内读研究生,整体研究生需求还是很大。

    全国前二十的大学,其生命科学学院一般每年一百多本科毕业生(少数有两百多的)。而北大和清华每年招收生物学的研究生就有600以上。北大清华本身是生物的研究生远多于本科生。

    可想而知,科学院很多研究所都难以获得足够数量的优质生源。例如,某年,有些非常出色的研究所,招收大量的来自烟台大学的本科生读研。这不是特例,而是中国大量需要生物学研究生的现状所造成。

    北京大学每年需要生物学的研究生:

    生命科学学院几十(以前称为所谓老体制,实际现在也是新体制了)

    交叉学院下的:生命科学联合中心(CLS)近百、PTN(北大清华北生所)几十、与北京脑科学中心联合接近二十、定量生物学中心十几

    心理与认知科学学院的部分研究生也可以是生物背景的

    化学学院的化学生物学方向的研究生部分是生物学背景的

    未来技术学院和分子医学研究生也有几十

    昌平实验室在北大交叉学院每年也招生,实际也是生命科学方向

    北大清华之外,西湖大学、上海和南方科技大学等新型研究型大学,北京生命科学研究所、北京脑科学中心、首都医学科学创新中心,国家实验室有三个是生命科学的(北京昌平实验室、上海临港实验室、广州呼吸病实验室),其中北京昌平的迄今无疑领先。深圳医学科学院、深圳湾实验室。中国科学院在北京、上海、昆明等地的十几个研究所。各个大学的生科院。

    9)生物研究生不仅来源于综合大学生命科学学院,也来自医学院的基础医学部、农业大学的一些专业。我国农业大学的遗传经常教的优于生科院和医学院,经典遗传分析大有用途,比基因测序有用的多,可以从考分较低的农学院入本科之后研究生到比较好的大学和科研机构读研究生。

    农业大学是我国特色的院校,如果选对专业,学到扎实有用的内容,可以对以后的科学生涯很有益处。

    北大的博士生如果在国内就业,很多地方对于吸引北大博士有优惠。

    10)生物学博士毕业后,一般需要做一段时间的博士后。在国外和中国现在都是实验室资助。中国以前博士后数量不多、工资很低,现在很多单位都改观了。目前,国内博士后一般年薪至少二十几万,有些到40-50万的单位和实验室(也与年资和优秀程度有关)。因为一些单位博士后完全由导师决定,所以名额不是问题,而收入差别可以较大。

    北京市对博士后有非常优惠的政策。他们在校期间享受教授的子女入学附小附中政策,结束后可以落地北京户口。

    外地也有吸引北京博士后的优惠。

    11)生物的博士后做完,可以申请国外、国内大学和研究机构的助理教授或研究员。中国的生物学教职很多,各个大学每年都在招收。现在至少有几十个单位的年薪和研究启动经费都比较好。比较这些单位的时候,目前真是要比较前景,而不是比较眼前给的经费(大多数人经常犯这种只看眼前的钱的错误,而且劝不动,后来发现自己吃了近视的眼前亏)。可以说,有些单位在年薪上都可以与美国相比了,甚至更高。当然,一般人会不相信,但事实就是这样。

    现在中国也出现了一个正常的健康现象:科学特别好的单位,年薪要低一些,而希望加强科学质量的单位、在有条件的情况下愿意提供更高条件。这一点,哈佛早就是这样,但中国是近年才出现。十年前,中国科学质量好的单位也是年薪最高的单位,现在不一定了,而出现负相关是对的。单位的质量就是整体条件的一部分,单位质量还需要提高的只好用其他条件来弥补。

    12)不做博士后、甚至不读研究生的本科毕业生,也可以加入生物技术产业。

    中国真正是生物技术产业第一次小起飞就是这近7、8年。以前很多是编的故事。只有在中国药监局改革后、加上其他几个原因,中国的生物技术产业才第一次小起飞。到前几年非常热。但去年下半年开始进入冬季、现在是寒冬。

    热门的地区特别是苏州。可以说,苏州做得好的人,当时北京、上海很多企业想去苏州挖人。

    热门的时候,投资过多,重复太多,原创太少。但员工福利曾经猛增,有些企业可能过多福利。甚至有些背景很一般而且很年轻的从业人员,当时也出现尾巴翘上天的怪现象,当然并非多数。有些国外企业管理经验的人,担任国内企业高管后也出现收入可以进入华尔街前几名的现象。

    冬天后,过度的、不合理的逐渐被挤泡沫,是良性的循环。没有危机周期的行业是不健康的行业,有热就应该有冷。

    国际上生物技术产业周期性规律预示着中国的生物技术产业过几年会再度出现高潮,第二次高潮。以后可能与国际一样,每过几年一次循环。循环冲击创业人员大于冲击从业人员。

    北大清华都有一些本科、研究生毕业的生物学生创业,有些看上去很不错。

    与所有其他产业一样,创业不容易,各种各样的问题,最后成功的很少。但从业却不难,做一般员工容易。

    中国生物技术产业类似信息产业的领先企业还没有确定,但猜想不会超过十几二十年就应该基本确定、至少出现或清楚。

    咒骂生物专业的北大清华学生基本没有了,当然外地还有很多学生认为生物是坑,不过那是落后的表现。

    有些行业已经饱和、甚至正在过气,但学生和家长趋之若鹜,说明井底观天的人有时是多数人。

    也许,多数时候多数人都是井底观天而自以为是?

    作者系北京大学生物学教授