您的购物车目前是空的!
作者: deepoo
黄海:爵刑之间:秦及汉初的二十等爵与刑罚特权
赏与罚向来是古今中外社会治理的基石,古代中国自然也不例外。正如《白虎通·五刑》所言:“悬爵赏者,示有所劝也;设刑罚者,明有所惧也。”[13]437-438爵赏能鼓励民众向国家引导的方向靠拢,而刑罚则处罚不向这一方向靠拢之人。在社会治理的具体过程中,二者多有交集,即爵赏与刑罚的互相抵偿。二者互相抵偿需要具体的规定,此类规定在古代中国早已有之,并发展出了“官当”等极富特色的制度。在这一发展与流变的进程之中,战国秦汉时期基于二十等爵制的相关规定在其中扮演了极为重要的角色。
战国秦汉时期,国家权力急速上升,出现了二十等爵制①与律令制两种制度。二者分别是几乎适用于全体臣民的爵赏系统与刑罚系统。通过这两种制度,国家将爵赏与刑罚整合进了集权体制的社会管理之中,以此为治理国家之大纲。两种制度在具体运行的过程中多有重合,亦即本文所谓的“爵刑之间”,此时,则有具体规定用以规范二者的关系。
秦汉时期拥有爵位之人在特定情况下可以在刑罚方面得到优待,此点学界并无争议,但对于相关规定的种类以及具体的运作细节,仍然有不少问题需要继续探讨②。本文将主要就以下三个方面展开讨论:首先,秦汉律令之中与爵刑相关的规定都有哪些类别;其次,刑罚产生是否一定会造成爵位变动;最后,这一时期有关爵刑规定形成的历史动因为何。
需要注意的是,中国古代的法律体系与现代法律体系具有根本性的不同,故而本文所言的刑罚并非现代法学定义下的刑罚。本文定义的刑罚,是国家基于惩罚犯罪的目的,长期、稳定且在一定范围内普遍使用的处罚方式。
一、律令体系中与爵相关之刑罚规定
律令体系中与爵相关的刑罚规定主要有“爵减”“爵免”“爵赎”及“夺爵”四类。前三类规定见于张家山汉简《奏谳书》案例十五所引的一条汉初令文,即“令:吏盗,当刑者刑,毋得以爵减、免、赎”[1]353。令文将三类规定总结为“以爵减、免、赎”③。“夺爵”则多见于出土与传世文献。适用于这四类刑罚规定的主体均为有爵位之人,以下试对其逐项进行分析与讨论。
(一)爵减
除上文《奏谳书》所引令文之外,“爵减”亦数见于文献,兹举例如下:
明当以贼伤人不直,况与谋者皆爵减完为城旦。(《汉书·薛宣朱博传》)④[14]3396
鬼新(薪)萧登,故为甲渠守尉,坐以县官事欧笞戍卒尚勃,谳,爵减。(肩水金关汉简73EJT3:53)[2]33
千臧五百以上,爵咸(减)。(居延新简E.P.S4.T2.50)[3]884
由以上诸例可知,“爵减”确实作为一类规定存在于秦汉时期的司法实践之中。
“爵减”当是因爵减轻刑罚之意。在目前所见的秦汉出土文献之中,以爵位得到刑罚减免有不少具体体现⑤。不过,对于“爵减”的具体减刑方式,学界仍然未能达成共识。讨论的焦点在于“爵减”是减免肉刑,抑或降低刑等。日本学者冨谷至认为,有爵者得以减免的刑罚是作为附加刑的肉刑,而在肉刑废除之后,减免的对象替换为服刑之时需要佩戴的桎梏⑥;徐世虹先生则通过分析上文提及的《汉书·薛宣朱博传》相关记载认为,汉律中存在“爵减”为减刑等之例[4]12-17。该问题至今仍然难有定论,正如徐世虹先生所言,“就目前见知的资料来看,尽管爵减的事例有所增加,但是在某种材料的内部以及各种材料之间,还不能获得一个确切、互通的说明”[4]17。我们只能确定,依据“爵减”的规定,当事人会在刑罚上得到某种方面的减轻。
那么,当事人在适用“爵减”以后,其爵位是否会降低或消失?前引《汉书·薛宣朱博传》中有云“况与谋者皆爵减,完为城旦”,颜师古注云“以其身有爵级,故得减罪而为完也”。颜师古之注似乎可以理解为两种意思。第一种是“用爵位来减罪”,按照这一理解,则爵位肯定会降低或消失;第二种是“因拥有爵位而得以减罪”,如此则爵位不一定产生变动。
《汉书·薛宣朱博传》所载案件亦见于《前汉纪》,《汉书》中有关“爵减”的记载,《前汉纪·孝哀皇帝纪上》作“况与谋者皆削爵减死”[16]489。《前汉纪》将“爵减”记为“削爵减死”,“削爵”一词即表明“爵减”时爵位肯定会发生变动。在出土文献之中,也存在适用“爵减”带来爵位变动的证据,前引《肩水金关简》云“鬼新(薪)萧登,故为甲渠守尉,坐以县官事欧笞戍卒尚勃,谳,爵减”[2]33。萧登在处刑过程中适用了“爵减”,则其在犯罪之前定有爵位,而在其被“爵减”后,身份被降为“鬼薪”⑦,爵位已经消失。综上,适用“爵减”应会同时造成当事人的爵位变动。
(二)爵免
“爵免”,亦见于《奏谳书》案例十五所引令文,其意为因爵位免除罪责。
目前所见律令之中有一些关于“爵免”的规定,兹列举如下:
欲归爵二级以免亲父母为隶臣妾者一人,及隶臣斩首为公士,谒归公士而免故妻隶妾一人者,许之,免以为庶人。(《秦律十八种·军爵律》简155至156)[5]55
捕盗铸钱及佐者死罪一人,予爵一级。其欲以免除罪人者,许之。捕一人,免除死罪一人,若城旦舂、鬼薪白粲二人,隶臣妾、收人、司空三人以为庶人。(《二年律令·钱律》简204至205)[1]171
诸诈伪自爵免、爵免人者,皆黥为城旦舂。吏智(知)而行者,与同罪。(《二年律令·爵律》简394)[1]242
由以上记载可知,“爵免”的适用不限于当事人本人。当事人可以除去本身所有或应当得到的爵位为代价,选择免除自己或其他罪人的刑罚,即简文中所说的“自爵免、爵免人”。关于爵位等级、所免之人的身份、人数及罪名之间的关系,律令中的规定也非常详尽,如上引《秦律十八种·军爵律》规定,当事人以削去两级爵位为代价,可以将其亲父母中的一人免去隶臣妾身份,成为庶人。而上引《二年律令·钱律》中则规定,当事人以应得之爵为代价,可以选择免除其他罪人的刑罚,据罪名不同,所能免除刑罚的人数亦有不同。
“爵免”之“免”在律令中亦可记为“免除”或“除”。
记为“免除”之例,见于上引《二年律令·钱律》的条文中,以爵免除他人之罪便写作“免除罪人”。另外,《二年律令·贼律》云“贼杀伤父母,牧杀父母,殴詈父母,父母告子不孝,其妻子为收者,皆锢,令毋得以爵、偿(赏)免除及赎”[1]105。此处“偿”通为“赏”⑧,爵赏均可用以免罪,故而在律令中可以连称⑨。此条律文亦可证“免”可称“免除”。
记为“除”之例,见于岳麓秦简以下条文:
令曰:吏及黔首有赀赎万钱以下而谒解爵一级以除,[及]当为疾死、死事者后,谒毋受爵,以除赀赎,皆许之。其所除赀赎[皆许之其所除赀赎]过万钱而谒益[解]爵、[毋受爵者,亦许之,一级除赀赎毋过万]钱。其皆谒以除亲及它人及并自为除,毋过三人。赀赎不盈万钱以下,亦皆许之。(《岳麓书院藏秦简(五)》简138至140)[6]113-114
由此条可知,“爵免”之“免”亦可记为“除”,且“爵免”也适用于免除因为经济刑而产生的债务。
在能适用“爵免”的情况下,当事人可以自主选择是否使用有关规定,上引诸条文有“欲归爵二级以免亲父母为隶臣妾者一人”“欲以免除罪人者”的表述,其中的“欲”字便表明了当事人具有是否使用这一规定的选择权。概而言之,“爵免”更像是当事人以爵位为对价与国家进行的交易,若当事人选择不交易,则其不用付出爵位上的代价;若选择进行交易,则会以爵位的降低或消失为代价免除自身或他人刑罚。
(三)爵赎
“爵赎”亦见于前述《奏谳书》所引之令文,按照其字面来理解,似乎可以解释为“以爵赎罪”。然而,若如此理解,则其与“爵减”“爵免”在语义上有所重合,在律令中势必难以明确区分。故而,“爵赎”之意或可另求他解。“爵赎”当是“因为爵位而得以用赎刑替代本刑”的意思。换言之,拥有一定爵位之人,可以使用赎刑来替换自己本来应得的刑罚。
秦汉时期的赎刑分为两种,分别是独立刑罚、特定身份之人的替代刑⑩。第二种赎刑之中的“特定身份”,便包含爵位。目前所见的相关记载如下:
臣邦真戎君长,爵当上造以上,有罪当赎者,其为群盗,令赎鬼薪鋈足;其有府(腐)罪,[赎]宫。(《法律答问》简113至114)[5]120
在《法律答问》的该条记载中,身份为“臣邦真戎君长”之人可以用“赎鬼薪鋈足”替代群盗罪应处之刑罚,用“赎宫”替代腐刑。尽管此处当事人的特殊身份为“臣邦真戎君长”,但其适用此规定的原因是比照了爵位,即“爵当上造以上”,故而可以推知对于爵位是上造以上之人,法律也当有以赎刑替代应处之刑的规定。由此可知,当时确实存在因为爵位身份而得以用赎刑替代本刑的规定,这应当便是所谓的“爵赎”。“爵赎”的具体范围与适用规则,目前因为材料所限,仍不得而知,但其当确实存在。
(四)夺爵
“夺爵”一词常见于文献之中。根据目前所见材料,其主要可以分为以下两类。
1.迁戍与夺爵并行
秦代与迁戍并行的夺爵见于《岳麓书院藏秦简(三)》“为狱等状四种”的“绾等畏懦还走案”中:
……夺爵以为士伍,其故上造以上,有(又)令戍四岁,公士六岁,公卒以下八岁。[《为狱等状四种》简244(2)][7]169
由以上记载可知,秦代存在迁戍与夺爵并行的情况。类似记载亦见于传世典籍,以下试举几例:
武安君白起有罪,为士伍,迁阴密。(《史记·秦本纪》)[15]269
十二年,文信侯不韦死,窃葬。其舍人临者,晋人也逐出之;秦人六百石以上夺爵,迁;五百石以下不临,迁,勿夺爵。(《史记·秦始皇本纪》)[15]298
即令国中:有生得毐,赐钱百万;杀之,五十万。尽得毐等。卫尉竭、内史肆、佐弋竭、中大夫令齐等二十人皆枭首。车裂以徇,灭其宗。及其舍人,轻者为鬼薪。及夺爵迁蜀四千余家,家房陵。(《史记·秦始皇本纪》)[15]294
第一条史料中,白起受到了“为士伍,迁阴密”的刑罚,对于“为士伍”,如淳注:“尝有爵而以罪夺爵,皆称士伍。”由此可知“为士伍”即“绾等畏懦还走案”中的“夺爵为士伍”,白起所受刑罚为“夺爵”与“迁”。第二条史料中,吕不韦的舍人参与其葬礼的,若其为秦人且为六百石以上,则会被“夺爵”且“迁”。第三条史料中,嫪毐之舍人四千余家被处以“夺爵迁蜀”的刑罚。
由此可见,秦时律令中存在迁戍与夺爵并行的刑罚,但这一刑罚方式至汉初是否仍然存在则有所疑问。汉初律令中的疑似相关记载,有如下一例:“博戏相夺钱财,若为平者,夺爵各一级,戍二岁。”(《二年律令·杂律》简186)[1]165其中规定的刑罚为“夺爵各一级,戍二岁”,学界对其仍有不同的理解方式。有学者认为“戍二岁”前缺“毋爵者”三字(11),按照这种说法,本条的“夺爵”与“戍二岁”便是对有爵之人与无爵之人两种不同主体的刑罚。若不补“毋爵者”三字,则本条规定的刑罚便是“夺爵”并行“戍两岁”。
2.单行夺爵
夺爵亦可作为处罚单行。在这一情况下大略可分为两种类型,即作为刑罚,或作为赦免后的处罚。
(1)刑罚
单行的夺爵作为刑罚,屡见于律令简之中,以下试举两例:
□□坐一□,丞、令、令史、官啬夫吏主者夺爵各一级,无爵者以(?)官为新地吏四岁。(《岳麓书院藏秦简(五))》简269)[6]187
大(太)史、大(太)卜谨以吏员调官史、卜县道官,[县]道官受除事,勿环。吏备(惫)罢、佐劳少者,毋敢亶(擅)史、卜。史、卜受调书大(太)史、大(太)卜而逋留,及亶(擅)不视事盈三月,斥勿以为史、卜。吏壹〈亶〉弗除事者,与同罪;其非吏也,夺爵一级。史人〈卜〉属郡者,亦以从事。(《二年律令·史律》简482至483)[1]302
作为刑罚单行的夺爵于传世文献中亦有例证,如《汉书·武帝纪》云“(元鼎五年)九月,列侯坐献黄金酎祭宗庙不如法夺爵者百六人”[14]187。
(2)赦免后的处罚
夺爵作为刑罚以外,还可作为当事人被统治者恩赦之后的处罚出现,即最高统治者在恩赦当事人免予应处之刑罚以后,再以夺爵的方式对其予以处罚。这种来自最高统治者的恩赦具有极大的偶然性与随机性,缺乏普遍性与稳定性,故而该种类型的夺爵并非刑罚,而只是一种处罚。
这种类型的夺爵见于宣帝时期丞相邴吉之子邴显之事,该事载于《史记·张丞相列传》与《前汉纪·孝宣皇帝纪四》。《张丞相列传》记载该事为:“(邴显)后坐骑至庙,不敬,有诏夺爵一级,失列侯,得食故国邑。”[15]3256尚无法明确看出“夺爵一级”为恩赦后之处罚。《孝宣皇帝纪四》则记为:“(邴吉)子显嗣,有罪,上不忍绝,削爵为关内侯。”[16]351表明了宣帝因邴吉之大恩,在其子显犯罪以后“不忍绝”,故而以诏书的方式定其处罚为“夺爵一级”,且给予“得食其故国邑”的优待。丞相韦贤与魏相的嗣子情况亦与邴显相类,同样是“坐骑至庙,不敬,有诏夺爵一级,为关内侯,失列侯,得食其故国邑”[15]3255-3256。
对当事人恩赦之后再以夺爵处罚,这种情况的当事人应该罪行较重,因为罪行较轻的话似乎并无必要专门进行恩赦,宣帝在处理邴显之事中“不忍绝”的态度正暗示了这一点。成帝时对陈汤的处理亦可证明此点:
汤下狱当死。太中大夫谷永上疏讼汤曰:“……今汤坐言事非是,幽囚久系,历时不决,执宪之吏欲致之大辟……非所以厉死难之臣也。”书奏,天子出汤,夺爵为士伍。(《汉书·陈汤传》)[14]3020-3021
汉成帝时,太中大夫谷永向皇帝上书,为下狱当死的陈汤说情。皇帝听从了谷永的建议,释放陈汤,并将其“夺爵为士伍”。陈汤在本案中所当之刑本应为死刑(“汤下狱当死”),但皇帝对其予以恩赦,免除了死刑,而代之以夺爵的处罚。
综上所述,作为刑罚的夺爵有两种形态,即与迁戍并行或单行。此外,夺爵亦可作为统治者对有罪之人进行赦免后的代替处罚。因为无爵之人是无法适用夺爵的,所以夺爵在某种程度上也可以算是对有爵之人的优待。
二、刑罚是否必然造成爵位变动
通常来说,当事人受到刑罚似乎必然伴随着其人爵位的降低或消失。《汉旧仪》载“秦制二十爵,男子赐爵一级以上,有罪以减”[23]85,仿佛也明确了这一传统说法,即刑罚与爵位一定是相互关联的,受到刑罚意味着爵位降低或消失,但实际上仍有例外存在。
(一)爵位不变动的条件
在刑罚发生的同时,爵位不发生变动,以逻辑推之,应当同时满足以下两个条件。
1.罪不至刑徒
爵位与刑徒在秦及汉初处于同一身份体系之中,而一个人不会同时拥有两种身份(12)。换言之,若某人因罪而变为刑徒身份,则其爵位身份自然消失。正因如此,若当事人在犯罪之后要保持爵位不变,则其所当之刑罚肯定轻于身份降等为刑徒,如此才可能继续保持爵位身份。
这是刑罚发生之时爵位不变动的第一个条件,以下简称条件A。
2.未以爵位获得刑罚优待
秦及汉初因爵位得到的刑罚优待,其本质是以爵位为代价换得刑罚上的优待,也即爵位与刑罚具有对价性。故而,无论是“爵减”“爵免”还是“爵赎”,一旦实行便会造成爵位的变动。若要刑罚产生之后爵位不发生变动,还需满足一个条件,即当事人未以爵位获得刑罚优待。换言之,当事人在被处以刑罚时,并未使用“爵减”“爵免”及“爵赎”等有关规定。以下简称本条件为条件B。
在现实之中,当事人不使用这些条款以获得刑罚优待的情形,可分为以下两种。
(1)不能使用
在一些情况下,律令会专门规定不能使用“爵减”“爵免”及“爵赎”等有关规定,即当事人不能以爵位获得刑罚优待。以下简称这一情形为Ba。
明确规定不得适用“爵减”“爵免”“爵赎”的记载,主要有如下诸条:
妻杀伤其夫,不得以夫爵论。(《二年律令·具律》简84)[1]125
贼杀伤父母、牧杀父母、殴詈父母,父母告子不孝,其妻子为收者,皆锢,令毋得以爵偿(赏)免除及赎。(《二年律令·贼律》简38)[1]105
诸无名数者,皆令自占书名数。令到县道官盈卅日,不自占书名数,皆耐为隶臣妾,锢,勿令以爵、赏免。(《奏谳书》案例十四)[1]351
盗赃值过六百六十钱,黥为城旦。令:吏盗,当刑者刑,毋得以爵减、免、赎。(《奏谳书》案例十五)[1]353
以上几条史料之中,《奏谳书》两案例所引条文中当事人应处之刑均为徒刑,即身份降为刑徒;《贼律》此条的适用主体是“妻子为收者”,也会被降为徒隶身份;《具律》此条规定了妻在“杀伤其夫”的情况下不得在刑罚方面以夫之爵位受益,并未说明妻在这一情况下应处之刑。不过《贼律》简33所载条文规定,“妻殴夫”即会被耐为隶妾[1]103,“杀伤其夫”的行为较殴打更为严重,所处刑罚只会更重。
由此可见,尽管上引诸条均满足了“未以爵位获得刑罚优待”这一条件,但其规定的刑罚均比较重,不满足前述的条件A(“罪不至刑徒”)。不满足条件A,意味着当事人降为刑徒身份,在此情况下,当事人爵位当然会消失。若要寻找符合Ba以及同时符合条件A者,需要重点关注法定刑罚较轻的条文。
(2)当事人选择不使用
除了律令规定不得适用“爵减”“爵免”“爵赎”以外,造成当事人未以爵位获得刑罚优待的还有一种情形,即当事人选择不使用“爵减”“爵免”“爵赎”等规定,以下简称这一情形为Bb。这种情况出现的重点在于当事人具有是否使用优待规定的选择权。由本文第一部分可知,在“爵减”“爵免”“爵赎”之中,明言当事人具有选择权的是“爵免”。正因如此,若要在律令中寻找符合Bb的条文,可以重点关注“爵免”相关条文。
(二)赀赎之刑与爵位变动
如上所述,若要刑罚产生而爵位不发生变动,需要同时满足条件A与条件B,而条件B的实现可以分为Ba与Bb两种情形。通过以上分析,我们明确了重点找寻方向,即法定刑罚较轻、与“爵免”相关的律令。
1.岳麓秦简五“解爵除赀赎”令
通过查找,在目前所见秦及汉初律令之中,确有满足以上条件者。
《岳麓书院藏秦简(五)》简138至简145有如下条文:
令曰:吏及黔首有赀赎万钱以下而谒解爵一级以除,[及]当为疾死、死事者后,谒毋受爵,以除赀赎,皆许之。其所除赀赎[皆许之其所除赀赎]过万钱而谒益[解]爵、[毋受爵者,亦许之,一级除赀赎毋过万]钱。其皆谒以除亲及它人及并自为除,毋过三人。赀赎不盈万钱以下,亦皆[许之。其年过四十五以上者,不得解]爵、毋受爵,毋免以除它人。年睆老以上及罢癃不事从睆老事及有令终身不事、畴吏解爵而当复爵者,皆不得解爵以自除,除它人。鼎者劳盗〈盈〉及诸当拜爵而即其故爵如鼎及拜后爵者,皆不得解其故爵之当即者以除赀赎。为人除赀赎者,内史及郡各得为其畍(界)中人除,毋得为它郡人除。[中]县、它郡人为吏它郡者,得令所为吏郡黔首为除赀赎。属邦与内史通相为除。为解爵者,独得除赀赎。(《岳麓书院藏秦简(五)》简138至145)[6]113-116
这一令文规定,当事人可按一级爵万钱的标准,抵偿赀、赎之刑给自己或他人带来的债务。此条规定当是“爵免”的一种,本文暂称其为“解爵除赀赎”令。
以爵免除赀赎之刑,规定之重点大略如下:(1)须向官方申请,即“谒解爵一级以除”“谒毋受爵,以除赀赎”;(2)须向本地官府申请并由本地官府执行,即“内史及郡各得为其界中人除,毋得为它郡人除”;(3)以爵免除赀赎对免除之人有人数限制,即“其皆谒以除亲及它人及并自为除,毋过三人”。
此外,令文对几类人以爵位折抵赀赎之刑有所限制,分别为:(1)“不得解爵以自除、除它人”的五类人,即“年过四十五以上者”“年睆老以上”“罢癃不事从睆老事”“有令终身不事”“畴吏解爵而当复爵者”;(2)“不得解其故爵之当即者以除赀赎”的三类人,即“鼎者劳盈”“诸当拜爵而即其故爵如鼎”“拜后爵者”。可见一些特定人群不得解爵以除赀赎,这一规定并非适用于全体有爵之人。
2.“解爵除赀赎”令与爵位不变的赀赎之刑
首先,就本条令文而言,其所规定的刑罚是赀赎,明显轻于身份降等为刑徒的刑罚,故而其满足条件A。其次,解爵以除赀赎一定会造成爵位变动,故而若当事人在被处赀赎之刑的情况下爵位未变,意味着当事人未使用解爵除赀赎的规定。按照本条令文的规定,被处以赀赎之刑的当事人未解爵以除赀赎的情况有两种,他们可以分别对应上文所言的Ba与Bb两种情形。
(1)令文规定禁止“解爵除赀赎”
“解爵除赀赎”令限制一些特定人群以爵位抵偿赀赎,这种情形即Ba。令文中列举的特定人群,上文已有述及,即“不得解爵以自除、除它人”的五种人,包括“年睆老以上”“罢癃不事从睆老事”等人,“不得解其故爵之当即者以除赀赎”的三种人,包括“鼎者劳盈”“拜后爵者”等人。令文限制这些特定人群使用爵位抵偿赀赎之债,意味着这些特定人群在被处赀赎刑之后爵位不会改变。
(2)当事人选择不解爵除赀赎
这种情况符合情形Bb。当事人对于是否解爵以除赀赎,可以自己进行选择。“解爵除赀赎”令文中明确规定,当事人欲以爵位为代价免除赀赎的,需要“谒解爵一级以除”“谒毋受爵,以除赀赎”,即要向官方进行申请报告。若被处以赀赎之刑的当事人选择不依照此条向官府申请,其爵位当然也不会改变。
3.赀赎之刑后可能爵位不变之旁证:秦刑徒墓瓦文
被处以赀赎之人爵位可能不变,于考古上亦有发现可为旁证者。秦始皇陵周边的赵背户村秦代刑徒墓(13)中出土有相当数量的瓦文墓志,其中一些刻明了葬者详细个人信息,包括家乡名、刑名、爵名及姓名等,例如“东武居赀上造庆忌”“平阴居赀北游公士滕”[9]6-7。这些瓦文墓志所刻葬者多被处以赀赎之刑,即墓志上所刻的“居赀”(14),同时依据墓志可知,他们仍有“公士”“不更”等爵位。居赀之人仍有爵位,可能性有两种。一种可能是其解爵除赀赎之后,爵位只是降等而并未消失,其减刑依据的律令或许正是岳麓秦简五的“解爵除赀赎”令;另一种可能是服刑人中出现了上文所言“解爵除赀赎”令中的两种情形,即Ba与Bb。在这两种情形之下,当事人未以爵位免除赀赎之刑,且在未交纳赀刑对应的金额之后,选择了居赀,所以出现了居赀之人爵位未变的情况。
通过以上分析可以得知,秦及汉初刑罚的产生并不必然造成爵位降低或消失,是有例外存在的。岳麓书院藏秦简五中的“解爵除赀赎”令便清楚地显示,在某些情况之下,赀赎之刑的发生不会造成爵位变动。
三、与爵相关之刑罚规定何以产生
通过梳理战国秦汉时期以二十等爵为基础的相关刑罚规定,对其有所了解之后,接下来可以对此类规定产生的深层历史动因进行初步探讨。
(一)与爵相关之刑罚规定的历史渊源
1.宗法社会的解体与“以功赐爵”的出现
战国秦汉时期与爵相关之刑罚规定的制度基础是二十等爵制,而此类爵位系统则是集权体制形成过程中的产物。
在二十等爵这类适用于全民的爵位系统产生之前,爵位系统为五等爵制(15)。五等爵制之下,有爵之人是通过与统治者的亲缘关系得到爵位,其余民众则难以获得爵位。此类爵制以宗法社会为基础,符合宗法社会重视血缘与姻缘的传统。春秋战国之时,宗法制逐渐开始向集权制过渡,五等爵这种爵位制度也逐渐不再适应社会实际。至集权体制渐至成形的战国时期,各国统治者急需本国臣民提升参与战争等国家事务的积极性,以满足自己争霸的需要。如何提高臣民的积极性?诱之以爵赏无疑是很好的办法,所谓“臣下竭力尽能以立功于国,君必报之以爵禄”(《礼记·燕义》)[17]1452,正反映了这一点。
这种旨在提高臣民积极性的以功授爵措施或在春秋之时业已出现。《左传·襄公二十一年》云“(齐)庄公为勇爵”,杜预注此为“设爵位以命勇士”,即设立爵位作为勇士的奖励。至战国之时,“庶人之有爵禄,非升平之兴,盖自战国始也”(《盐铁论·险固》)[18]526,面向全体臣民的以功赐爵已较为普遍。
通过以功授爵的方式,于国有功者即可获得爵位,爵位面向的人群不再局限于与统治者有亲缘之人。在各国君主的驱动下,以功赐爵的现象在战国普及开来,并逐渐制度化,最终在秦国发展出了二十等爵制。
2.爵相关刑罚规定的出现
伴随着“以功授爵”式爵制的出现,与爵相关的刑罚规定亦开始产生。战国时期成篇的《墨子·号令》对此便有所反映:
城外令任,城内守任,令、丞、尉,亡,得入当,满十人以上,令、丞、尉夺爵各二级;百人以上,令、丞、尉免,以卒戍。[19]601
收粟米、布帛、钱金,出内畜产,皆为平直其贾,与主券人书之。事已,皆各以其贾倍偿之。又用其贾贵贱、多少赐爵,欲为吏者许之,其不欲为吏而欲以受赐赏爵禄,若赎出亲戚、所知罪人者,以令许之。[19]610-611
守入城,先以候为始……不欲受赐而欲为吏者,许之二百石之吏,守佩授之印。其不欲为吏而欲受构赏禄,皆如前。有能入深至主国者,问之审信,赏之倍他候。其不欲受赏而欲为吏者,许之三百石之吏。扞士受赏赐者,守必身自致之其亲之其亲之所,见其见守之任。其欲复以佐上者,其构赏、爵禄、罪人倍之。(16)[19]611-613
以上三部分史料,第一段是说令、守、尉在守城之时有防止人员逃亡之职责,并根据逃亡人数的不同,对令、守、尉应被科以何种处罚进行了规定。其中逃亡之人数超十人时,他们会被科以“夺爵二级”之罚。第二段在说民众在官方有事之时交出私有财物,事毕以后可以获得的好处。其中规定相关民众在事毕以后有成为吏、受爵赏或赎免他人之罪三种选择。第三段在说刺探敌情的“候”在立功之时应如何奖赏。其中的“其不欲为吏而欲受构赏禄”句,孙诒让认为“禄”前缺“爵”字,应为“欲受构赏爵禄”,甚确[19]612。对立功之“候”,当亦有与第二段之规定相同的三种奖赏供其选择(“皆如前”)。
上引史料第一段的“令、丞、尉夺爵各二级”可证夺爵之刑在此时或已出现,而由第二、三段可知,于国有功者此时已可使用功劳交换爵禄、构赏或赎免罪人。由此,通过功劳这一中介,爵禄与刑罚被联系在了一起。以此为基础,与爵相关的刑罚规定逐步演进,并最终发展细化出了“爵减”“爵免”“爵赎”等数种具体规定。
(二)历史动因:列国争霸与军制演变
“以功授爵”精神下的二十等爵制是秦汉时期与爵相关之刑罚规定产生的制度基础,而宗法制向集权制的过渡则是“以功授爵”兴起的深层社会原因。在集权体制逐渐成形的历史大背景下,出现“以功授爵”之制的直接动因或与军制演变有所联系,其自兴起之时便带有浓厚的军事色彩。
1.宗法社会之军队:国家直属与私人武装
春秋战国以前的宗法社会,各个宗族在政治、司法、军事等各个方面均有不小的自主权(17),这一时期除国家直属的军队以外,亦普遍存在贵族的私人武装。
西周之时,“六师”“八师”等部队为国家直属,他们听从中央调遣,参与各种军事行动(18)。此外,西周贵族拥有自己的“族军”,即属于宗族的私人武装。宗族的私人武装在中央军队无法顺利完成战争任务之时,会帮助中央作战(19)。禹鼎铭(20)相关部分可为一例:
用天降大丧于下国,亦唯鄂侯驭方,率南淮夷、东夷广伐南国、东国,至于历内。王乃命西六师、殷八师,曰:“扑伐鄂侯驭方,勿遗寿幼。”肆师弥怵匌恇,弗克伐鄂。肆武公乃遣禹率公戎车百乘、厮驭二百、徒千,曰:“于匡朕肃慕,叀西六师、殷八师伐鄂侯驭方,勿遗寿幼。”雩禹以武公徒驭至于鄂,敦伐鄂,休,获厥君驭方。[10]1508-1509
此鼎为武公家臣禹所作[8]52,记录了在西周晚期鄂侯驭方发动叛乱,中央军队西六师、殷八师“弗克伐鄂”的情况下,家臣禹受武公派遣,率领武公之族军帮助中央讨伐鄂侯驭方,并最终将其擒获。从禹鼎铭可见,贵族的私人武装在王朝军队作战不利的情况下参与了战斗,并帮助中央实现了战争目标。
贵族的私人武装由贵族自己支配,军队在各方面均需听令于贵族,即使是帮助中央进行军事行动,在调遣、赏赐等环节也由贵族自己负责,中央并不能插手。这一点在西周晚期的多友鼎铭(21)中得到了充分的体现:
唯十月,用猃狁方兴,广伐京师,告追于王。命武公:“遣乃元士,羞追于京师。”武公命多友率公车,羞追于京师……多友乃献俘、馘、讯于公,武公乃献于王。乃曰武公曰:“汝既静京师,赉汝,赐汝土田。”丁酉,武公在献宫。乃命向父召多友,乃延于献宫。公亲曰多友曰:“余肈使汝,休,不逆,有成事,多擒。汝静京师,赐汝圭瓒一,汤钟一,鐈鋚百钧。”多友敢对扬公休,用作尊鼎,用朋用友,其子子孙永宝用。[10]1512-1513
此鼎为武公下属多友所作,记载了周王在猃狁入侵之时命武公出战,武公派遣下属多友率军迎击,并获得胜利之事。根据铭文所载,在与军队相关的调遣、献俘、赏赐等各个环节之中,中央对于武公的族军均无法插手。在调遣军队时,周王只能先“命武公”,之后由武公“命多友率公车”出动;在献俘之时,是多友先将战利品献予武公,再由武公献给周王,即铭文所记的“多友乃献俘、馘、讯于公,武公乃献于王”;在进行赏赐时,周王先赐武公以土田,武公再赏赐多友“圭瓒一,汤钟一,鐈鋚百钧”。可以看到,在每一个环节,周王均无法与多友产生直接联系。
这种贵族私人武装在西周以后,至春秋之时仍可见到。《左传·宣公十七年》云:“郤子至,请伐齐。晋侯弗许。请以其私属,又弗许。”杜预注“私属,家众也”,杨伯峻以为这是“其家族之兵车士众”[11]772。在国家直属军队与贵族私人武装并存的宗法社会,私人武装从属于贵族,其调遣、战斗、赏赐等各方面事务均受贵族支配,不与国家产生直接联系。在这一社会性质之下,并没有像二十等爵那样可以统一适用于全体臣民的“以功授爵”之制的存在基础。
2.族军的消亡与二十等爵制的出现
春秋战国时期,礼崩乐坏、列强争霸、兼并不断。在这种社会环境之下,无论是为了自保还是扩张,军队对于统治者的重要性空前提高。正因如此,这一时期的统治者通过各种手段,不断增加自己可以直接掌控的军队,限制贵族私人武装,并最终实现了对军队的完全控制。这种变化也是宗法制向集权制发展的重要表现之一(22)。在贵族私人武装消亡与国君完全控制军队之后,出于扩张或自保的目的,统治者需要在各个方面提高军队的战斗力。为了提升军队的作战积极性,各国统治者对其以爵赏相诱,从而产生了“以功授爵”之制。
秦人的“以功授爵”之制即二十等爵制。二十等爵的爵位获得以军功为主要条件,《韩非子·定法》评商君之法,云“官爵之迁与斩首之功相称也”[20]435,便表明了二十等爵与军功具有紧密的联系。正如阎步克先生所分析的那样,二十等爵制“用功绩制冲破了宗法贵族制,为平民提供了军功获爵、改变身份的途径”[12]51。通过二十等爵制,秦人不论出身,均可以用军功获得爵位,以提高自己及家庭的社会地位,《商君书·赏刑》云秦人“富贵之门必出于兵”[21]106。在这种诱惑与激励之下,秦国百姓对战功非常渴望,战争积极性极高,达到了《商君书·赏刑》描述的“民闻战而相贺也,起居饮食所歌谣者战也”[21]106的地步。民众作战积极性的提高,使得秦国军队的战斗力远胜于同时代其他国家,《荀子·议兵》在对几国军队战力进行评价时,便认为“齐之技击,不可以遇魏氏之武卒,魏氏之武卒不可以遇秦之锐士”[22]274,以为秦国军队战力冠于诸国。在这种基于二十等爵制带来的军队强大战斗力的保障之下,秦人以边鄙之国而在战国时异军突起,并最终灭亡诸国。
综上所述,秦汉时与爵相关之刑罚规定的制度基础是二十等爵制,而二十等爵制则是集权体制形成过程中产生的“以功授爵”现象在秦国的产物。战国时期,宗法社会趋于瓦解,以此为基础的贵族私人武装亦近于消亡,统治者对几乎所有军队实现了直接控制。为了在战国时代中争霸或自保,各国统治者使用“以功授爵”的方法提高军队的作战积极性,以更好地提升其战力。二十等爵制正是秦国统治者用以提升臣民作战积极性的制度,在这种制度的劝诱下,秦国军队战力大大提高,并冠于诸国,秦人也借此一统天下。
四、结语
作为社会治理基本方法的爵赏与刑罚,在中国古代的律令之中有所交集,以秦汉时期而言,这种交集体现在与爵相关的刑罚规定。依照目前可见材料,这一时期与爵相关的刑罚规定有“爵减”“爵免”“爵赎”以及“夺爵”,前三类是针对有爵位者的刑罚优待制度,第四类则是针对有爵者特有的刑罚或处罚。
适用以上四类刑罚规定均会造成爵位的降低或消失,然而这并不能说明刑罚的产生必然造成爵位变动。其原因是这类刑罚规定并不是无条件、无选择地适用于全体有爵之人。在一些情况下,当事人基于律令规定或自身选择,可能无法适用这类与爵相关之规定。此时,只要当事人应处的刑罚轻于贬为刑徒的劳役刑,便会出现当事人在爵位不变的情况下受刑的情形。目前可知,应处刑罚为赀赎时可能造成这一情况。
二十等爵制是秦汉时期与爵相关刑罚规定的制度基础,其渊源为宗法社会解体、集权体制形成过程中产生的“以功授爵”举措。在集权体制趋近于成形的战国时期,出于时代需要,以宗法社会为土壤的贵族私人武装逐渐消亡,军队完全为国家统治者直接掌控。与此同时,作为提升军队战争积极性的方法,“以功授爵”之制逐渐出现。二十等爵制正是“以功授爵”之制在秦国发展的结果。二十等爵制很好地激发了民众的战斗积极性,使秦军战力冠于诸国,最终助秦人完成统一大业。
注释:
①此处的二十等爵制只是指代这一时期一种多层级爵位的制度,并不表示爵位在该制度存续时一直是二十个等级。对于二十等爵制的发展演变及相关问题,可参见阎步克《从爵本位到官本位——秦汉官僚品位结构研究》,(北京)生活·读书·新知三联书店2009年版;朱绍侯《军功爵制研究》,(北京)商务印书馆2017年版;西嵨定生《中国古代帝国の形成と構造——二十等爵制の研究》,(东京)东京大学出版会1980年版。
②参见师彬彬《两汉二十等爵制问题研究综述》,载《史志学刊》2016年第3期,第61-71页。
③张伯元先生已注意到此点并有所论述。参见张伯元《“爵戍”考》,载《华东政法学院学报》2004年第1期,第71-75页。
④此案是讲薛宣之子薛况指使杨明贼伤其父之政敌申成,之后朝廷就薛况与杨明的量刑发生争议。
⑤参看董平均《简牍材料所见二十等爵与秦汉刑罚的减免》,见雷依群、徐卫民编《秦汉研究》第二辑,(西安)三秦出版社2008年版,第272-278页;张伯元《“爵戍”考》,载《华东政法学院学报》2004年第1期,第71-75页。
⑥关于有爵者得以减免刑罚的表述,可见[日]冨谷至《秦汉刑罚制度研究》,柴生芳、朱恒晔译,(桂林)广西师范大学出版社2006年版,第221-225页。
⑦“鬼薪”在秦及汉初为身份刑,与二十等爵处于同一身份序列之中,当不存在身份为鬼薪之人同时兼有爵位的现象。关于“鬼薪”为身份刑,参见鷹取祐司《秦漢時代の刑罰と爵制的身分序列》,载《立命館文學》2008年第12期,第109-111页;宮宅潔《秦漢時代の爵と刑罰》,载《東洋史研究》2000年第58卷,第653-659页。
⑧“偿”“赏”通用,于传世典籍与出土文献中均不乏其例。传世典籍如《墨子·号令》“皆各以其贾倍偿之”,孙诒让《墨子间诂》引毕云“古偿只作赏”,参见孙诒让《墨子间诂》,(北京)中华书局2001年版,第610页;出土文献如《二年律令·盗律》简50“犬杀伤人畜产,犬主赏(偿)之”,见彭浩、陈伟、[日]工藤元男主编《二年律令与奏谳书》,(上海)上海古籍出版社2007年版,第109页。
⑨例如《奏谳书》案例十四所引令文云“不自占书名数,皆耐为隶臣妾,锢,勿令以爵、赏免”。见彭浩、陈伟、[日]工藤元男主编《二年律令与奏谳书》,(上海)上海古籍出版社2007年版,第351页。
⑩参见张建国《论西汉初期的赎》,载《政法论坛》2002年第5期,第36-42页;角谷常子《秦漢時代の贖刑》,见梅原郁编《前近代中国の刑罰》,(东京)京都大学人文科学研究所1996年版,第67-95页。
(11)参见朱绍侯《军功爵制研究》,(北京)商务印书馆2017年版,第267页,注释1;张伯元《“爵戍”考》,载《华东政法学院学报》2004年第1期,第71-75页。
(12)参看鷹取祐司《秦漢時代の刑罰と爵制的身分序列》,载《立命館文学》2008年第12期,第111-113页;宮宅潔《秦漢時代の爵と刑罰》,载《東洋史研究》2000年第58卷,第659-663页。
(13)对于这些墓葬的墓主是否属于刑徒,仍有一定的争议,居赀之人的身份当并非刑徒。本文为方便表述起见,暂仍以考古报告为准,称其为“刑徒墓”。对墓葬性质的探讨,参见孙英民《〈秦始皇陵西侧赵背户村秦刑徒墓〉质疑》,载《文物》1982年第10期,第73-74页。
(14)关于居赀,可参见张金光《秦制研究》,(上海)上海古籍出版社2004年版,第553-567页。
(15)根据考古材料,五等爵制在春秋之前很可能仍未成形,系统的五等爵制的形成或是在春秋时期。参看李峰《论“五等爵”称的起源》,见李宗焜主编《古文字与古代史》第三辑,(台北)“中央研究院”历史语言研究所2012年版,第159-184页。
(16)李学勤先生结合睡虎地秦简所载,认为《墨子》城守诸篇(包含《号令》篇在内)为战国后期秦国墨家的作品。参见李学勤《简帛佚籍与学术史》,(南昌)江西教育出版社2001年版,第119-133页。
(17)宗法社会之下,各个宗族在政治上的自主权无须赘述。关于宗族在司法方面的自主权,可参见王沛《审判权与西周国家权力的构建》,载《四川大学学报(哲学社会科学版)》2022年第2期,第136-147页;黄海《论中国古代专职法官在战国时期的出现》,载《华东政法大学学报》2019年第2期,第143-155页。此外,这一时期宗族在司法上的自主性亦深刻影响到了中国古代后世的司法,参见王帅一《“化家为国”:传统中国治理中的家族规约》,载《当代法学》2020年第6期,第149-157页;谢晶《清律“家人共盗”的法思想源流》,载《法学研究》2018年第2期,第195-208页。
(18)关于“六师”“八师”及其与周王的关系,参见商艳涛《西周军事铭文研究》,(广州)华南理工大学出版社2013年版,第24-49、58-65页。
(19)关于西周不同时期中央军队与贵族私人武装力量的消长,可参见朱凤瀚《商周家族形态研究》,(北京)商务印书馆2022年版,第471-479页。
(20)铭文释读参见徐中舒《禹鼎的年代及其相关问题》,载《考古学报》1959年第3期,第53-66页。
(21)铭文释读参见李学勤《论多友鼎的时代及意义》,载《人文杂志》1981年第6期,第87-92页。
(22)春秋战国是宗法制向集权制过渡发展的时代,是社会性质全面、彻底改变的时代,军制演变只是其中一个方面。在家族形态、礼仪祭祀、立法司法等各个方面,这一时期均发生了重大变革。可参看朱凤瀚《商周家族形态研究》,(北京)商务印书馆2022年版,第659-665页;李峰《论“五等爵”称的起源》,见李宗焜主编《古文字与古代史》第三辑,(台北)“中央研究院”历史语言研究所2012年版,第159-184页;张卫中《春秋时期的祭祀与政治传播》,载《浙江大学学报(人文社会科学版)》2003年第5期,第122-129页;王沛《刑鼎、宗族法令与成文法公布——以两周铭文为基础的研究》,载《中国社会科学》2019年第3期,第85-105,206页;黄海《论中国古代专职法官在战国时期的出现》,载《华东政法大学学报》2019年第2期,第143-155页。
本文转自《浙江大学学报:人文社会科学版》2023年第8期
Stephen Wolfram《What Is ChatGPT Doing…and Why Does It Work》
前言
本书试图用第一性原理解释ChatGPT的工作原理, 以及它为何奏 效。 可以说这是一个关于技术的故事, 也可以说这是一个关千科学 的故事、 一个关于哲学的故事。 为了讲述这个故事, 我们必须汇集 数个世纪以来的一系列非凡的想法和发现。
看到自己长期以来感兴趣的众多事物一起得到突飞猛进的发展, 我 感到非常兴奋。 从简单程序的复杂行为到语言及其含义的核心特 征, 再到大型计算机系统的实用性, 所有这些都是ChatGPT故事 的一部分。
ChatGPT的基础是人工神经网络(本书中一般简称为神经网络或网 络), 后者最初是在20世纪40年代为了模拟理想化的大脑运作方 式而发明的。 我自己在1983年第一次编写出了一个神经网络, 但 它做不了什么有趣的事情。 然而40年后, 随着计算机的速度提高 上百万倍, 数十亿页文本出现在互联网上, 以及一系列重大的工 程创新, 情况已然大不相同。 出乎所有人意料的是, 一个比我在 1983年构建的神经网络大10亿倍的神经网络能够生成有意义的人 类语言, 而这在之前被认为是人类独有的能力。
本书包含我在 ChatGPT 问世后不久写的两篇长文。第一篇介绍了ChatGPT,并且解释了它为何拥有像人类一样的生成语言的能力。第二篇则展望了 ChatGPT 的未来,预期它能使用计算工具来做到人类所不能做到的事,特别是能够利用 Wolfram/Alpha 系统对知识进行计算(computational knowledge,在后文中简称为计算知识)的“超能力”。
虽然距离 ChatGPT 的发布仅过了三个月,我们也才刚刚开始了解它给我们的实际生活和思维能力可能带来的影响,但就目前而言,它的到来提醒我们,即使在已经发明和发现一切之后,仍有收获惊喜的可能。
斯蒂芬·沃尔弗拉姆 2023 年2 月28日目录
第一篇 ChatGPT 在做什么?它为何能做到这些?
它只是一次添加一个词/ 概率从何而来 / 什么是模型 类人任务 (human-like task) 的模型 / 神经网络 / 机器学习和神经网/络的训练 /神经网络训练的实践和学问 / “足够大的神经网络当然无所不能! ” /“嵌入" 的概念 /ChatGPT 的内部原理 /ChatGPT 的训练 /在基础训练之外 / 真正让 ChatGPT 发挥作用的是什么 /意义空间和语义运动定律 / 语义语法和计算语言的力量 / 那么, ChatGPT 到底在做什么?它为什么能做到这些?
第二篇 利用 WolframlAlpha为ChatGPT 赋予计算知识超能力
ChatGPT和Wolfram!Alpha / 一个简单的例子 / 再举几个例子 / 前方的路
相关资源第一篇 ChatGPT在做什么?它为何能做到这些?
它只是一次添加一个词
ChatGPT 可以自动生成类似于人类书写的文本, 这非常了不起, 也非常令人意外。 它是如何做到的呢?这为什么会奏效呢?我在这里将概述 ChatGPT 内部的工作方式, 然后探讨为什么它能够如此出色地产生我们认为有意义的文本。 必须在开头说明, 我会重点关注宏观的工作方式, 虽然也会提到一些工程细节, 但不会深入探讨。[这里提到的本质不仅适用于 ChatGPT, 也同样适用于当前的其他“大语言模型”(large language model, LLM)。]
首先需要解释, ChatGPT 从根本上始终要做的是,针对它得到的任何文本产生 “合理的延续"。 这里所说的 “合理” 是指, “人们在看到诸如数十亿个网页上的内容后, 可能期待别人会这样写”。
假设我们手里的文本是 “The best thing about Al is its ability to” (AI最棒的地方在于它能)。 想象一下浏览人类编写的数十亿页文本(比如在互联网上和电子书中), 找到该文本的所有实例, 然后看看接下来出现的是什么词, 以及这些词出现的概率是多少。ChatGPT 实际上做了类似的事情, 只不过它不是查看字面上的文本, 而是寻找在某种程度上 ”意义匹配" 的事物(稍后将解释)。
最终的结果是,它会列出随后可能出现的词及其出现的“概率” (按“概率”从高到低排列)。
The best thing about AI is its ability to
learn 4.5% predict 3.5% make 3.2% understand 3.1% do 2.9% 值得注意的是,当ChatGPT做一些事情,比如写一篇文章时,它实质上只是在一遍又一遍地询问“根据目前的文本,下一个词应该 是什么”,并且每次都添加一个词。[正如我将要解释的那样,更准 确地说,它是每次都添加一个“标记”(token),而标记可能只是 词的一部分。这就是它有时可以“造词”的原因。]
好吧,它在每一步都会得到一个带概率的词列表。但它应该选择 将哪一个词添加到正在写作的文章中呢?有人可能认为应该选择 “排名最高”的词,即分配了最高“概率”的词。然而,这里出现 了一点儿玄学(voodo,巫术)的意味。出于某种原因一也许有一天能用科学解释——如果我们总是选择排名最高的词,通常会得到一篇非常“平淡”的文章,完全显示不出任何“创造力”〔有时甚至会一字不差 地重复前文〕。但是,如果有时(随机)选择排名较低的词,就会 得到一篇“更有趣”的文章。
这里存在随机性意味着,如果我们多次使用相同的提示(prompt),每次都有可能得到不同的文章。而且,符合玄学思想的是,有一个 所谓的“温度”参数来确定低排名词的使用频率。对于文章生成 来说,“温度”为0.8似乎最好。(值得强调的是,这里没有使用任 何“理论”,“温度”参数只是在实践中被发现有效的一种方法。例 如,之所以采用“温度”的概念,是因为碰巧使用了在统计物理学中很常见的某种指数分布[玻尔兹曼分布],但它与物理学之间并没有任何实际联系,至少就我们目前所知是这样的。)
在进入下一节之前,需要解释一下,为了方便阐述,我在大多数情 况下不会使用ChatGPT中的完整系统,而是使用更简单的GPT-2 系统,它的优点是足够小,可以在标准的台式计算机上运行。因 此,对于书中展示的所有原理,我都能附上明确的Wolfram语言代码,你可以立即在自己的计算机上运行。
例如,通过以下方式可以获得前页列出的概率表。首先,需要检索底层的“语言模型”。
稍后,我们将深入了解这个神经网络,并谈谈它的工作原理。现在,我们可以把这个“网络模型”当作黑盒,应用到之前的文本中,并询问模型哪5个词紧随其后的概率最高。
in[ ]:= model[“The best thing about Al is its ability to”, {“TopProbabilities”, 5}]
out[ ]={do → 0.0288508, understand → 0.0307805, make → 0.0319072, predict → 0.0349748, learn → 0.0445305}
如下获取结果并将其转换为明确格式化的“数据集”。
in[ ]:=Dataset[ReverseSort[Association[%]], ItemDisplayFunction→(PercentForm[#,2]&)]
Out[ ]:=
learn 4.5% predict 3.5% make 3.2% understand 3.1% do 2.9% 如果反复“应用模型”,在每一步都添加概率最高的词[在此代码 中指定为模型所做的“决策”(decision)],则会发生以下情况。
in[ ]:=NestList[StringJoin[# , model[# , “Decision”]] &, “The best thing about Al is its ability to”, 7]
out[ ]= {The best thing about Al is its ability to,
The best thing about Al is its ability to learn,
The best thing about Al is its ability to learn from,
The best thing about Al is its ability to learn from experience,
The best thing about Al is its ability to learn from experience.,
The best thing about Al is its ability to learn from experience. It,
The best thing about Al is its ability to learn from experience. It’s,
The best thing about Al is its ability to learn from experience. It’s not}如果继续下去呢?在此(“零温度”[温度参数为0,即选择按概率排名最高的词])情况下,文本很快就会变得混乱和重复。
The best thing about Al is its ability to learn from experience.
It’s not just a matter of learning from experience, it’s learning from the
world around you. The Al is a very good example of this. It’s a very good example of how to use Al to improve your life. It’s a very good example of
how to use Al to improve your life. The Al is a very good example of how
to use Al to improve your life. It’s a very good example of how to use Al to但是,如果我们不总是选择“排名最高”的词,而是有时随机选择“非排名最高”的词(通过将“温度”参数从0调高到0.8来获得这种随机性)呢?我们同样可以构建文本:
{The best thing about Al is its ability to,
The best thing about Al is its ability to create,
The best thing about Al is its ability to create worlds,
The best thing about Al is its ability to create worlds that,
The best thing about Al is its ability to create worlds that are,
The best thing about Al is its ability to create worlds that are both,
The best thing about Al is its ability to create worlds that are both exciting,
The best thing about Al is its ability to create worlds that are both exciting,}每次执行此操作时,都会进行不同的随机选择,文本也会不同,就 像这5个例子一样。
The best thing about Al is its ability to learn. I’ve always liked the
The best thing about Al is its ability to really come into your world and just
The best thing about Al is its ability to examine human behavior and the way it
The best thing about Al is its ability to do a great job of teaching us
The best thing about Al is its ability to create real tasks, but you can值得指出的是,即使在(温度为0.8的)第一步,也有许多可能的“下一个词”可供选择,尽管它们的概率迅速减小(是的,如下面的对数图所示,点的连线对应于,n-1次幂律衰减,这是语言的一般统计特征)。
如果再继续下去会发生什么呢?下面是一个随机的例子。虽然比选 择排名最髙的词(零温度)的情况好,但还是有点奇怪。
The best thing about Al is its ability to see through, and make sense of, the world around us, rather than panicking and ignoring. This is known as Al “doing its job” or Al “run-of-the-mill.” Indeed, taking an infinite number of steps, developing a machine that can be integrated with other systems, or controlling one system that’s truly a machine, is one of the most fundamental processes of Al. Aside from the human -machine interaction, Al was also a big part of creativity
这是使用最简单的GPT-2模型(发布于2019年)完成的。使用更新更大的GPT-3模型,结果会更好。下面是在提示相同但使用最大的GPT-3模型的情况下生成的零温度文本。
The best thing about Al is its ability to automate processes and make decisions quickly and accurately. Al can be used to automate mundane tasks, such as data entry, and can also be used to make complex decisions, such as predicting customer behavior or analyzing large datasets. Al can also be used to improve customer service, as it can quickly and accurately respond to customer inquiries. Al can also be used to improve the accuracy of medical diagnoses and to automate the process of drug discovery.
下面是一个温度为0.8的随机示例。
The best thing about Al is its ability to learn and develop over time, allowing it to continually improve its performance and be more efficient at tasks. Al can also be used to automate mundane tasks, allowing humans to focus on more important tasks. Al can also be used to make decisions and provide insights that would otherwise be impossible for humans to figure out.
概率从何而来
ChatGPT总是根据概率选择下一个词,但是这些概率是从何而来的 呢?让我们从一个更简单的问题开始:考虑逐字母(而非逐词)地 生成英文文本。怎样才能计算出每个字母应当出现的概率呢?
我们可以做一件很小的事,拿一段英文文本样本,然后计算其中不 同字母的出现次数。例如,下面的例子统计了维基百科上“cats” (猫)的条目中各个字母的出现次数。
对“dogs”(狗)的条目也做同样的统计。
结果有些相似,但并不完全一样。(毫无疑问,在”dogs”的条目中,字母o更常见,毕竟dog—词本身就含有o。)不过,如 果我们采集足够大的英文文本样本,最终就可以得到相当一致的结果。
这是在只根据这些概率生成字母序列时得到的样本。
我们可以通过添加空格将其分解成“词”,就像这些“词”也是具有一定概率的字母一样。
还可以通过强制要求“词长”的分布与英文中相符来更好地造“词”。
ni hilwhuei kjtn isjd erogofnr n rwhwfao rcuw lis fahte uss cpnc nlu oe nusaetat llfo oeme rrhrtn xdses ohm oa tne ebedcon oarvthv ist
虽然并没有碰巧得到任何“实际的词”,但结果看起来稍好一些了。 不过,要进一步完善,我们需要做的不仅仅是随机地挑选每个字母。举例来说,我们知道,如果句子中有一个字母q,那么紧随其 后的下一个字母几乎一定是u。
以下是每个字母单独出现的概率图。
下图则显示了典型英文文本中字母对[二元(2-gram或bigram)字母]的概率。可能出现的第一个字母横向显示,第二个字母纵向显示。
可以看到,q列中除了u行以外都是空白的(概率为零)。现在不再一次一个字母地生成“词”,而是使用这些二元字母的概率,一 次关注两个字母。下面是可以得到的一个结果,其中恰巧包括几个“实际的词”。
on inguman men ise forernoft weat iofobato buc ous corew ousesetiv fa lie tinouco ryefo ra the ecederi pasuthrgr cuconom tra tesla will tat pere thi
有了足够多的英文文本,我们不仅可以对单个字母或字母对(二元字母)得到相当好的估计,而且可以对更长的字母串得到不错的估计。如果使用逐渐变长的n元(n-gram)字母的概率生成“随机的词”,就能发现它们会显得越来越“真实”。
0 on gxeeetowmt tsifhy ah aufnsoc ior oia itlt bnc tu ih uls 1 ri io os ot timumumoi gymyestit ate bshe abol viowr wotybeat mecho 2 wore hi usinallistin Ilia ale warou pothe of premetra beet upo pr 3 qual musin was witherins wil por vie surgedygua was suchinguary outheydays theresist 4 stud made yello adenced through theirs from cent intous wherefo proteined screa 5 special average vocab consumer market prepara injury trade consa usually speci utility 现在假设——多少像ChatGPT所做的那样——我们正在处理整个词,而不是字母。英语中有大约50000个常用词。通过查看大型的英文语料库(比如几百万本书,总共包含几百亿个词),我们可以估计每个词的常用程度。使用这些信息,就可以开始生成“句子”了,其中的每个词都是独立随机选择的,概率与它们在语料库 中出现的概率相同。以下是我们得到的一个结果。
of program excessive been by was research rate not here of of other is men were against are show they the different the half the the in any were leaved
毫不意外,这没有什么意义。那么应该如何做得更好呢?就像处理 字母一样,我们可以不仅考虑单个词的概率,而且考虑词对或更长的n元词的概率。以下是考虑词对后得到的5个结果,它们都是从 单词cat开始的。
cat through shipping variety is made the aid emergency can the
cat for the book flip was generally decided to design of
cat at safety to contain the vicinity coupled between electric public
cat throughout in a confirmation procedure and two were difficult music
cat on the theory an already from a representation before a
结果看起来稍微变得更加“合理”了。可以想象,如果能够使用足 够长的n元词,我们基本上会“得到一个ChatGPT”,也就是说, 我们得到的东西能够生成符合“正确的整体文章概率”且像文章一 样长的词序列。但问题在于:我们根本没有足够的英文文本来推断 出这些概率。
在网络爬取结果中可能有几千亿个词,在电子书中可能还有另外 几百亿个词。但是,即使只有4万个常用词,可能的二元词的数 量也已经达到了16亿,而可能的三元词的数错则达到了 60万亿。 因此,我们无法根据已有的文本估计所有这些三元词的概率。当 涉及包含20个词的“文章片段”时,可能的20元词的数量会大 于宇宙中的粒子数量,所以从某种意义上说,永远无法把它们全 部写下来。
我们能做些什么呢?最佳思路是建立一个模型,让我们能够估计序列出现的概率——即使我们从未在已有的文本语料库中明确看到过这些序列。ChatGPT的核心正是所谓的“大语言模型”,后者已经 被构建得能够很好地估计这些概率了。
什么是模型
假设你想(像16世纪末的伽利略一样)知道从比萨斜塔各层掉落 的炮弹分别需要多长时间才能落地。当然,你可以在每种情况下 进行测量并将结果制作成表格。不过,你还可以运用理论科学的本 质:建立一个模型,用它提供某种计算答案的程序,而不仅仅是在 每种情况下测量和记录。
假设有一些(理想化的)数据可以告诉我们炮弹从斜塔各层落地所需的时间。
如何计算炮弹从一个没有明确数据的楼层落地需要多长时间呢?在这种特定情况下,可以使用已知的物理定律来解决问题。但是,假 设我们只有数据,而不知道支配它的基本定律。那么我们可能会做出数学上的猜测,比如也许应该使用一条直线作为模型。
虽然我們可以选择不同的直线,但是上图中的这条直线平均而言最 接近我们拥有的数据。根据这条直线,可以估计炮弹从任意一层落 地的时间。
我们怎么知道要在这里尝试使用直线呢?在某种程度上说,我们并 不知道。它只是在数学上很简单,而且我们已经习惯了许多测量数 据可以用简单的数学模型很好地拟合。还可以尝试更复杂的数学模 型,比如a+bx+cx2,能看到它在这种情况下做得更好。
不过,这也可能会出大问题。例如,下面是我们使用a+b/x+c·sinx似 能得到的最好结果。
必须理解,从来没有“无模型的模型”。你使用的任何模型都有某种特定的基本结构,以及用于拟合数据的一定数量的“旋钮”(也就是可以设置的参数)。ChatGPT使用了许多这样的“旋钮”——实际上有1750亿个。
但是值得注意的是,ChatGPT的基本结构——“仅仅”用这么少的参数一足以生成一个能“足够好”地计算下一个词的概率的模型,从而生成合理的文章。
类人任务(human-like task)的模型
上文提到的例子涉及为数值数据建立模型,这些数据基本上来自简 单的物理学——几个世纪以来,我们已经知道可以用一些“简单的数学工具”为其建模。但是对于ChatGPT,我们需要为人脑产生的人类语言文本建立模型。而对于这样的东西,我们(至少目前)还 没有“简单的数学”可用。那么它的模型可能是什么样的呢?
在讨论语言之前,让我们谈谈另一个类人任务:图像识别。一个简 单的例子是包含数字的图像(这是机器学习中的一个经典例子)。
我们可以做的一件事是获取每个数字的大量样本图像。
要确定输入的图像是否对应于特定的数字,可以逐像素地将其与已有的样本进行比较。但是作为人类,我们似乎肯定做得更好:
因为即使数字是手写的,有各种涂抹和扭曲,我们也仍然能够识别它们。
当为上一节中的数值数据建立模型时,我们能够在取得给定的数值x之后,针对特定的a和b来计算出a+bx。那么,如果我们将图像中每个像素的灰度值视为变量xi,是否存在涉及所有这些变量 的某个函数,能(在运算后)告诉我们图像中是什么数字?事实证明,构建这样的函数是可能的。不过难度也在意料之中,一个典型 的例子可能涉及大约50万次数学运算。
最终的结果是,如果我们将一个图像的像素值集合输入这个函数, 那么输出将是一个数,明确指出该图像中是什么数字。稍后,我们将讨论如何构建这样的函数,并了解神经网络的思想。但现在,让我们先将这个函数视为黑盒,输入手写数字的图像(作为像素值的数组),然后得到它们所对应的数字。
Out[ ]:= {7,0,9,7,8,2,4,1,1,1}
这里究竟发生了什么?假设我们逐渐模糊一个数字。在一小段时间内,我们的函数仍然能够“识别”它,这里为2。但函数很快就无法准确识别了,开始给出“错误”的结果。
Out[ ]:= {2, 2, 2,1,1,1,1,1,1}
为什么说这是“错误”的结果呢?在本例中,我们知道是通过模糊 数字2来得到所有图像的。但是,如果我们的目标是为人类在识别图像方面的能力生成一个模型,真正需要问的问题是:面对一个模 糊的图像,并且不知道其来源,人类会用什么方式来识别它?
如果函数给出的结果总是与人类的意见相符,那么我们就有了一个“好模型”。一个重大的科学事实是,对于图像识别这样的任务,我们现在基本上已经知道如何构建不错的函数了。
能“用数学证明”这些函数有效吗?不能。因为要做到这一点,我们必须拥有一个关于人类所做的事情的数学理论。如果改变2的图 像中的一些像素,我们可能会觉得,仍应该认为这是数字2。但是 随着更多像素发生改变,我们又应该能坚持多久呢?这是一个关于 人类视觉感知的问题。没错,对于蜜蜂或章鱼的图像,答案无疑会 有所不同,而对于虚构的外星人的图像,答案则可能会完全不同。
神经网络
用于图像识别等任务的典型模型到底是如何工作的呢?目前最受欢迎而且最成功的方法是使用神经网络。神经网络发明于20世纪40 年代——它在当时的形式与今天非常接近——可以视作对大脑工作机制的简单理想化。
人类大脑有大约1000亿个神经元(神经细胞),每个神经元都能 够产生电脉冲,最高可达每秒约1000次。这些神经元连接成复杂 的网络,每个神经元都有树枝状的分支,从而能够向其他数千个神 经元传递电信号。粗略地说,任意一个神经元在某个时刻是否产生 电脉冲,取决于它从其他神经元接收到的电脉冲,而且神经元不同 的连接方式会有不同的“权重”贡献。
当我们“看到一个图像”时,来自图像的光子落在我们眼睛后面的 (光感受器)细胞上,它们会在神经细胞中产生电信号。这些神经细胞与其他神经细胞相连,信号最终会通过许多层神经元。在此过 程中,我们“识别”出这个图像,最终“形成”我们“正在看数字 2”的“想法”(也许最终会做一些像大声说出“二”这样的事情)。
上一节中的“黑盒函数”就是这样一个神经网络的“数学化”版 本。它恰好有11层(只有4个“核心层”)。
我们对这个神经网络并没打明确的“理论解释”,它只是在1998年 作为一项工程被构述出来的,而且被发现可以奏效。(当然,这与把我们的大脑描述为通过生物进化过程产生并没有太大的区别。)
好吧,但是这样的神经网络是如何“识别事物”的呢?关键在于吸引子(attractor)的概念。假设我们有手写数字1和2的图像。
我们希望通过某种方式将所有的1 “吸引到一个地方”,将所有的 2 “吸引到另一个地方”。换句话说,如果一个图像“更有可能是1” 而不是2,我们希望它最终出现在“1的地方”,反之亦然。
让我们做一个直白的比喻。假设平面上有一些位置,用点表示(在实际生活场景中,它们可能是咖啡店的位置然后我们可以想象,自己从平面上的任意一点出发,并且总是希望最终到达最近的点(即我们总是去最近的咖啡店)。可以通过用理想化的“分水岭”将平面分隔成不同的区域〈“吸引子盆地”〉来表示这一点。
我们可以将这看成是执行一种“识别任务”,所做的不是识别一个 给定图像“看起来最像”哪个数字,而是相当直接地看出哪个点距 离给定的点最近。[这里展示的沃罗诺伊图将二维欧几里得空间中的点分隔开来。可以将数字识别任务视为在做一种非常类似的操作——只不过是在由每个图像中所有像素的灰度形成的784维空间中。]
那么如何让神经网络“执行识别任务”呢?让我们考虑下面这个非 常简单的情况。
我们的目标是接收一个对应于位置{x,y}的输入,然后将其“识别”为最接近它的三个点之一。换句话说,我们希望神经网络能够计算出一个如下图所示的关于{x,y}的函数。
如何用神经网络实现这一点呢?归根结底,神经网络是由理想化的 “神经元”组成的连接集合——通常是按层排列的。一个简单的例子如下所示。
每个“神经元”都被有效地设置为计算一个简单的数值函数。为 了“使用”这个网络,我们只需在顶部输入一些数(像我们的坐标x和y),然后让每层神经元“计算它们的函数的值”并在网络中将 结果前馈,最后在底部产生最终结果。
在传统(受生物学启发)的设置中,每个神经元实际上都有一些来 自前一层神经元的“输入连接”,而且每个连接都被分配了一个特 定的“权重”(可以为正或为负)。给定神经元的值是这样确定的: 先分别将其“前一层神经元”的值乘以相应的权重并将结果相加, 然后加上一个常数,最后应用一个“阈值”(或“激活”)函数。用 数学术语来说,如果一个神经元有输入x={x1,x2,…},那么我们要计算f[w·x+b]。对于权重w和常量b,通常会为网络中的每个 神经元选择不同的值;函数7则通常在所有神经元中保持不变。
计算w·x+b需要进行矩阵乘法和矩阵加法运算。激活函数f则使用了非线性函数(最终会导致非平凡的行为)。下面是一些常用的激活函数,这里使用的是Ramp(或ReLU)。
对于我们希望神经网络执行的每个任务〈或者说,对于我们希望它计算的每个整体函数〉,都有不同的权重选择。(正如我们稍后将讨论的那样,这些权重通常是通过利用机器学习根据我们想要的输出的示例“训练”神经网络来确定的。) 最终,每个神经网络都只对应于某个整体的数学函数,尽管写出来 可能很混乱。对于上面的例子,它是
w511 f(w311f(b11 +xw111 + yw112) + w312f(b12+xw121+yw122) +w313f(b13 +xw131 +yw132) + w314f(b14 +xw141 +yw142) + b31) +w512f(w321f(b11 + xw111 + yw112) + w322f(b12+xw121 +yw122) +w323f(b13+xw131 +yw132) + w324f(b14+xw141+yw142) + b32) +w513f(w331 f(b13+ xw111 +yw112) +w332f(b12+xw121 + yw122) +w333 f(b13+ xw131 + yw132) +w334f(b14 + xw141 + yw142) + b33) +b51
同样,ChatGPT的神经网络也只对应于一个这样的数学函数——它实际上有数十亿项。
现在,让我们回头看看单个神经元。下图展示了一个具有两个输入 (代表坐标X和y)的神经元可以通过各种权重和常数(以及激活函数Ramp)计算出的一些示例。
对于上面提到的更大的网络呢?它的计算结果如下所示。
虽然不完全“正确”,但它接近上面展示的“最近点”函数。
再来看看其他的一些神经网络吧。在每种情况下,我们都使用机器学习来找到最佳的权重选择。这里展示了神经网络用这些权重计算出的结果。
更大的神经网络通常能更好地逼近我们所求的函数。在“每个吸引子盆地的中心”,我们通常能确切地得到想要的答案。但在边界处,也就是神经网络“很难下定决心”的地方,情况可能会更加混乱。
在这个简单的数学式“识别任务”中,“正确答案”显而易见。但 在识别手写数字的问题上,答案就不那么明显了。如果有人把2写得像7一样怎么办?类似的问题非常常见。尽管如此,我们仍然可 以询问神经网络是如何区分数字的,下面给出了一个答案。
我们能“从数学上”解释网络是如何做出区分的吗?并不能。它只是在“做神经网络要做的事”。但是事实证明,这通常与我们人类 所做的区分相当吻合。
让我们更详细地讨论一个例子。假设我们有猫的图像和狗的图像, 以及一个经过训练、能区分它们的神经网络。以下是该神经网络可 能对某些图像所做的事情。
这里的“正确答案”更加不明显了。穿着猫咪衣服的狗怎么分?等等。无论输入什么,神经网络都会生成一个答案。结果表明,它的做法相当符合人类的思维方式。正如上面所说的,这并不是我们可以“根据第一性原则推导”出来的事实。这只是一些经验性的发 现,至少在某些领域是正确的。但这是神经网络有用的一个关键原因:它们以某种方式捕捉了 “类似人类”的做事方式。
找一张猫的图片看看,并问自己:“为什么这是一只猫?”你也许会说“我看到了它尖尖的耳朵”,等等。但是很难解释你是如何把这个图像识别为一只猫的。你的大脑就是不知怎么地想明白了。但是(至少目前还)没有办法去大脑“内部”看看它是如何想明白的。那么,对于(人工)神经网络呢?当你展示一张猫的图片时,很容易看到每个“神经元”的作用。不过,即使要对其进行基本的可视化,通常也非常困难。
在上面用于解决“最近点”问题的最终网络中,有17个神经元; 在用于识别手写数字的网络中,有2190个神经元;而在用于识别猫和狗的网络中,有60650个神经元。通常很难可视化出60 650 维的空间。但由于这是一个用于处理图像的网络,其中的许多神经元层被组织成了数组,就像它查看的像素数组一样。
下面以一个典型的猫的图像为例。
我们可以用一组衍生图像来表示第一层神经元的状态,其中的许多可以被轻松地解读为“不带背景的猫”或“猫的轮廓”。
到第10层,就很难解读这些是什么了。
但是总的来说,我们可以说神经网络正在“挑选出某些特征”(也许尖尖的耳朵是其中之一),并使用这些特征来确定图像的内容。 但是,这些特征能否用语言描述出来(比如“尖尖的耳朵”)呢? 大多数情况下不能。
我们的大脑是否使用了类似的特征呢?我们多半并不知道。但值得注意的是,一些神经网络(像上面展示的这个)的前几层似乎会挑 选出图像的某些方面(例如物体的边缘),而这些方面似乎与我们 知道的大脑中负责视觉处理的第一层所挑选出的相似。
假设我们想得到神经网络中的“猫识别理论”,可以说:“看,这个特定的网络可以做到这一点。”这会立即让我们对“问题的难度” 有一些了解(例如,可能需要多少个神经元或多少层)。但至少到 目前为止,我们没办法对网络正在做什么“给出语言描述”。也许 这是因为它确实是计算不可约的,除了明确跟踪每一步之外,没有 可以找出它做了什么的一般方法。也有可能只是因为我们还没有 “弄懂科学”,也没有发现能总结正在发生的事情的“自然法则”。
当使用生成语言时,我们会遇到类似的问题,而且目前尚不清楚是否有方法来“总结它所做的事情”。但是,语言的丰富性和细节(以及我们的使用经验)可能会让我们比图像处理取得更多进展。
机器学习和神经网络的训练
到目前为止,我们一直在讨论“已经知道”如何执行特定任务的神经网络。但神经网络之所以很有用(人脑中的神经网络大概也如此),原因不仅在于它可以执行各种任务,还在于它可以通过逐步 “根据样例训练”来学习执行这些任务。
当构建一个神经网络来区分猫和狗的图像时,我们不需要编写一个 程序来(比如)明确地找到胡须,只需要展示很多关于什么是猫和 什么是狗的样例,然后让神经网络从中“机器学习”如何区分它们 即可。
重点在于,已训练的神经网络能够对所展示的特定例子进行“泛 化”。正如我们之前看到的,神经网络不仅能识别猫图像的样例的 特定像素模式,还能基于我们眼中的某种“猫的典型特征”来区分 图像。 神经网络的训练究竟是如何起效的呢?本质上,我们一直在尝试找 到能使神经网络成功复现给定样例的权重。然后,我们依靠神经网 络在这些样例“之间”进行“合理”的“插值”(或“泛化”)。 让我们看一个比“最近点”问题更简单的问题,只试着让神经网络 学习如下函数。
对于这个任务,我们需要只有一个输入和一个输出的神经网络。
但是,应该使用什么样的权重呢?对于每组可能的权重,神经网络都将计算出某个函数。例如,下面是它对于几组随机选择的权重计算出的函数。
可以清楚地看到,这些函数与我们想要的函数相去甚远。那么,如何才能找到能够复现函数的权重呢?
基本思想是提供大量的“输入—输出”样例以供“学习”,然后尝 试找到能够复现这些样例的权重。以下是逐渐增加样例后所得的 结果。 在该“训练”的每个阶段,都会逐步调整神经网络的权重,我们会 发现最终得到了一个能成功复现我们想要的函数的神经网络。应该 如何调整权重呢?基本思想是,在每个阶段看一下我们离想要的函 数“有多远”,然后朝更接近该函数的方向更新权重。
为了明白离目标“有多远”,我们计算“损失函数”(有时也称为 “成本函数”)。这里使用了一个简单的(L2)损失函数,就是我们 得到的值与真实值之间的差异的平方和。随着训练过程不断进行, 我们看到损失函数逐渐减小(遵循特定的“学习曲线”,不同任务的学习曲线不同),直到神经网络成功地复现(或者至少很好地近 似)我们想要的函数。
最后需要解释的关键是,如何调整权重以减小损失函数。正如我们 所说的,损失函数给出了我们得到的值和真实值之间的“距离”。 但是“我们得到的值”在每个阶段是由神经网络的当前版本和其中 的权重确定的。现在假设权重是变量,比如wi。我们想找出如何调 整这些变量的值,以最小化取决于它们的损失。
让我们对实践中使用的典型神经网络进行极大的简化,想象只有两 个权重w1和w2。然后,我们可能会有一个损失函数,它作为w1和w2的函数看起来如下所示。
数值分析提供了各种技术来帮我们找到这种情况下的最小损失。一个典型的方法就是从之前的任意w1和w2开始,逐步沿着最陡的下降路径前进。
就像水从山上流下来一样,只能保证会到达表面上的某个局部最小 值(“一个山湖”),但不一定能到达最终的全局最小值。
似乎不太容易在“权重景观”中找到最陡的下降路径,但是微积分可以拯救我们。正如上面提到的,我们总是可以将神经网络视为计 算出一个数学函数一取决于其输入和权重。现在考虑对这些权重 进行微分。结果表明,微积分的链式法则实际上让我们解开了神经 网络中连续各层所做操作的谜团。结果是,我们可以一至少在某 些局部近似中一“反转”神经网络的操作,并逐步找到使与输出 相关的损失最小化的权重。
上图展示了,在仅有两个权重的情况下可能需要进行的最小化工作。但是事实证明,即使有更多的权重(ChatGPT使用了 1750亿个权重),也仍然可以进行最小化,至少可以在某种程度上进行近似。实际上,“深度学习”在2012年左右的重大突破与如下发现有关:与权重相对较少时相比,在涉及许多权重时,进行最小化(至 少近似)可能会更容易。
换句话说,有时候用神经网络解决复杂问题比解决简单问题更容易一这似乎有些违反直觉。大致原因在于,当有很多”权重变 量”时,髙维空间中有“很多不同的方向”可以引导我们到达最小值;而当变量较少时,很容易陷入局部最小值的“山湖”,无法找 到“出去的方向”。
值得指出的是,在典型情况下,有许多不同的权重集合可以使神经 网络具有几乎相同的性能。在实际的神经网络训练中,通常会做出 许多随机选择,导致产生一些“不同但等效”的解决方案,就像下面这些一样。
但是每个这样的“不同解决方案”都会有略微不同的行为。假如在 我们给出训练样例的区域之外进行“外插”(extrapolation),可能 会得到截然不同的结果。
哪一个是“正确”的呢?实际上没有办法确定。它们都“与观察到 的数据一致”。但它们都对应着“在已知框架外”进行“思考”的不 同的“固有方式”。只是有些方式对我们人类来说可能“更合理”。
神经网络训练的实践和学问
在过去的十年中,神经网络训练的艺术已经有了许多进展。是的, 它基本上是一门艺术。有时,尤其是回顾过去时,人们在训练中至 少可以看到一丝“科学解释”的影子了。但是在大多数情况下,这 些解释是通过试错发现的,并且添加了一些想法和技巧,逐渐针对 如何使用神经网络建立了一门重要的学问。
这门学问有几个关键部分。首先是针对特定的任务使用何种神经网 络架构的问题。然后是如何获取用于训练神经网络的数据的关键问 题。在越来越多的情况下,人们并不从头开始训练网络:一个新的网络可以直接包含另一个已经训练过的网络,或者至少可以使用该 网络为自己生成更多的训练样例。
有人可能会认为,每种特定的任务都需要不同的神经网络架构。 但事实上,即使对于看似完全不同的任务,同样的架构通常也 能够起作用。在某种程度上,这让人想起了通用计算(universal computation)的概念和我的计算等价性原理〈Principle of Computational Equivalence〉,但是,正如后面将讨论的那样,我 认为这更多地反映了我们通常试图让神经网络去完成的任务是“类人”任务,而神经网络可以捕捉相当普遍的“类人过程”。
在神经网络的早期发展阶段,人们倾向于认为应该“让神经网络做尽可能少的事”。例如,在将语音转换为文本时,人们认为应该先 分析语音的音频,再将其分解为音素,等等。但是后来发现,(至 少对于“类人任务”)最好的方法通常是尝试训练神经网络来“解 决端到端的问题”,让它自己“发现”必要的中间特征、编码等。
还有一种想法是,应该将复杂的独立组件引入神经网络,以便让它有效地“显式实现特定的算法思想”。但结果再次证明,这在大多 数情况下并不值得;相反,最好只处理非常简单的组件,并让它们 “自我组织”〔尽管通常是以我们无法理解的方式〕来实现(可能)等效的算法思想。
这并不意味着没有与神经网络相关的“结构化思想”。例如,至少 在处理图像的最初阶段,拥有局部连接的神经元二维数组似乎非常 有用。而且,拥有专注于“在序列数据中‘回头看’”的连接模式 在处理人类语言方面,例如在ChatGPT中,似乎很有用(后面我们将看到)。
神经网络的一个重要特征是,它们说到底只是在处理数据一和计算机一样。目前的神经网络及其训练方法具体处理的是由数值组成 的数组,但在处理过程中,这些数组可以完全重新排列和重塑。例如,前面用于识别数字的网络从一个二维的“类图像”数组开始, 迅速“增厚”为许多通道,但然后会“浓缩”成一个一维数组,最 终包含的元素代表可能输出的不同数字。
但是,如何确定特定的任务需要多大的神经网络呢?这有点像一门 艺术。在某种程度上,关键是要知道“任务有多难”。但是类人任务的难度通常很难估计。是的,可能有一种系统化的方法可以通过 计算机来非常“机械”地完成任务,但是很难知道是否有一些技巧 或捷径有助于更轻松地以“类人水平”完成任务。可能需要枚举一 棵巨大的对策树才能“机械”地玩某个游戏,但也可能有一种更简 单的(“启发式”)方法来实现“类人的游戏水平”。
当处理微小的神经网络和简单任务时,有时可以明确地看到“无法从这里到达那里”。例如,下面是在上一节任务中的几个小神经网 络能够得到的最佳结果。
我们看到的是,如果神经网络太小,它就无法复现我们想要的函 数。但是只要超过某个大小,它就没有问题了 一一前提是至少训 练足够长的时间,提供足够的样例。顺便说一句,这些图片说明了 神经网络学问中的一点:如果中间有一个“挤压”〈squeeze〉,迫 使一切都通过中间较少的神经元,那么通常可以使用较小的网络。 [值得一提的是,“无中间层”(或所谓的“感知机”)网络只能学习 基本线性函数,但是只要有一个中间层(至少有足够的神经元),原则上就始终可以任意好地逼近任何函数,尽管为了使其可行地训 练,通常会做某种规范化或正则化。]
好吧,假设我们已经确定了一种特定的神经网络架构。现在的问题是如何获取用于训练网络的数据。神经网络(及广义的机器学习)的许多实际挑战集中在获取或准备必要的训练数据上。在许多情况 (“监督学习”)下,需要获取明确的输入样例和期望的输出。例如, 我们可能希望根据图像中的内容或其他属性添加标签,而浏览图像 并添加标签通常需要耗费大量精力。不过很多时候,可以借助已 有的内容或者将其用作所需内容的替代。例如,可以使用互联网 上提供的alt标签。还有可能在不同的领域中使用为视频创建的隐 藏式字幕。对于语言翻译训练,可以使用不同语言的平行网页或平行文档。
为特定的任务训练神经网络需要多少数据?根据第一性原则很难估 计。使用“迁移学习”可以将已经在另一个神经网络中学习到的重 要特征列表“迁移过来”,从而显著降低对数据规模的要求。但是, 神经网络通常需要“看到很多样例”才能训练好。至少对于某些任 务而言,神经网络学问中很重要的一点是,样例的重复可能超乎想 象。事实上,不断地向神经网络展示所有的样例是一种标准策略。 在每个“训练轮次”〈training round或epoch〉中,神经网络都会 处于至少稍微不同的状态,而且向它“提醒”某个特定的样例对于它“记忆该样例”是有用的。(是的,这或许类似于重复在人类记忆中的有用性。)
然而,仅仅不断重复相同的样例并不够,还需要向神经网络展示样 例的变化。神经网络学问的一个特点是,这些“数据增强”的变 化并不一定要很复杂才有用。只需使用基本的图像处理方法稍微修改图像,即可使其在神经网络训练中基本上“像新的一样好”。与之类似,当人们在训练自动驾驶汽车时用完了实际的视频等数据, 可以继续在模拟的游戏环境中获取数据,而不需要真实场景的所 有细节。
那么ChatGPT呢?它有一个很好的特点,就是可以进行“无监督 学习”,这样更容易获取训练样例。回想一下,ChatGPT的基本任 务是弄清楚如何续写一段给定的文本。因此,要获得“训练样例”, 要做的就是取一段文本,并将结尾遮盖起来,然后将其用作“训练 的输入”,而“输出”则是未被遮盖的完整文本。我们稍后会更详 细地讨论这个问题,这里的重点是一(与学习图像内容不同)不 需要“明确的标签”,ChatGPT实际上可以直接从它得到的任何文本样例中学习。
神经网络的实际学习过程是怎样的呢?归根结底,核心在于确定哪 些权重能够最好地捕捉给定的训练样例。有各种各样的详细选择 和“超参数设置”(之所以这么叫,是因为权重也称为“参数”), 可以用来调整如何进行学习。有不同的损失函数可以选择,如平方和、绝对值和,等等。有不同的损失最小化方法,如每一步在权重 空间中移动多长的距离,等等。然后还有一些问题,比如“批量” (batch)展示多少个样例来获得要最小化的损失的连续估计。是的,我们可以(像在语言中所做的一样)应用机器学习来自动化机器学习,并自动设置超参数等。
最终,整个训练过程可以通过损失的减小趋势来描述(就像这个经 过小型训练的Wolfram语言进度监视器一样)。
损失通常会在一段时间内逐渐减小,但最终会趋于某个恒定值。如 果该值足够小,可以认为训练是成功的;否则可能暗示着需要尝试 更改网络的架构。
能确定“学习曲线”要多久才能趋于平缓吗?似乎也存在—种取决 于神经网络大小和数据量的近似幂律缩放关系。但总的结论是,训练神经网络很难,并且需要大量的计算工作。实际上,绝大部分工 作是在处理数的数组,这正是GPU擅长的一’这也是为什么神经 网络训练通常受限于可用的GPU数量。
未来,是否会有更好的方法来训练神经网络或者完成神经网络的任 务呢?我认为答案几乎是肯定的。神经网络的基本思想是利用大量 简单(本质上相同)的组件来创建一个灵活的“计算结构”,并使 其能够逐步通过学习样例得到改进。在当前的神经网络中,基本上是利用微积分的思想(应用于实数)来进行这种逐步的改进。但越 来越清楚的是,重点并不是拥有高精度数值,即使使用当前的方法,8位或更少的数也可能已经足够了。
对于像元胞自动机这样大体是在许多单独的位上进行并行操作的 计算系统,虽然我们一直不明白如何进行这种增量改进,但没有 理由认为这不可能实现。实际上,就像“2012年的深度学习突 破”一样,这种增量改进在复杂情况下可能会比在简单情况下更容易实现。
神经网络(或许有点像大脑)被设置为具有一个基本固定的神经 元网络,能改进的是它们之间连接的强度(“权重”)。(或许在年轻的大脑中,还可以产生大量全新的连接。)虽然这对生物学来说 可能是一种方便的设置,但并不清楚它是否是实现我们所需功能 的最佳方式。涉及渐进式网络重写的东西(可能类似于我们的物理项目)可能最终会做得更好。
但即使仅在现有神经网络的框架内,也仍然存在一个关键限制:神 经网络的训练目前基本上是顺序进行的,每批样例的影响都会被反 向传播以更新权重。事实上,就目前的计算机硬件而言,即使考虑 到神经网络的大部分在训练期间的大部分时间里也是“空 闲”的,一次只有一个部分被更新。从某种意义上说,这是因为当 前的计算机往往具有独立于CPU (或GPU)的内存。但大脑中的 情况可能不同一一每个“记忆元素”(即神经元)也是一个潜在的活跃的计算元素。如果我们能够这样设置未来的计算机硬件,就可 能会更高效地进行训练。
“足够大的神经网络当然无所不能!”
ChatGPT的能力令人印象深刻,以至于人们可能会想象,如果能够 在此基础上继续努力,训练出越来越大的神经网络,那么它们最终 将“无所不能”。对于那些容易被人类思维理解的事物,这确实很 可能是成立的。但我们从科学在过去几百年间的发展中得出的教训 是,有些事物虽然可以通过形式化的过程来弄清楚,但并不容易立 即为人类思维所理解。
非平凡的数学就是一个很好的例子,但实际而言,一般的例子是计 算。最终的问题是计算不可约性。有些计算虽然可能需要很多步才 能完成,但实际上可以“简化”为相当直接的东西。但计算不可约 性的发现意味着这并不总是有效的。对于一些过程〈可能像下面的例子一样〉,无论如何都必须回溯每个计算步骤才能弄清楚发生了 什么。
我们通常用大脑做的那类事情,大概是为了避免计算不可约性而特 意选择的。在大脑中进行数学运算需要特殊的努力。而且在实践 中,仅凭大脑几乎无法“想透”任何非平凡程序的操作步骤。
当然,我们可以用计算机来做这些。有了计算机,就可以轻松地完 成耗时很长、计算不可约的任务。关键是,完成这些任务一般来说 没有捷径可走。
是的,我们可以记住在某个特定计算系统中发生的事情的许多具体 例子,也许甚至可以看到一些(计算可约的)模式,使我们能够做 一些泛化。但关键是,计算不可约性意味着我们永远不能保证意外 不会发生一一只有通过明确的计算,才能知道在任何特定的情况下 会实际发生什么。
说到底,可学习性和计算不可约性之间存在根本的矛盾。学习实际 上涉及通过利用规律来压缩数据,但计算不可约性意味着最终对可 能存在的规律有一个限制。
在实践中,人们可以想象将(像元胞自动机或图灵机这样的)小 型计算设备构建到可训练的神经网络系统中。实际上,这样的设 备可以成为神经网络的好“工具”,就像Wolfram|Alpha可以成为ChatGPT的好工具一样。但是计算不可约性意味着人们不能指望 “进入”这些设备并让它们学习。
换句话说,能力和可训练性之间存在着一个终极权衡:你越想让一个系统“真正利用”其计算能力,它就越会表现出计算不可约性,从而越不容易被训练;而它在本质上越易于训练,就越不能进行复 杂的计算。
(对于当前的ChatGPT,情况实际上要极端得多,因为用于生成每 个输出标记的神经网络都是纯“前馈”网络、没有循环,因此无法 使用非平凡“控制流”进行任何计算。)当然,你可能会问,能够进行不可约计算是否真的很重要。实际 上,在人类历史的大部分时间里,这并不是特别重要。但我们的现 代技术世界是建立在工程学的基础上的,而工程学利用了数学计算,并且越来越多地利用了更一般的计算。看看自然界,会发现它充满了不可约计算^我们正在慢慢地理解如何模拟和利用它们来 达到我们的技术目的。
神经网络确实可以注意到自然界中我们通过“无辅助的人类思维” 也能轻易注意到的规律。但是,如果我们想解决数学或计算科学 领域的问题,神经网络将无法完成任务,除非它能有效地使用一个 “普通”的计算系统作为“工具”。
但是,这一切可能会带来一些潜在的困惑。过去,我们认为计算机 完成很多任务(包括写文章)在“本质上太难了”。现在我们看到像ChatGPT这样的系统能够完成这些任务,会倾向于突然认为计 算机一定变得更加强大了,特别是在它们已经基本能够完成的事情 (比如逐步计算元胞自动机等计算系统的行为)上实现了超越。
但这并不是正确的结论。计算不可约过程仍然是计算不可约的,对 于计算机来说仍然很困难,即使计算机可以轻松计算其中的每一 步。我们应该得出的结论是,(像写文章这样)人类可以做到但认为计算机无法做到的任务,在某种意义上计算起来实际上比我们想象的更容易。
换句话说,神经网络能够在写文章的任务中获得成功的原因是,写 文章实际上是一个“计算深度较浅”的问题,比我们想象的简单。 从某种意义上讲,这使我们距离对于人类如何处理类似于写文章的事情(处理语言)“拥有一种理论”更近了一步。
如果有一个足够大的神经网络,那么你可能能够做到人类可以轻易 做到的任何事情。但是你无法捕捉自然界一般而言可以做到的事 情,或者我们用自然界塑造的工具可以做到的事情。而正是这些工 具的使用,无论是实用性的还是概念性的,近几个世纪以来使我们 超越了“纯粹的无辅助的人类思维”的界限,为人类获取了物理宇 宙和计算宇宙之外的很多东西。
嵌入”的概念
神经网络,至少以目前的设置来说,基本上是基于数的。因此,如 果要用它来处理像文本这样的东西,我们需要一种用数表示文本的 方法。当然,我们可以(本质上和ChatGPT 一样)从为字典中的 每个词分配一个数开始。但有一个重要的思想一也是ChatGPT的中心思想一更胜一筹。这就是“嵌入”(embedding)的思想。 可以将嵌入视为一种尝试通过数的数组来表示某些东西“本质”的 方法,其特性是“相近的事物”由相近的数表示。
例如,我们可以将词嵌入视为试图在一种“意义空间”中布局词, 其中“在意义上相近”的词会出现在相近的位置。实际使用的嵌入(例如在ChatGPT中)往往涉及大量数字列表。但如果将其投影到二维平面上,则可以展示嵌入对词的布局方式。
可以看到,这确实非常成功地捕捉了我们典型的日常印象。但是如 何才能构建这样的嵌入呢?大致的想法是查看大量的文本〔这里查看了来自互联网的50亿个词〕,然后看看各个词出现的“环境”有 多“相似”。例如,alligator(短吻鳄)和crocodile(鳄鱼)在相似 的句子中经常几乎可以互换,这意味着它们将在嵌入中被放在相近 的位置。但是,turnip(芜菁)和eagle(鹰)一般不会出现在相似的句子中,因此将在嵌入中相距很远。
如何使用神经网络实际实现这样的机制呢?让我们从讨论图像的嵌 入而非词嵌入开始。我们希望找到一种以数字列表来表征图像的方 法,以便为“我们认为相似的图像”分配相似的数字列表。
如何判断我们是否应该“认为图像相似”呢?对于手写数字图像, 如果两个图像是同一个数字,我们就可能会认为它们是相似的。前 面,我们讨论了一个被训练用于识别手写数字的神经网络。可以将 这个神经网络看作被设置成在最终输出中将图像放入10个不同的 箱(bin)中,每个箱对应一个数字。
如果在神经网络做出“这是4”的最终决策之前“拦截”其内部进 程,会发生什么呢?我们可能会期望,神经网络内部有一些数值, 将图像表征为“大部分类似于4但有点类似于2”。想法是获取这 些数值并将其作为嵌入中的元素使用。
这里的关键概念是,我们不直接尝试表征“哪个图像接近哪个图 像”,而是考虑一个定义良好、可以获取明确的训练数据的任务 (这里是数字识别),然后利用如下事实:在完成这个任务时,神经 网络隐含地必须做出相当于“接近度决策”的决策。因此,我们不 需要明确地谈论“图像的接近度”,而是只谈论图像代表什么数字 的具体问题,然后“让神经网络”隐含地确定这对于“图像的接近度”意味着什么。
对于数字识别网络来说,这是如何具体操作的呢?我们可以将该网 络想象成由11个连续的层组成,并做如下简化(将激活函数显示为单独的层)。
在开始,我们将实际图像输入第一层,这些图像由其像素值的二维数组表示。在最后,我们(从最后一层)得到一个包含10个值的数组,可以认为这些值表示网络对图像与数字0到9的对应关系的 确定程度。
输入图像4,最后一层中神经元的值为
{1.42071×10-22, 7.69857×10-14,1.9653×10-16, 5.55229×10-21, 1., 8.33841×10-14, 6.89742×10-17,6.52282×10-19, 6.51465×10-12, 1.97509×10-14)
换句话说,神经网络现在“非常确定”这个图像是一个4——为了得到输出的4,我们只需要找出具有最大值的神经元的位置。
如果我们再往前看一步呢?网络中的最后一个操作是所谓的softmax,它试图“强制推出确定性”。在此之前,神经元的值是
{-26.134, -6.02347, -11.994, -22.4684, 24.1717, -5.94363, -13.0411, -17.7021, -1.58528, -7.38389}
代表数字4的神经元仍然具有最大的数值,但是其他神经元的值中 也有信息。我们可以期望这个数字列表在某种程度上能用来表征图 像的“本质”,从而提供可以用作嵌入的东西。例如,这里的每个 4都具有略微不同的“签名”(或“特征嵌入”),与8完全不同。
这里,我们基本上是用10个数来描述图像的。但使用更多的数通 常更好。例如,在我们的数字识别网络中,可以通过接入前一层来 获取一个包含500个数的数组。这可能是一个可以用作“图像嵌 入”的合理数组。
如果想要对手写数字的“图像空间”进行明确的可视化,需要将我 们得到的500维向量投影到(例如)三维空间中来有效地“降维”。
我们刚刚谈论了为图像创建特征(并嵌入)的方法,它的基础实际 上是通过(根据我们的训练集〉确定一些图像是否对应于同一个手 写数字来识别它们的相似性。如果我们有一个训练集,可以识别每 个图像属于5000种常见物体(如猫、狗、椅子……)中的哪一种, 就可以做更多这样的事情。这样,就能以我们对常见物体的识别 为“锚点”创建一个图像嵌入,然后根据神经网络的行为“围绕它 进行泛化”。关键是,这种行为只要与我们人类感知和解读图像的 方式一致,就将最终成为一种“我们认为正确”且在实践中对执行 “类人判断”的任务有用的嵌入。
那么如采用相同的方法来找到对词的嵌入呢?关键在于,要从一个我们可以轻松训练的任务开始。一个这样的标准任务是词预测。 想象一下,给定问题“the_cat”。基于一个大型文本语料库,比如互联网上的文本内容,可能用来“填空”的各个词的概率分别是 多少?或者给定“_black_”,不同的“两侧词”的概率分别是多少?
如何为神经网络设置这个问题呢?最终,我们必须用数来表述一 切。一种方法是为英语中约50000个常用词分别分配一个唯一的数。例如,分配给the的可能是914,分配给cat的的可能是3542。(这些是GPT-2实际使用的数。)因此,对于“the_cat”的问 题,我们的输入可能是丨914, 3542丨。输出应该是什么样的呢? 应该是一个大约包含500000个数的列表,有效地给出了每个可能“填入”的词的概率。为了找到嵌入,我们再次在神经网络“得到 结论”之前“拦截”它的“内部”进程,然后获取此时的数字列 表,可以认为这是“每个词的表征”。
这些表征是什么样子的呢?在过去10年里,已经出现了一系列不 同的系统(word2vec、G1oVe、BERT、GPT……),每个系统都基 于一种不同的神经网络方法。但最终,所有这些系统都是通过有几 百到几千个数的列表对词进行表征的。
这些“嵌入向量”在其原始形式下是几乎无信息的。例如,下面是 为三个特定的词生成的原始嵌入向量。
如果测量这些向量之间的距离,就可以找到词之间的“相似度”。 我们稍后将更详细地讨论这种嵌入的“认知”意义可能是什么,而 现在的要点是,我们有一种有用的方法能将词转化为“对神经网络 友好”的数字集合。
实际上,比起用一系列数对词进行表征,我们还可以做得更好一 可以对词序列甚至整个文本块进行这样的表征。ChatGPT内部就是这样进行处理的。它会获取到目前为止的所有文本,并生成一个嵌 入向量来表示它。然后,它的目标就是找到下一个可能出现的各个 词的概率。它会将答案表示为一个数字列表,这些数基本上给出了 大约50000个可能出现的词的概率。
[严格来说,ChatGPT并不处理词,而是处理“标记”(token)——这是一种方便的语言单位,既可以是整个词,也可以只是像pre、ing或ized这样的片段。使用标记使ChatGPT更容易处理罕见词、 复合词和非英语词,并且会发明新单词(不论结果好坏)。]
ChatGPT的内部原理
我们终于准备好讨论ChatGPT的内部原理了。从根本上说,ChatGPT是一个庞大的神经网络——GPT-3拥有1750亿个权重。 它在许多方面非常像我们讨论过的其他神经网络,只不过是一个 特别为处理语言而设置的神经网络。它最显著的特点是一个称为Transformer的神经网络架构。
在前面讨论的神经网络中,任何给定层的每个神经元基本上都与 上一层的每个神经元相连(起码有一些权重)。但是,如果处理的 数据具有特定的已知结构,则这种全连接网络就(可能)大材小用 了。因此,以图像处理的早期阶段为例,通常使用所谓的卷积神经 网络(convolutional neural net或convnet),其中的神经元被有效 地布局在类似于图像像素的网格上,并且仅与在网格上相邻的神经元相连。
Transformer的思想是,为组成一段文本的标记序列做与此相似的 事情。但是,Transformer不是仅仅定义了序列中可以连接的固定 区域,而是引入了“注意力”的概念一即更多地“关注”序列 的某些部分,而不是其他部分。也许在将来的某一天,可以启动一个通用神经网络并通过训练来完成所有的定制工作。但至少目前来看,在实践中将事物“模块化”似乎是至关重要的——就像Transformer所做的那样,也可能是我们的大脑所做的那样。
ChatGPT(或者说它基于的GPT-3网络)到底是在做什么呢?它 的总体目标是,根据所接受的训练(查看来自互联网的数十亿页文 本,等等〉,以“合理”的方式续写文本。所以在任意给定时刻, 它都有一定量的文本,而目标是为要添加的下一个标记做出适当的 选择。
它的操作分为三个基本阶段。第一阶段,它获取与目前的文本相对 应的标记序列,并找到表示这些标记的一个嵌入(即由数组成的数 组兑第二阶段,它以“标准的神经网络的方式”对此嵌入进行操 作,值“像涟漪一样依次通过”网络中的各层,从而产生一个新的嵌入(即一个新的数组第三阶段,它获取此数组的最后一部分, 并据此生成包含约50000个值的数组,这些值就成了各个可能的 下一个标记的概率。(没错,使用的标记数量恰好与英语常用词的 数量相当,尽管其中只有约3000个标记是完整的词,其余的则是片段。)
关键是,这条流水线的每个部分都由一个神经网络实现,其权重是 通过对神经网络进行端到端的训练确定的。换句话说,除了整体架构,实际上没有任何细节是有“明确设计”的,一切都是从训练数据中“学习”来的。
然而,架构设置中存在很多细节,反映了各种经验和神经网络的学 问。尽管会变得很复杂,但我认为谈论一些细节是有用的,至少有 助于了解构建需要做多少工作。
首先是嵌入模块。以下是GPT-2的Wolfram语言示意图。
输入是一个包含n个〈由整数1到大约50 000表示的〉标记的向 量。每个标记都(通过一个单层神经网络)被转换为一个嵌入向量 (在中长度为768,在ChatGPT-2的GPT-3中长度为12288 同时,还有一条“二级路径”,它接收标记的(整数〉位置序列, 并根据这些整数创建另一个嵌入向量。最后,将标记值和标记位置 的嵌入向量相加,产生嵌入糢块的最终嵌入向量序列。
为什么只是将标记值和标记位置的嵌入向量相加呢?我不认为有什 么特别的科学依据。只是因为尝试了各种不同的方法,而这种方法 似乎行得通。此外,神经网络的学问告诉我们,(在某种意义上) 只要我们的设置“大致正确”,通常就可以通过足够的训练来确定 细节,而不需要真正“在工程层面上理解”神经网络是如何配置自己的。
嵌入模块对字符串“hello hello hello hello hello hello hello hello hello hello bye bye bye bye bye bye bye bye bye)所做的操作如下所示。
(在上图的第一个数组中)每个标记的嵌入向量元素都在图中纵向 显示,而从左往右看,首先是一系列hello嵌入,然后是一系列bye嵌入。上面的第二个数组是位置嵌入,它看起来有些随机的结 构只是(这里是在中〉“碰巧学到”的。
在嵌入模块之后,就是Transformer的“主要事件”了 :一系列所 谓的“注意力块”〈GPT-2有12个,ChatGPT的GPT-3有96个〉。
整个过程非常复杂,让人想起难以理解的大型工程系统或者生物系 统。以下是(GPT-2中)单个“注意力块”的示意图。
在每个这样的注意力块中,都有―组“注意力头”〈GPT-2有12个,ChatGPT的GPT-3有96个〉——每个都独立地在嵌入向量的 不同值块上进行操作。(我们不知道为什么最好将嵌入向量分成不 同的部分,也不知道不同的部分“意味”着什么。这只是那些“被 发现奏效”的事情之一。)
注意力头是做什么的呢?它们基本上是一种在标记序列(即目前已 经生成的文本〉中进行“回顾”的方式,能以一种有用的形式“打 包过去的内容”,以便找到下一个标记。在“概率从何而来”一节 中,我们介绍了使用二元词的概率来根据上一个词选择下一个词。Transformer中的“注意力”机制所做的是允许“关注”更早的词, 因此可能捕捉到(例如〉动词可以如何被联系到出现在句子中很多 词之前的名词。
更详细地说,注意力头所做的是,使用一定的权重重新加权组合 与不同标记相关联的嵌入向量中的块。例如,对于上面的“hello,bye”字符串,(GPT-2中)第一个注意力块中的12个注意力头具有以下(“回顾到标记序列开头”的)“权重重组”模式。
经过注意力头的处理,得到的“重新加权的嵌入向量”(在GPT-2中长度为768,在GPT-3中长度为12288)将被传递通过标准的“全连接”神经网络层。虽然很难掌握这一层的作用, 但是可以看看它(这里是在GPT-2中)使用的768 X 768权重矩阵。
(对上图进行)4 X 64的滑动平均处理,一些(随机游走式的)结构开始显现。
是什么决定了这种结构?说到底,可能是对人类语言特征的一些 “神经网络编码”。但是到目前为止,这些特征到底是什么仍是未知 的。实际上,我们正在“打开ChatGPT(或者至少是的GPT-2)大脑”,并发现里面很复杂、难以理解——尽管它最终产生了可识别 的人类语言。
经过一个注意力块后,我们得到了一个新的嵌入向量,然后让它 依次通过其他的注意力块(GPT-2中共有12个,GPT-3中共有96个)。每个注意力块都有自己特定的“注意力”模式和“全连接” 权重。这里是GPT-2对于“hello,bye”输入的注意力权重序列,用于第一个注意力头。
全连接层的(移动平均)“矩阵”如下所示。
奇怪的是,尽管不同注意力块中的“权重矩阵”看起来非常相似, 徂权重大小的分布可能会有所不同〈而且并不总是服从髙斯分布)。
在经过所有这些注意力块后,Transformer的实际效果是什么?本质上,它将标记序列的原始嵌入集合转换为最终集合。ChatGPT的特定工作方式是,选择此集合中的最后一个嵌入,并对其进行“解 码”,以生成应该出现的下一个标记的概率列表。
以上就是对ChatGPT内部原理的概述。它虽然(由于许多难免有 些随意的“工程选择”)可能看起来很复杂,但实际上涉及的最终 元素非常简单。因为我们最终处理的只是由“人工神经元”构成的 神经网络,而每个神经元执行的只是将一组数值输入与一定的权重 相结合的简单操作。
ChatGPT的原始输入是一个由数组成的数组(到目前为止标记的嵌 入向量)。当ChatGPT“运行”以产生新标记时,这些数就会“依次通过”神经网络的各层,而每个神经元都会“做好本职工作”并将结果传递给下一层的神经元。没有循环和“回顾”。—切都是在 网络中“向前馈送”的。
这是与典型的计算系统(如图灵机)完全不同的设置——在这里, 结果不会被同一个计算元素“反复处理”。至少在生成给定的输出 标记时,每个计算元素(神经元)仅使用了一次。
但是在某种意义上,即使在ChatGPT中,仍然存在一个重复使用 计算元素的“外部循环”。因为当ChatGPT要生成一个新的标记时,它总是“读取”〈即获取为输入〉之前的整个标记序列,包括ChatGPT自己先前“写入”的标记。我们可以认为这种设置意味着 确实,至少在其最外层,包含一个“反馈循环”,尽管其 中的每次迭代都明确显示为它所生成文本中的一个标记。
让我们回到ChatGPT的核心:神经网络被反复用于生成每个标记。 在某种程度上,它非常简单:就是完全相同的人工神经元的一个集 合。网络的某些部分仅由(“全连接”的)神经元层组成,其中给 定层的每个神经元都与上一层的每个神经元(以某种权重〉相连。 但是由于特别的架构,ChatGPT的一些部分具有其他的结构,其中仅连接不同层的特定神经元。(当然,仍然可以说 “所有神经元都连接在一起”,但有些连接的权重为零。)
此外,ChatGPT中神经网络的有些方面并不能被顺理成章地认为 只由“同质”层组成。例如,(正如本节中单个“注意力块”的示 意图所示)在注意力块内有一些对传入的数据“制作多个副本”的 地方,每个副本都会通过不同的“处理路径”,可能涉及不同数量的层,然后才被重新组合。虽然这可能简便地表示了正在发生的事 情,但至少原则上总是可以将事实考虑为“密集填充”各层,只是 有一些权重为零。
看一下ChatGPT最长的路径,会发现大约有400个(核心)层——在某种程度上看来并不是很多。但是它们包括数百万个神经 元,总共有1750亿个连接,因此有1750亿个权重。需要认识到的 一件事是,ChatGPT每生成一个新的标记,都必须进行一次包括所有这些权重在内的计算。在实现上,这些计算可以“按层”组织成 高度并行的数组操作,方便地在上完成。但是对于每个产生 的标记,仍然需要进行1750亿次计算(并在最后进行一些额外的 计算)——因此,不难理解使用ChatGPT生成一段长文本需要一些时间。
值得注意的是,所有这些操作——尽管各自都很简单——可以一 起出色地完成生成文本的“类人”工作。必须再次强调,(至少就 我们目前所知〕没有“理论上的终极原因”可以解释为什么类似于 这样的东西能够起作用。事实上,正如我们将讨论的那样,我认为 必须将其视为一项(可能非常惊人的)科学发现:在像ChatGPT这样的神经网络中,能以某种方式捕捉到人类大脑在生成语言时所做事情的本质。
ChatGPT的训练
我们已经概述了ChatGPT在设置后的工作方式。但是它是如何设 置的呢?那1750亿个神经元的权重是如何确定的呢?基本上,这 是基于包含人类所写文本的巨型语料库(来自互联网、书籍等〉, 通过大规模训练得出的结果。正如我们所说,即使有所有这些训练 数据,也不能肯定神经网络能够成功地产生“类人”文本。似乎需 要细致的工程设计才能实现这一点。但是,ChatGPT带来的一大惊 喜和发现是,它完全可以做到。实际上,“只有1750亿个权重”的 神经网络就可以构建出人类所写文本的一个“合理模型”。
现代社会中,人类写的很多文本以数字(digital)形式存在。公共 互联网上至少有数十亿个包含人类所写文本的网页,总词数可能 达到万亿级别。如果包括非公开的网页,词数可能会增加至少100 倍。到目前为止,已经有超过500万本电子书可供阅读(全球发行的图书品种总数为1亿左右〉,提供了另外约1000亿个词的文本。 这还不包括视频中的口述文本等。(就个人而言,我一生中发表的 文字总量不到300万个词,在过去30年中写下了约1500万个词的 电子邮件,总共敲了大约5000万个词一而且仅在过去几年的直播 中,我就说了超过1000万个词。是的,我会从中训练一个机器人。)
但是,有了所有这些数据,要如何训练神经网络呢?基本过程与 上面讨论的简单示例非常相似:先提供一批样例,然后调整网络 中的权重,以最小化网络在这些样例上的误差(“损失”)。根据误 差“反向传播”的主要问题在于,每次执行此操作时,网络中的每 个权重通常都至少会发生微小的变化,而且有很多权重需要处理。 〈实际的“反向传播”通常只比前向传播难—点儿一一相差一个很 小的常数系数。) 使用现代硬件,可以轻松地从成千上万个样例中并行计算出 结果。但是,当涉及实际更新神经网络中的权重时,当前的方法基 本上会要求逐批进行。(是的,这可能是结合了计算元素和记忆元 素的真实大脑至少在现阶段具有架构优势的地方。) 即使在学习数值函数这样看似简单的案例中,我们通常也需要使用 数百万个样例才能成功地训练网络,至少对于从头开始训练来说是 这样的。那么需要多少样例才能训练出“类人语言”模型呢?似乎 无法通过任何基本的“理论”方法知道。但在实践中,ChatGPT成功地在包含几百亿个词的文本上完成了训练。
虽然有些文本被输入了多次,有些只输入了一次,但ChatGPT从 它看到的文本中“得到了所需的信息”。考虑到有这么多文本需要学习,它需要多大的网络才能“学得好”呢?目前,我们还没有基 本的理论方法来回答这个问题。最终,就像下面将进一步讨论的那样,对于人类语言和人类通常用它说什么,可能有某种“总体算法 内容”。而下一个问题是:神经网络在基于该算法内容实现模型时 会有多高效?我们还是不知道,尽管ChatGPT的成功表明它是相 当高效的。
最终,我们只需注意到ChatGPT使用了近2000亿个权重来完成其 工作一数愤与其接受的训练数据中的词(或标记)的总数相当。 在某些方面,运作良好的“网络的规模”与“训练数据的规模”如 此相似或许令人惊讶(在与ChatGPT结构相似的较小网络中实际观察到的情况也丛如此)。毕竟,ChatGPT内部并没有直接存储来自互联网、书籍等的所有文本。因为ChatGP内部实际上是一堆数 (精度不到10位),它们是所有文本的总体结构的某种分布式编码。
换句话说,我们可以问人类语言的“有效信息”是什么,以及人类 通常用它说些什么。我们有语言样例的原始语料库。在ChatGPT的神经网络中,还有对它们的表示。这些表示很可能远非“算法上最小”的表示,正如下面将讨论的那样。但它们是神经网络可以 轻松使用的表示。在这种表示中,训练数据的“压缩”程度似乎很低。平均而言,似乎只需要不到一个神经网络的权重就可以承载一 个词的训练数据的“信息内容”。
当我们运行ChatGPT来生成文本时,基本上每个权重都需要使用一次。因此,如果有n个权重,就需要执行约n个计算步骤一尽管在实践中,许多计算步骤通常可以在GPU中并行执行。但是, 如果需要约n个词的训练数据来设置这些权重,那么如上所述,我 们可以得出结论:需要约n2个计算步骤来进行网络的训练。这就是为什么使用当前的方法最终需要耗费数十亿美元来进行训练。
在基础训练之外
训练ChatGPT的重头戏是在向其“展示”来自互联网、书籍等的 大量现有文本,但事实证明训练还包括另一个(显然非常重要的) 部分。
一旦根据被展示的原始文本语料库完成“原始训练”,ChatGPT内部的神经网络就会准备幵始生成自己的文本,根据提示续写,等 等。尽管这些结果通常看起来合理,但它们很容易〈特别是在较长 的文本片段中〉以“非类人”的方式“偏离正轨”。这不是通过对 文本进行传统的统计可以轻易检测到的。但是,实际阅读文本的人 很容易注意到。
构建ChatGPT的一个关键思想是,在“被动阅读”来自互联网等的内容之后添加一步:让人类积极地与ChatGPT互动,看看它产生了什么,并且在“如何成为一个好的聊天机器人”方面给予实际反馈。 但是神经网络是如何利用这些反馈的呢?首先,仅仅让人类对神 经网络的结果评分。然后,建立另一个神经网络模型来预测这些评分。现在,这个预测模型可以在原始网络上运行一一本质上像损失函数一样一一从而使用人类的反馈对原始网络进行“调优”。实践中的结果似乎对系统能否成功产生“类人”输出有很大的影响。
总的来说,有趣的是,“原本训练好的网络”似乎只需要很少的“介入”就能在特定方向上有效地进步。有人可能原本认为,为了 让网络表现得好像学到了新东西,就必须为其训练算法、调整权 重,等等。
但事实并非如此。相反,基本上只需要把东西告诉ChatGPT一次——作为提示的一部分——它就可以成功用其生成文本。再次 强调,我认为这种方法有效的事实是理解ChatGPT“实际上在做什 么”以及它与人类语言和思维结构之间关系的重要线索。
它确实有些类人:至少在经过所有预训练后,你只需要把东西告诉它一次,它就能“记住”一至少记住足够长的时间来生成一段文本。这里面到底发生了什么事呢?也许“你可能告诉它的一切都已 经在里面的某个地方了”,你只是把它引导到了正确的位置。但这 似乎不太可能。更可能的是,虽然这些元素已经在里面了,但具体 情况是由类似于“这些元素之间的轨迹”所定义的,而你告诉它的就是这条轨迹。
就像人类一样,如果ChatGPT接收到一些匪夷所思、出乎意料、 完全不符合它已有框架的东西,它就似乎无法成功地“整合”这些 信息。只有在这些信息基本上以一种相对简单的方式依赖于它已有的框架时,它才能够进行“整合”。
值得再次指出的是,神经网络在捕捉信息方面不可避免地存在“算 法限制”。如果告诉它类似于“从这个到那个”等“浅显”的规则, 神经网络很可能能够不错地表示和重现这些规则,并且它“已经掌 握”的语言知识将为其提供一个立即可用的模式。但是,如果试图 给它实际的“深度”计算规则,涉及许多可能计算不可约的步骤, 那么它就行不通了。(请记住,它在每一步都只是在网络中“向前 馈送数据”,除非生成新的标记,否则它不会循环。〉
当然,神经网络可以学习特定的“不可约”计算的答案。但是,一 旦存在可能性的组合数,这种“表查找式”的方法就不起作用了。 因此,就像人类一样,神经网络此时需要使用真正的计算工具。 (没错,Wolfram|Alpha和Wolfram语言就非常适用,因为它们正 是被构建用于“谈论世界中的事物”的,就像语言模型神经网络 —样。)
真正让ChatGPT发挥作用的是什么
人类语言,及其生成所涉及的思维过程,一直被视为复杂性的巅 峰。人类大脑“仅”有约1000亿个神经元(及约100万亿个连 接〉,却能够做到这一切,确实令人惊叹。人们可能会认为,大脑 中不只有神经元网络,还有某种具有尚未发现的物理特性的新层。 但是有了ChatGPT之后,我们得到了一条重要的新信息:一个连 接数与大脑神经元数量相当的纯粹的人工神经网络,就能够出色地生成人类语言。
这仍然是一个庞大而复杂的系统,其中的神经网络权重几乎与当前 世界上可用文本中的词一样多。但在某种程度上,似乎仍然很难相 信语言的所有丰富性和它能谈论的事物都可以被封装在这样一个有 限的系统中。这里面的部分原理无疑反映了一个普遍现象[这个现 象最早在规则30(是本书作者在1983年提出的单维二进制元胞自动机规则。这个简 单、已知的规则能够产生复杂且看上去随机的模式)的例子中变得显而易见]:即使基础规则很简单, 计算过程也可以极大地放大系统的表面复杂性。但是,正如上面讨 论的那样,ChatGPT使用的这种神经网络实际上往往是特别构建的,以限制这种现象(以及与之相关的计算不可约性)的影响,从而使它们更易于训练。
那么,ChatGPT是如何在语言方面获得如此巨大成功的呢?我认为 基本答案是,语言在根本上比它看起来更简单。这意味着,即使是 具有简单的神经网络结构的ChatGPT,也能够成功地捕捉人类语言 的“本质”和背后的思维方式。此外,在训练过程中,ChatGPT已经通过某种方式“隐含地发现” 了使这一切成为可能的语言(和思 维)规律。
我认为,ChatGPT的成功为一个基础而重要的科学事实向我们提供 了证据:它表明我们仍然可以期待能够发现重大的新“语言法则”, 实际上是“思维法则”。在ChatGPT中,由于它是一个神经网络, 这些法则最多只是隐含的但是,如果我们能够通过某种方式使这些法则变得明确,那么就有可能以更直接、更高效和更透明的方式 做出ChatGPT所做的那些事情。
这些法则可能是什么样子的呢?最终,它们必须为我们提供某种 关于如何组织语言及其表达方式的指导。我们稍后将讨论“在 ChatGPT内部”可能如何找到一些线索,并根据构建计算语言的经 验探索前进的道路。但首先,让我们讨论两个早已知晓的“语言法 则”的例子,以及它们与ChatGPT的运作有何关系。
第一个是语言的语法。语言不仅仅是把一些词随机拼凑在一起。相反,不同类型的词之间有相当明确的语法规则。例如,在英语中, 名词的前面可以有形容词、后面可以有动词,但是两个名词通常不 能挨在一起。这样的语法结构可以通过一组规则来(至少大致地)捕捉,这些规则定义了如何组织所谓的“解析树”。
ChatGPT并不明确地“了解”这些规则。但在训练过程中,它隐 含地发现了这些规则,并且似乎擅长遵守它们。这里的原理是什么 呢?在“宏观”上还不清楚。但是为了获得一些见解,也许可以看 看一个更简单的例子。
考虑一种由“(”和“)”的序列组成的“语言”,其语法规定括号 应始终保持平衡,就像下面的解析树—样。
我们能训练神经网络来生成“语法正确”的括号序列吗?在神经 网络中,有各种处理序列的方法,但是这里像ChatGPT一样使用Transformer网络。给定一个简单的Transformer网络,我们可以首 先向它馈送语法正确的括号序列作为训练样例。一个微妙之处(实 际上也出现在ChatGPT的人类语言生成中)是,除了我们的“内 容标记”〔这里是“(”和“)”)之外,还必须包括一个“end”标 记,表示输出不应继续下去了〈即对于ChatGPT来说,已经到达了 “故事的结尾”)。
如果只使用一个有8个头的注意力块和长度为128的特征向量来设置Transformer网络(ChatGPT也使用长度为128的特征向量,但 有96个注意力块,每个块有96个头),似乎不可能让它学会括号语言。但是使用2个注意力块,学习过程似乎会收敛——至少在给 出1000万个样例之后(并且,与Transformer网络一样,展示更多的样例似乎只会降低其性能)。
通过这个网络,我们可以做类似于ChatGPT所做的事情,询问括 号序列中下一个符号是什么的概率。
在第一种情况下,网络“非常确定”序列不能在此结束——这很好,因为如果在此结束,括号将不平衡。在第二种情况下,网络 “正确地识别出”序列可以在此结束,尽管它也“指出”可以“重 新开始下一个标记是“(”,后面可能紧接着一个“)”。但糟糕 的是,即使有大约400 000个经过繁重训练的权重,它仍然说下一 个标记是“)”的概率是15%——这是不正确的,因为这必然会导 致括号不平衡。
如果要求网络以最高概率补全逐渐变长的“(”序列,结果将如下所示。
在一定长度内,网络是可以正常工作的。但是一旦超出这个长度, 它就开始出错。这是在神经网络(或广义的机器学习〉等“精确” 情况下经常出现的典型问题。对于人类“一眼就能解决”的问题,
神经网络也可以解决。但对于需要执行“更算法式”操作的问题(例如明确计算括号是否闭合),神经网络往往会“计算过浅”,难 以可靠地解决。顺便说一句,即使是当前完整的ChatGPT在长序列中也很难正确地匹配括号。
对于像ChatGPT这样的程序和英语等语言的语法来说,这意味着什么呢?括号语言是“严谨”的,而且是“算法式”的。而在英语中,根据局部选词和其他提示“猜测”语法上合适的内容更为现 实。是的,神经网络在这方面做得要好得多一一尽管它可能会错 过某些“形式上正确”的情况,但这也是人类可能会错过的。重点 是,语肓存在整体的句法结构,而且它蕴含猎规律性。从某种意义上说,这限制了神经网络滿要学习的内容“多少”。一个关键的“类自然科学”观察结果是,神经网络的Transformer架构,就像ChatGPT中的这个,好像成功地学会了似乎在所有人类语言中都存 在(至少在某种程度上是近似的)的嵌套树状的句法结构。
语法为语言提供了一种约束,但显然还有更多限制。像“Inquisitive electrons eat blue theories for fish”〈好奇的电子为了鱼吃蓝色的理论)这样的句子虽然在语法上是正确的,但不是人们通常会说的 话。ChatGPT即使生成了它,也不会被认为是成功的一因为用 其中的词的正常含义解读的话,它基本上是毫无意义的。
有没有一种通用的方法来判断一个句子是否有意义呢?这方面没有传统的总体理论。但是可以认为,在用来自互联网等处的数十亿个 (应该有意义的)句子对ChatGPT进行训练后,它已经隐含地“发 展出”了一个这样的“理论”。
这个理论会是什么样的呢?它的冰山一角基本上已经为人所知了 2000多年,那就是逻辑。在亚里士多德发现的三段论(syllogistic) 形式中,逻辑基本上用来说明遵循一定模式的句子是合理的,而其 他句子则不合理。例如,说“所有X都是Y。这不是Y,所以它不是X”(比如“所有的鱼都是蓝色的。这不是蓝色的,所以它不是 鱼” 是合理的。就像可以异想天开地想象亚里士多德是通过(“机 器学习式”地)研究大量修辞学例子来发现三段论逻辑一样,也可以想象ChatGPT在训练中通过查看来自互联网等的大量文本能够 “发现三段论逻辑”。(虽然可以预期ChatGPT会基于三段论逻辑等产生包含“正确推理”的文本,但是当涉及更复杂的形式逻辑时, 情况就完全不同了。我认为可以预期它在这里失败,原因与它在括 号匹配上失败的原因相同。〉
除了逻辑的例子之外,关于如何系统地构建(或识别)有合理意义的文本,还有什么其他可说的吗?有,比如像Mad Libs这样使用 非常具体的“短语模板”的东西。但是,ChatGPT似乎有一种更一 般的方法来做到这一点。也许除了“当你拥有1750亿个神经网络 权重时就会这样”,就没有什么别的可以说广。但是我强烈怀疑有 —个更简单、更有力的故事。
意义空间和语义运动定律
之前讨论过,在ChatGPT内部,任何文本都可以被有效地表示为 一个由数组成的数组,可以将其视为某种“语言特征空间”中一 个点的坐标。因此,ChatGPT续写一段文本,就相当于在语言特 征空间中追踪一条轨迹。现在我们会问:是什么让这条轨迹与我 们认为有意义的文本相对应呢?是否有某种“语义运动定律”定 义(或至少限制〕了语言特征空间中的点如何在保持“有意义” 的同时到处移动?
这种语言特征空间是什么样子的呢?以下是一个例子,展示了如果 将这样的特征空间投影到二维平面上,单个词(这里是常见名词) 可能的布局方式。
我们在介绍嵌入时见过一个包含植物词和动物词的例子。这两个例 子都说明了,“语义上相似的词”会被放在相近的位置。
再看一个例子,下图展示了不同词性的词是如何布局的。
当然,一个词通常不只有“一个意思” ^也不一定只有一种词性 通过观察包含一个词的句子在特征空间中的布局,人们通常可以 “分辨出”它们不同的含义,就像如下例子中的crane这个词(指 的是“鹤”还是“起重机”?)。
看来,至少可以将这个特征空间视为将“意思相近的词”放在这 个空间中的相近位置。但是,我们能够在这个空间中识别出什么 样的额外结构呢?例如,是否存在某种类似于“平行移动”的概 念,反映了空间的“平坦性”?理解这一点的一种方法是看一下相似的词。
即使投影到二维平面上,也通常仍然有一些“平坦性的迹象”,虽然这并不是普遍存在的。
那么轨迹呢?我们可以观察ChatGPT的提示在特征空间中遵循的轨迹,然后可以看到ChatGPT是如何延续这条轨迹的。
这里无疑没有“几何上显而易见”的运动定律。这一点儿也不令人 意外,我们充分预期到了这会相当复杂。例如,即使存在一个“语 义运动定律”,我们也远不淸楚它能以什么样的嵌入(实际上是 “变量”)来最自然地表述。
在上图中,我们展示了“轨迹”中的几步——在每一步,我们都选择了ChatGPT认为最有可能(“零温度”的情况)出现的词。不过,我们也可以询问在某一点处可能出现的“下一个”词有哪些以及它们出现的概率是多少。
在这个例子中,我们看到的是由高概率词组成的一个“扇形”,它 似乎在特征空间中朝着一个差不多明确的方向前进。如果继续前进 会发生什么?沿轨迹移动时出现的连续“扇形”如下所示。
下面是一幅包含40步的三维示意图。
这看起来很混乱,并且没有特别推动通过实证研究“ChatGPT内部的操作”来识别“类似数学物理”的“语义运动定律”。但也许我 们只是关注了“错的变量”〔或者错的坐标系〉,如果关注对的那 —个,就会立即看到ChatGPT正在做“像数学物理一样简单”的 事情,比如沿测地线前进。但目前,我们还没有准备好从它的“内部行为”中“实证解码”ChatGPT已经“发现”的人类语言的“组织”规律。
语义语法和计算语言的力量
产生“有意义的人类语言”需要什么?过去,我们可能认为人类大 脑必不可少。但现在我们知道,ChatGPT的神经网络也可以做得非 常出色。这或许就是我们所能达到的极限,没有比这更简单(或更 易于人类理解〉的方法可以使用了。不过,我强烈怀疑ChatGPT的成功暗示了一个重要的“科学”事实:有意义的人类语言实际上 比我们所知道的更加结构化、更加简单,最终可能以相当简单的规 则来描述如何组织这样的语言。
正如上面提到的,句法语法为如何组织人类语言中属于不同词性的 词提供了规则。但是为了处理意义,我们需要更进一步。一种方法 是不仅考虑语言的句法语法,还要考虑语义语法。
对于句法,我们识别出名词和动词,等等。但对于语义,我们需要 “更精细的分级”。例如,我们可以识别出“移动”的概念和一个“不因位置而改变身份”的“对象”的概念。这些“语义概念”的 例子数不胜数。但对于我们要用的语义语法,只需要一些基本的规 则,基本上来说就是“对象”可以“移动”。关于这可能如何工作, 有很多要说的(其中一些之前已经说过但我在这里只会说几句表明一些潜在前进道路的话。
值得一提的是,即使一句话在语义语法上完全没问题,也不意味着它已经(或者能)在实践中成真。“The elephant traveled to the moon”(大象去了月球)这句话毫无疑问会“通过”我们的语义语法,但 (至少目前)在我们的现实世界中还没有成真,虽然它绝对可以在虚构的世界中成真。 当我们开始谈论“语义语法”时,很快就会问:它的底层是什么? 它假设了什么样的“世界模型”?句法语法实际上只是关于由词构 建语言的。但是语义语法必然涉及某种“世界模型” 一一类似于“骨架”,由实际的词构成的语言可以基于它分层。
直到不久之前,我们可能还是认为(人类)语言将是描述“世界模型”的唯一通用方式。几个世纪前,人们就已经开始针对特定种类 的事物进行形式化,特别是基于数学。但是现在有了一种更通用的形式化方法:计算语言。
是的,这是我四十多年来一直在研究的大型项目(现在体现在Wolfram语言中开发一种精确的符号表示,以尽可能广泛地谈论世界上的事物,以及我们关心的抽象事物。例如,我们有城市、 分子、图像和神经网络的符号表示,还有关于如何计算这些事物的内置知识。
经过几十年的努力,我们已经在许多领域中运用了这种方法。但是过去,我们并没有特别用其处理“日常话语”。在“我买了两斤苹 果”中,我们可以轻松地表示“两斤苹果”(并进行有关的营养和其他计算),但是(还)没有找到“我买了”的符号表示。
这一切都与语义语法的思想有关一~目标是拥有一个对各种概念通用的符号“构造工具包”,用于对什么可以与什么组合在一起给出规则,从而对可以转化为人类语言的“流”给出规则。
假设我们有这种“符号话语语言”,我们会用它做什么呢?首先可 以生成“局部有意义的文本”。但最终,我们可能想要更有“全局 意义”的结果一一这意味着“计算”更多实际存在或发生于世界 (或某个与现实一致的虚构世界)中的事情。
在Wolfram语言中,我们已经拥有了关于许多种事物的大量内置 计算知识。但如果要建立一种完整的符号话语语言,我们还需要纳 入关于世界上一般事物的额外“计算方法”(calculi):如果一个物 体从A移动到B,然后从B移动到C,那么它就从A移动到了C,等等。
我们不仅可以用符号话语语言来做“独立的陈述”,而且可以用它 来问关于世界的问题,就像对Wolfram|Alpha所做的那样。此外, 也可以用它来陈述我们“想要实现”的事情,这可能需要一些外部 激活机制;还可以用它来做断言一也许是关于实际世界的,也许 是关于某个我们正在考虑的(无论是虚构还是其他的)特定世界的。 人类语言是不精确的,这主要是因为它没有与特定的计算实现相“结合”,其意义基本上只由其使用者之间的“社会契约”定义。 但是,计算语言在本质上具
有一定的精确性,因为它指定的内容最 终总是可以“在计算机上毫无歧义地执行”。人类语言有一定的模 糊性通常无伤大雅。(当我们说“行星”时,是否包括外行星呢? 等等。但在计算语言中,我们必须对所做的所有区别进行精确和 清晰的说明。
在计算语言中,利用普通的人类语言来创造名称通常很方便。但是 这些名称在计算语言中的含义必须是精确的,可能涵盖也可能不涵 盖典型人类语言用法中的某些特定内涵。
如何确定适用于一般符号话语语言的“本体论”以)呢? 这并不容易。也许这就是自亚里士多德2000多年前对本体论做出 原始论述以来,在这些方面几乎没有什么进展的原因。但现在,我 们已经知道了有关如何以计算的方式来思考世界的许多知识,这确 实很有帮助(从我们的Physics Project和ruliad[本书作者创造的概念,即所有可能的计算过程的纠缠上限:以各种可能的方式遵循所有可能的计算规则的结果。详见文章“the concept of the ruliad”]思想中得到“基本 的形而上学”也无妨)。
所有这些在ChatGPT中意味着什么呢?在训练中,有效 地“拼凑出”了一定数量(相当惊人)的相当于语义语法的东西。 它的成功让我们有理由认为,构建在计算语言形式上更完整的东西 是可行的。与我们迄今为止对ChatGPT内部的理解不同的是,我 们可以期望对计算语言进行设计,使其易于被人类理解。
当谈到语义语法时,我们可以将其类比于三段论逻辑。最初,三段 论逻辑本质上是关于用人类语言所表达的陈述的一组规则。但是, 当形式逻辑被发展出来时(没错,在2000多年之后〉,三段论逻 辑最初的基本结构也可以用来构建巨大的“形式化高塔”,能用于 解释(比如〉现代数字电路的运作。因此,我们可以期待更通用的 语义语法也会如此。起初,它可能只能处理简单的模式,例如文 本。但是,一旦它的整体计算语言框架被建立起来,我们就可以期 待用它来搭建“广义语义逻辑”的高塔,让我们能够以精确和形式 化的方式处理以前接触不到的各种事物(相比之下,我们现在只能 在“地面层”处理人类语言,而且带有很大的模糊性 我们可以将计算语言一一和语义语法一一的构建看作一种在表示 事物方面的终极压缩。因为它使我们不必(比如)处理存在于普通 人类语言中的所有“措辞”,就能够谈论可能性的本质。可以认为 ChatGPT的巨大优势与之类似:因为它也在某种意义上“钻研”至|』 了,不必考虑可能的不同措辞,就能“以语义上有意义的方式组织 语言”的地步。
如果我们将ChatGPT应用于底层计算语言,会发生什么呢?计算 语言不仅可以描述可能的事物,而且还可以添加一些“流行”之 感,例如通过阅读互联网上的所有内容做到。但是,在底层,使用 计算语言操作意味着像ChatGPT这样的系统可以立即并基本地访 问能进行潜在不可约计算的终极工具。这使ChatGPT不仅可以生 成合理的文本,而且有望判断文本是否实际上对世界(或其所谈论 的任何其他事物)做出了“正确”的陈述。
那么ChatGPT到底在做什么? 它为什么能做到这些?
ChatGPT的基本概念在某种程度上相当简单:首先从互联网、书籍等获取人类创造的海量文本样本,然后训练一个神经网络来生成 “与之类似”的文本。特别是,它能够从“提示”开始,继续生成 “与其训练数据相似的文本”。
正如我们所见,ChatGPT中的神经网络实际上由非常简单的元素组 成,尽管有数十亿个。神经网络的基本操作也非常简单,本质上是 对于它生成的每个新词(或词的一部分),都将根据目前生成的文 本得到的输入依次传递“给其所有元素一次”〔没有循环等〕。
值得注意和出乎意料的是,这个过程可以成功地产生与互联网、书 籍等中的内容“相似”的文本。ChatGPT不仅能产生连贯的人类语言,而且能根据“阅读”过的内容来“循着提示说一些话”。它并不总是能说出“在全局上有意义”(或符合正确计算)的话,因为 (如果没有利用Wolffram|Alpha的“计算超能力”〉它只是在根据训 练材料中的内容“听起来像什么”来说出“听起来正确”的话。
ChatGPT的具体工程非常引人注目。但是,(至少在它能够使用外 部工具之前)ChatGPT“仅仅”是从其积累的“传统智慧的统计 数据”中提取了一些“连贯的文本线索”。但是,结果的类人程度 已经足够令人惊讶了。正如我所讨论的那样,这表明了一些至少 在科学上非常重要的东西:人类语言及其背后的思维模式在结构 上比我们想象的更简单、更“符合规律”。ChatGPT已经隐含地发 现了这一点。但是我们可以用语义语法、计算语言等来明确地揭 开它的面纱。
在生成文本方面表现得非常出色,结果通常非常类似于人类创作的文本。这是否意味着ChatGPT的工作方式像人类的大脑 一样?它的底层人工神经网络结构说到底是对理想化大脑的建模。 当人类生成语言时,许多方面似乎非常相似。
当涉及训练(即学习)时,大脑和当前计算机在“硬件”(以及一 些未开发的潜在算法思想)上的不同之处会迫使ChatGPT使用一 种可能与大脑截然不同的策略(在某些方面不太有效率还有一 件事值得一提:甚至与典型的算法计算不同,ChatGPT内部没有 “循环”或“重新计算数据”。这不可避免地限制了其计算能力——即使与当前的计算机相比也是如此,更谈不上与大脑相比了。
我们尚不清楚如何在“修复”这个问题的同时仍然让系统以合理的 效率进行训练。但这样做可能会使未来ChatGPT能够执行更多“类似大脑的事情”。当然,有许多事情大脑并不擅长,特别是涉及不可约计算的事情。对于这些问题,大脑和像 ChatGPT 这样的东西都必须寻求“外部工具”,比如 Wolfam 语言的帮助。
但是就目前而言,看到 ChatGPT已经能够做到的事情是非常令人兴奋的。在某种程度上,它是一个极好的例子,说明了大量简单的计算元素可以做出非凡、惊人的事情。它也为我们提供了 2000多年以来的最佳动力,来更好地理解人类条件(human condition)的核心特征——人类语言及其背后的思维过程——的本质和原则。
第二篇 利用Wolfram|Alpha为ChatGPT赋予计算知识超能力
ChatGPT和Wolfram|Alpha
当事物不知怎么突然开始“发挥作用”时,总是让人惊叹不已。 这在2009年的Wolfram|Alpha上发生过,在2020年的Physics Project上也发生过。现在,它正在ChatGPT上发生。
我已经研究神经网络技术很长时间了〈实际上已经有43年了〉。即 使目睹了过去几年的发展,我仍然认为ChatGPT的表现非常出色。 最终,突然出现了一个系统,可以成功地生成关于几乎任何东西的 文本,而且非常类似于人类可能编写的文本。这非常令人佩服,也 很有用。而且,正如我讨论过的那样,我认为它的成功可能向我们 揭示了人类思维本质的一些基本规律。
虽然ChatGPT在自动化执行主要的类人任务方面取得了显著的成 就,但并非所有有用的任务都是如此“类人”的。一些任务是更加 形式化、结构化的。实际上,我们的文明在过去几个世纪中取得的 一项伟大成就就是建立了数学、精密科学一最重要的是计算一 的范式,并且创建了一座能力高塔,与纯粹的类人思维所能达到的 高度完全不同。
我自己已经深度参与计算范式的研究多年,追求建立一种计算语 言,以形式化符号的方式来表示世界中尽可能多的事物。在此过程 中,我的目标是建立一个系统,用于“在计算上辅助”和增强人类 想要做的事情。虽然我本人只能用人类的方式来思考事物,但我 也可以随时调用Wolfram语言和Wolfram|Alpha来利用一种独特的 “计算超能力”做各种超越人类的事情。
这是一种非常强大的工作方式。重点是,它不仅对我们人类很重 要,而且对类人AI 同样(甚至 更)重要——可以直接为其赋予计算知识超能力,利用结构化计算和结构化知识的非类人力跫。
尽管我们才刚刚开始探索这对ChatGPT意味着什么,但很明显, 惊喜是可能出现的。虽然Wolfram|Alpha和ChatGPT所做的事情 完全不同,做事的方式也完全不同,但它们有一个公共接口:自 然语言。这意味着可以像人类一样与Wolfram|Alpha“交 谈”,而Wolfram|Alpha会将它从ChatGPT获得的自然语言转换为 精确的符号计算语言,从而应用其计算知识能力。
几十年来,对AI的思考一直存在着两极分化:ChatGPT使用的 “统计方法”,以及实际上是Wolfram|Alpha的起点的“符号方法”。现在,由于有了 ChatGPT的成功以及我们在使Wolfram|Alpha理解自然语言方面所做的所有工作,终于有机会将二者结合起来,发 挥出比单独使用任何一种方法都更强大的力量。
一个简单的例子
ChatGPT本质上是一种生成语言输出的系统,其输出遵循来自互联 网和书籍等的训练材料中的“模式”。令人惊奇的是,输出的类人 特征不仅体现在小范围内,而且在整个文章中都很明显。它可以表 达连贯的内容,通常以有趣和出人意料的方式包含它所学的概念 产生的内容始终是“在统计学上合理”的,至少是在语言层面上合 理的。尽管它的表现非常出色,但这并不意味着它自信给出的所有 事实和计算都一定是正确的。
下面是我刚刚注意到的一个例子(ChatGPT具有内在的随机性,因 此如果你尝试问相同的问题,可能会得到不同的答案)。
听起来相当有说服力。但是事实证明它是错误的,因为Wolfram|Alpha可以告诉我们如下答案。
当然,这显得不太公平,因为这个问题正是Wolfram|Alpha擅长的 问题类型:可以基于其结构化、有条理的知识进行精确计算。
有趣之处是,我们可以想象让Wolfram|Alpha自动帮助ChatGPT。 可以通过编程向Wolfram|Alpha提问(也可以使用Web API等)。
现在再次向ChatGPT提问,并附上此结果。
ChatGPT非常礼貌地接受了更正。如果你再次提出该问题,它会给出正确的答案。显然,可以用一种更精简的方式处理与Wolfram|Alpha的交流,但是看到这种非常简单的纯自然语言方法已经基本奏效也 很令人高兴。
不过,为什ChatGPT一开始会犯这个错误呢?如果它在训练时 从某个地方(例如互联网上)看到了芝加哥和东京之间的具体距 离,它当然可以答对。但在本例中,仅仅依靠神经网络能轻松完成 的泛化(例如对于许多城市之间距离的许多示例的泛化)并不够,还需要一个实际的计算算法。
Wolfram|Alpha的处理方式则截然不同。它接受自然语言,然后 (假设可能的话)将其转换为精确的计算语言(即Wolfram语言),在本例中如下所示。
城市的坐标和计算距离的算法是Wolfram语言内置的计算知识的一部分。是的,Wolfram语言拥有大量内置的计算知识——这是我们几十年的工作成果,我们精心梳理了不断更新的海泔数据,实现 (而且经常发明)了各种方法、模型和算法——并且系统地为一切构建了一整套连贯的计箅语言。
再举几个例子
ChatGPT和Wolfram|Alpha的工作方式截然不同,各有优势。为了理解ChatGPT可以如何利用Wolfram|Alpha的优势,让我们讨论ChatGPT本身并不能完全回答正确的一些情况。ChatGPT像人类 一样,经常在数学领域遇到困难。
很有趣的文章式回答,但实际结果是错误的。
如果让ChatGPT “咨询”Wolfram|Alpha,它当然可以得到正确的答案。
让我们尝试一些稍微复杂的问题。
乍一看,这个结果似乎很棒,我很容易相信它。然而,事实证明它是错误的,因为可以告诉我们如下答案。
因此,使用(不能咨询Wolfram|Alpha的)ChatGPT做数学作业可能不是一个好主意。它可以给你一个看似非常可信的答案。
但是如果ChatGPT没有“真正理解数学”,就基本上不可能可靠地得出正确答案。所以,答案又是错误的。
ChatGPT甚至可以为“它得出答案的方式”〈尽管并不是它所“做” 的真正方式)编造一个非常像样的解释。此外,迷人(和有趣)的是,它给出的解释里存在不理解数学的人类可能会犯的错误。
在各种各样的情况下,“不理解事物的含义”都可能会引起麻烦。
听起来颇有说服力,但不正确。
ChatGPT似乎在某处正确地学习了这些基础数据,但它并没有充分 “理解数据的含义”以正确地排列这些数字。
是的,可以找到一种方法来“修复这个特定的bug”。但问题在于, 像ChatGPT这样基于生成语言的AI系统的基本思想并不适用于需要执行结构化计算任务的情况。换句话说,需要“修复”几乎无穷 多的“bug”,才能追赶上Wolfram|Alpha以其结构化方式所能实现 的几乎无穷小的成就。
“计算链”越复杂,就越有可能需要调用Wolfram|Alpha以来正确处 理。对于下面的问题,ChatGPT给出了一个相当混乱的答案。
正如Wolfram|Alpha告诉我们的那样,ChatGPT的结论并不正确(就像它自己在某种程度上“已经知道”的)。
每当涉及特定的(例如数量)数据时,即使是相当原始的形式,也 往往更适合用Wolfram|Alpha处理。以下这个例子受到了长期以来 最受喜爱的Wolfram|Alpha测试查询“How many turkeys are there in Turkeys?”〈土耳其有多少只火鸡〉的启发。
这(一开始)看起来完全有道理,甚至引用了相关的来源。然而事 实证明,这些数据基本上只是“捏造”的。
不过,非常好的一点是,ChatGPT可以轻松地“请求事实来做检查”。
现在将这些请求通过Wolfram|Alpha API进行馈送。
现在我们可以注入这些数据,要求ChatGPT修正其原始回答(甚至以粗体显示它所做的修正)。
当涉及实时(或依赖位置等的)数据或计算时,“注入事实”的能力特别好。ChatGPT不会立即回答下面这个问题。
下面是一些相关的Wolfram|Alpha API输出。
如果将其输入ChatGPT,它会生成漂亮的文章式结果。
有时,计算系统和类人系统之间会有有趣的相互作用。下面是一个向Wolfram|Alpha提出的相当异想天开的问题,而它甚至会询问你是否想要“soft-serve ice cream”(软冰激凌)。
ChatGPT最开始对于“volume”(体积)的概念有些困惑。
但后来它似乎“意识到”那么多冰激凌是相当愚蠢的。
A cubic light year is an extremely large unit of volume. In fact, it is so large that it is not possible to fit any known substance, including ice cream, into a volume of this size.
For reference, a light year is a unit of distance that is equal to the distance that light travels in one year. The distance that light travels in one year is approximately 5.88 trillion miles (9.46 trillion kilometers).
Given the size of a light year, it is clear that a cubic light year is an impossibly large unit of volume. Therefore, it is not possible to calculate the number of calculate in a cubic light year of ice cream, as there is simply no way to fit that much ice cream into a single volume.
前方的路
机器学习是一种强大的方法,特别是在过去十年中,它取得了一些非凡的成功——ChatGPT是最新的成功案例。除此之外,还有图 像识别、语音转文字、语言翻译……在每个案例中,都会跨越一个门槛一一通常是突然之间。一些任务从“基本不可能”变成了“基本可行”。
但结果从来不是“完美”的。也许有的东西能够在95%的时间内运作良好。但是不论怎样努力,它的表现在剩下的5%时间内仍然 难以捉摸。对于某些情况来说,这可能被视为失败。但关键在于, 在各种重要的用例中,95%往往就“足够好了”。原因也许是输出 是一种没有“正确答案”的东西,也许是人们只是在试图挖掘一些 可能性供人类(或系统算法)选择或改进。
拥有数百亿参数的神经网络一次一个标记地生成文本,能够做到ChatGPT所能做的事情,这着实是非同凡响的。鉴于这种戏剧性、 意想不到的成功,人们可能会认为,如果能够“训练一个足够大的网络”,就能够用它来做任何事情。但事实并非如此。关于计算的 基本事实,尤其是计算不可约的概念,表明它最终是无法做到的。
不过不要紧,重点在于我们在机器学习的实际历史中看到的:会取得(像ChatGPT这样的)重大突破,进步不会停止。更重要的是, 我们会发现能做之事的成功用例,它们并未因不能做之事受阻。
虽然“原始ChatGPT”可以在许多情况下帮助人们写作、提供建议 或生成对各种文档或交流有用的文本,但是当必须把事情做到完美 时,机器学习并不是解决问题的方法一就像人类也不是一样。
这正是我们在以上例子中看到的。ChatGPT在“类人的部分”表 现出色,因为其中没有精确的“正确答案”。但当它被“赶鸭子上 架”、需要提供精确的内容时,往往会失畋,这些例子要表达的重 点是,有一种很好的方法可以解决该问题一将ChatGPT连接到Wolfram|Alpha以利用其全部的计算知识”超能力”。
在Wolfram|Alpha内部,一切都被转换为计算语言,转换为精确的Wolfram语言代码。这些代码在某种程度上必须是“完美”的,才 能可靠地使用。关键是,ChatGPT无须生成这些代码。它可以生成 自己常用的自然语言,然后由Wolfram|Alpha利用其自然语言理解能力转换为精确的Wolfram语言。
在许多方面,可以说ChatGPT从未“真正理解”过事物,它只 “知道如何产生有用的东西”。但是购丨加咖则完全不同。因 为一旦Wolfram|Alpha将某些东西转换为加Wolfram语言,我们就 拥有了它们完整、精确、形式化的表示,可以用来可靠地计算事 物。不用说,有很多“人类感兴趣”的事物并没有形式化的计算表 示一尽管我们仍然可以用自然语言谈论它们,但是可能不够准 确。对于这些事物,ChatGPT只能靠自己,而且能凭借自己的能力 做得非常出色。
就像我们人类一样,ChatGPT有时候需要更形式化和精确的“助力”。重点在于,它不必用“形式化和精确”的语言表达自己, 因为Wolfram|Alpha可以用相当于ChatGPT母语的自然语言进行沟通。当把自然语言转换成自己的母语——Wolfram语言时,Wolfram|Alpha会负责“添加形式和精度”。我认为这是一种非常好 的情况,具有很大的实用潜力。
这种潜力不仅可以用于典型的聊天机器人和文本生成应用,还能扩 展到像数据科学或其他形式的计算工作(或编程)中。从某种意义 上说,这是一种直接把ChatGPT的类人世界和Wolfram语言的精确计算世界结合起来的最佳方式。
ChatGPT能否直接学习Wolfram语言呢?答案是肯定的,事实上 它已经开始学习了。我十分希望像ChatGPT这样的东西最终能够 直接在Wolfram语言中运行,并且因此变得非常强大。这种有趣而 独特的情况之所以能成真,得益于Wolfram语言的如下特点:它是 一门全面的计算语言,可以用计算术语来广泛地谈论世界上和其他地方的事物。
Wolfram语言的总体概念就是对我们人类的所思所想进行计算上的 表示和处理。普通的编程语言旨在确切地告诉计算机要做什么,而 作为一门全面的计算语言,Wolfram语言涉及的范围远远超出了这 —点。实际上,它旨在成为一门既能让人类也能让计算机“用计算思维思考”的语言。
许多世纪以前,当数学符号被发明时,人类第一次有了“用数学思 维思考”事物的一种精简媒介。它的发明很快导致了代数、微积分和最终所有数学科学的出现。Wolfram语言的目标则是为计算思维 做类似的事情,不仅是为了人类,而且是要让计算范式能够开启的 所有“计算XX学”领域成为可能。
我个人因为使用Wolfram语言作为“思考语言”而受益匪浅。过 去几十年里,看到许多人通过Wolfram语言“以计算的方式思考”而取得了很多进展,真的让我喜出望外。那么ChatGPT呢? 它也可以做到这一点,只是我还不确定一切将如何运作。但可以肯定的是,这不是让ChatGPT学习如何进行Wolfram语言已经掌握的计算,而是让ChatGPT学习像人类一样使Wolfram语言,让ChatGPT用计算语言(而非自然语言)生成“创造性文 章”,等等。
我在很久之前就讨论过由人类撰写的计算性文章的概念,它们混合 使用了自然语言和计算语言。现在的问题是,ChatGPT能否撰写这些文章,能否使用Wolfram语言作为一种提供对人类和计算机而言都“有意义的交流”的方式。是的,这里存在一个潜在的有趣的反馈循环,涉及对Wolfram语言代码的实际执行。但至关重要的是Wolfram语言代码所代表的“思想”的丰富性和“思想”流——与普通编程语言中的不同,更接近ChatGPT在自然语言中“像魔法 一样”处理的东西。
换句话说,Wolfram语言是和自然语言一样富有表现力的,足以用 来为ChatGPT编写有意义的“提示”。没错,Wolfram语言代码可 以直接在计算机上执行。但作为ChatGPT的提示,它也可以用来 “表达”一个可以延续的“想法”。它可以描述某个计算结构,让 ChatGPT “即兴续写”人们可能对于该结构的计算上的说法,而且 根据它通过阅读人类写作的大量材料所学到的东西来看,这“对人 类来说将是有趣的”。
ChatGPT的意外成功突然带来了各种令人兴奋的可能性。就目前而言,我们能马上抓住的机会是,通过Wolfram|Alpha赋予ChatGPT计算知识超能力。这样,ChatGPT不仅可以产生“合理的类人输 出”,而且能保证这些输出利用了封装在Wolfram|Alpha和Wolfram语言内的整座计算和知识高塔。
相关资源
文章《ChatGPT在做什么?它为何能做到这些?》(What Is ChatGPT Doing…and Why Does It Work)
本文作者文章《初中生能看懂的机器学习》:介绍机器学习的基本概念
图书《机器学习入门》:一本关于现代机器学习的指南,包含可运行的代码
网站“Wolfram机器学习”:阐释Wolfram语言中的机器学习能力
Wolfram U上的机器学习课程:交互式的机器学习课程,适合不同层次的学生学习
文章《如何与AI交流?》(本文作者2015年的一篇短文,探讨了如何使用自然 语言和计算语言与AI交流)
Wolfram语言
Wolfram|Alpha
丘成桐:中国与世界现今的数学发展[节]
本文为2024年4月30日丘成桐在华中科技大学“中国数学的现状和将来”的讲稿。
基础科学多姿多彩,但是基础科学中的基础是数学科学和理论物理。而数学既是物理学的基础,也是一切工程理论的基础!
英国的数学大盛于牛顿(Isaac Newton,1643-1727),低沉约八十年后,在十九世纪复兴,直到现代。
法国数学始于费马(Pierre de Fermat,1602-1665)、笛卡尔(Rene Descartes,1596-1650)等人,历久不衰。
德国数学家始于莱布尼茨(Gottfried Wilhelm Leibniz,1646-1716),大师屡现,领导西方数学,直到两次世界大战后,1950年代复兴。
当前中国数学和这些老牌大国相差甚远。
美国为了发展数学,从1880年开始派留学生到欧洲,到了1910年间,在伯克霍夫(George David Birkhoff,1884-1944)的领导下开始有了突破,他们同时利用两次世界大战的机会,大量吸收欧洲的数学家。到了1960年,美国数学已经领导世界。
中国现今数学还没有达到美国20世纪40年代的水平。
俄罗斯的数学历史始于十八世纪欧拉(Leonhard Euler,1707-1783)至圣彼得堡,但是真正生根在十九世纪中叶,到了二十世纪中叶,已经可以和美国抗衡了。
苏联解体以后,经济不景气,大量学者移居美国和欧洲。虽然大不如前,势力还是不小。
日本和中国文化比较接近。明治维新时,派了不少学者到英国、法国、德国留学。
最重要的学者叫高木贞治(Teiji Takagi,1875-1960),他在十九世纪末到德国哥廷根大学跟随一代大师希尔伯特(David Hilbert,1862-1943),回国后改革日本的教学方法。
他于1915年在数论方向做出了极为重要的突破性工作,使日本学者信心大增。
到了1940年代末期,日本人在世界数学界已经出人头地,差不多有十个影响世界的数学家出现。中国数学还没有达到这个成就。
我们需要注意的是,这几个国家发展出来的数学家代表了近代数学的大部分成就。每个国家数学的兴起都有一个重要的带领学者,其在数学上的工作能够影响学坛百年之久!
在中国,这样的学者,毫无疑问,当属陈省身(Shiing-Shen Chern,1911-2004)先生。陈先生1946年回国时,就带出了一批杰出的中国数学家。但是,几年后,包括他自己在内,都到美国去了。当然,他在美国也带出了一批华裔数学家。直到上世纪80年代中叶,陈先生回国。那时候,他已经七十多岁了,培养出的好学生大部分留学海外。想要复刻40年代风貌,有很大困难。当然,当时国内经济积弱,也是一个重要原因。
一个国家数学的真正兴起,不在于有能力去萧规曹随,跟着其他国家的学者做一些修补工作,而在于自己走出一个重要的科研方向,其他国家的学者就会有浓厚的兴趣来跟随学习。到目前为止,中国数学水平未达到后面的地步,却也超过了前述的水平。未来这三年是中国崛起的关键时刻!
如何知道一个学校、一个国家的数学内容,必须要有一个公平的评审系统。我们毕竟要知道,要达到和国际同行平起平坐,很重要的一环是知己知彼,但是直到目前为止,中国数学界对我们国家的数学水平处在世界前沿什么位置并没有搞清楚。
一般来说,中国评估奖项、评估晋升,较少征求国际专家的意见,大部分意见由国内的一些同行来决定。但是现代数学多姿多彩,可以分出几十门不同的方向。而中国数学学科大部分重要学者年纪偏大,往往因循守旧,对于现代数学的发展的认识并不全面,他们对一些新兴学科的评估亦不够准确。
在这样的背景下,年轻的学者会继续因循守旧,没有能力、没有兴趣去走一条自己的路,也逐渐和世界前沿的发展脱了轨。
即使是国际评估,很多学校都是以论文多少、影响因子高低等来做决定。这样的方法对于一般学问还算靠谱,但是对于最前沿的学问却是远远不够的。
十年前我看到一个新闻,台湾交通大学的工科被评为世界第一,近年来我也听说清华大学的工科也是被评为世界第一。大家都十分高兴,但是大家心里知道,麻省理工学院、斯坦福大学、加州大学伯克利分校等名校的工科比这两所大学强,他们不断发表领导世界的论文和发展工业最前沿的技术,而我们中国名校还没有这样的突破科研。
从这点看,我们知道这些通过机器找寻影响因子用来评估学科是否达到世界一流的方法,并不客观,达不到评估的目标!美国的名校,如哈佛大学、麻省理工学院、斯坦福大学、普林斯顿大学、加州大学伯克利分校等都有世界一流的学者,他们自己对前沿的学问有深入的了解,再加上同行评审(peer review),他们很清楚自己的水平。
一般来说,他们不会公开他们的意见。而中国高校既缺乏最前沿科学家,又较少征求全球专家的意见;即使征求,也多局限于华裔学者,那就不全面了。
现在我来谈谈我如何判断中国数学的成就。
从1979年我踏入北京的土地,直到现在我每年都会到中国,无论是内地、台湾和香港,平均起来,总共的时间总有几个月,而每年到我在美国任教的地方学习的学生和访问学者也是为数不少。这十多年来,我门下弟子回国的也不是小数,包括两个影响深远的院士。到如今,我也替中国建立了八个以上的数学研究所。我自己做的学问,也横跨基础数学、应用数学和理论物理,所以我对中国数学的情况还是有一定的了解。
但即使如此,我对中国数学的了解直到去年才更深入。
2022年,中国科协领导来清华大学和我见面,希望我带领中国数学在国际上走出一条自己的路。
在北京市支持下,去年我和清华大学数学科学中心、北京雁栖湖应用数学研究院的同事们筹办国际基础科学大会,邀请了全世界在数学、理论物理和工程上有重要贡献的学者,齐聚北京,讨论最前沿的学问。
我们同时设立了一个极为重要的国际奖项,叫做最佳论文奖,计划在国际基础科学大会上颁发。
我们将数学、理论物理和工程的主要方向分为大约40个分支方向。每个方向找到五位该领域最活跃的专家,有欧洲的、有美国的、有俄罗斯的、有以色列的、有日本的、有印度的。
我们邀请的评委中有五位是菲尔兹奖得主、两位是诺贝尔奖得主、两位是图灵奖得主,还有多位获得其他国际大奖的专家及60多名世界各地的科学院院士,全部约160多名大学者。
由这些学者一起评估,选出过去五年发表的最佳论文。这些论文应该能够准确代表数学发展的方向,而且获奖者也是实至名归的。
我们邀请的160多名评委经过一个多月来日以继夜的讨论,在数学学科中选出了110篇近五年来最杰出的论文。为了客观和公平,我们又成立了一个由30多位杰出学者组成的复审委员会,最后挑选了85篇最佳论文。整个评审过程都是由全世界最权威的专家严谨参与的,是我所见过的最具公信力的评审过程!
评审的结果令我十分惊讶!在85篇论文中,只有6篇是国内大学教授的作品,而由美国大学教授作为作者的论文却有70多篇!(不少论文有超过三位作者)
我们所有涉及到评选的会议和讨论都由中国的大学教授担任召集人,歧视中国学者的可能性不大。因此,最佳论文奖的评选结果可以用来作为一个中国数学和世界前沿比较的指标,它具有说服力地反映了国内数学的真实水平。
结合我们的评奖结果,再比较国内很多重要奖项的评奖结果,可以清晰地看出来,国内现有的评估没有“真实”地把中国学者的水平展示出来。比如,很多国内得到重要奖项的学者们并没有入选,这说明他们的研究成果没有进入世界数学前列,没有得到国际同行的普遍认可。
第一件值得讨论的事情是,这十年来,中国经济崛起,虽然个人财富还比不上美国,但是国内杰出学者得到的薪酬和房子的资助已经超过了大部分美国教授,深圳、上海、杭州等地方都有极为丰富的奖励。听说浙江省有个“鲲鹏行动”计划,提供六千万人民币的天文数字!有好几位数学家因此受益。但是让人遗憾的是,这些奖项的获得者并不是上述五篇得奖论文的作者。
另外一个问题是,为什么华裔学者在美国名校可以做出最前沿的学问,在中国名校却有困难。
即使在海外的华裔学者,这40年来的工作,除了张益唐的著名工作以外和当年陈省身先生再微分几何及周炜良(Wei-Liang Chow,1911-1995)在代数几何上的重要工作是无可比拟的。
不能说海外的华裔数学学者的志向就一定单纯,但是没有被中国“帽子”包围、被中国院士的荣耀引诱,还是愿意力争中上游。但是和陈省身先生的工作,却难以相提并论。
我对这个问题考虑了很久,我得出的结论是:中国诱导学者做学问的方法太过注重于物质的奖励,没有照顾到学问本身内容的成就。
我们有大量的优青、青千、杰青等奖励方式,很多高校规定他们只给这些有“帽子”的学者提供丰厚的薪水及住房津贴,因此所有年轻的学者为了“帽子”而拼命。
由于缺少国际上特别杰出专家的评估,大家对于学习和在科学上的成就,不是夸大其词,就是言不及义。
年轻人不敢去做最前沿的学问,因为部分评委不懂这些前沿学问,也怀抱私心,他们恐怕前沿学问在中国流行以后,他们自己没有一席之地。
鼓励大学和年轻人建立明显的目标,至少有十间大学希望成为世界一流的大学。而年轻人的志气必须改进,至少有一小批的年轻学子有志气成为世界一流的学者,做出突破性的工作,能够在学术界引领风骚,影响数学未来几十年的发展。
我们不能够让我们的年轻人一生的志愿就是拿政府颁发的“帽子”,做个院士,甚至得到诺贝尔奖。做学问的的目标是要找到大自然的奥秘,找到一切有意义的规律。
吴汉东:生成式人工智能的作品独创性和作者主体性
导言
2023年被称为生成式人工智能的突破之年。2022年11月,美国人工智能研究公司OpenAI发布大型语言处理和文本生成系统ChatGPT,并在短短两个月内,创造了互联网历史上用户增长最快记录。自2023年3月百度推出“文心一言”之后,阿里、科大讯飞、商汤等企业相继开发了对标ChatGPT的产品。生成式人工智能已然成为全球科技革命的热点。
以ChatGPT为代表的人工智能系统是一种“通过学习大规模数据集生成新的原创内容的新型人工智能”,即利用先进的算法、复杂的模型和规则,通过大规模数据集中学习,以创造文本、图片、声音、视频和代码等多种类型的内容。人工智能的技术迭变对人类生活、生产工作和社会交往方式带来深刻影响,不仅会在教育和研究等多个领域引发颠覆性变革,而且赋予知识产权法律秩序建构以新的时代要求。
生成式人工智能作用于人类智力创造活动之中,其智能生成物无论是技术方案的“反映”(reflection)——发明,还是思想内容的“表达”(expression)——作品,概为机器智能模拟人类智慧所创造的智力成果。生成式人工智能在文学艺术领域的出现,标志着计算机从创作活动的辅助工具跨入人机“合作创作”,甚至机器相对“自主创作”成为可能。人工智能的生成内容,诸如谱曲、写诗、绘画、摄影、设计、构图等,具有文学艺术作品的外观特征,无一不是著作权法所指向的调整对象。
人工智能生成作品是否等同于人类智力创作作品,人工智能自动生成内容能否得到现行著作权法有效涵摄,涉及“作品独创性—作者主体性”的认定,即“作品(客体)—作者(主体)”的底层逻辑问题。
实务分析:如何看待人工智能生成物著作权裁判的实然状态
面向生成式人工智能的崭新时代,著作权法须对“最为宝贵的人的创造性思想”以及“最为普遍的人工智能的独创性表达”作出制度回应,否则其适用价值将不可避免地被消解。围绕着人工智能生成物的可版权性以及智能机器的作者主体性这一核心问题,国内外著作权领域的学者已经进行了众多讨论。
整体而言,域外学者较多倾向于在法律解释与立法层面否定人工智能作品的著作权,而我国学者则对人工智能作品的可版权性持更为开放的立场,主张对该类作品提供某种形式的著作权保护。与此同时,国内外司法机关和行政主管部门对人工智能作品的可版权性问题作出了裁决立场有别的处理。
(一)美国版权实践
美国版权局(The United States Copyright Office, USCO)对人工智能作品先后四次作出拒绝版权注册登记的处理决定:
(1)“黎明的曙光”(Zarya of the Dawn)版权注册案。该案作品系短幅漫画书,自然人作者使用人工智能作画工具生成图像,随后再进行编排和文字叙述组合。版权局秉持“不支持无人类作者的作品注册版权”这一原则,认定作者仅对文字叙述和视觉要素的编排享有版权,可以注册;而对机器生成的图像,不能进行版权作品登记。
该决定的理由是:作者通过关键词提示的方式生成图像的过程并非创造过程。人工智能作画工具的使用者无法预先知悉图像内容,其提示本身不会指向特定的创作结果,因此机器生成的图像不是最后体现作者“控制力”的图像。由此,该使用者不是图像内容背后的“主导者、决策者”(master mind)。
该案作出最终决定后,美国版权局发布“包含人工智能生成材料的作品”的《版权登记指南》,强调了如下要点:第一,版权法保护限于人类创造力的产物,法律规定的作者不包括非人类;第二,借助人工智能生产的作品,如果包含有人类作者“创造性的构思”,可以支持其版权主张;第三,版权登记申请人有义务披露提交注册的作品包含人工智能生成内容,并说明人类作者对作品的贡献。
(2)“天堂的最近入口”(A Recent Entrance to Paradise)版权注册案。涉案画作被版权注册申请人描述为“由在智能机器上运行的算法自主创作生成”。版权注册申请人为自然人泰勒,作品作者为“创意机器”。版权局审查员及版权局审查委员会认为,该作品作者不具备人类作者身份,其作品“没有来自人类作者的任何创作性贡献”。此后,基于本案提起的行政诉讼也未能获得法院的支持。法院判决认为,“作者身份”表明了版权法保护人类创造的法律要义,“纯粹的机器生成内容”不在版权法的调整范围。
(3)“空间歌剧院”(Theatre D’opera Spatial)版权注册案。涉案画作系AI生成的作品,其真正的“创作者”是一个名为Midjourney的智能软件。版权局审查委员会强调了美国版权注册登记的一贯立场,受版权保护的作品必须符合“作者原创作品”的要件,其中不包括非人类创作的内容;关于披露人工智能生成材料的要求,其缘由在于主管部门对“人类作者身份”的事实认定,而不是对“创作工具的效用”的价值判断;申请人对人工智能生成材料的修改具有“转换性”,可以获得版权保护,但应将智能生成部分与人类作者创作贡献作出区分。
(4)“日落”照片(Suryast)版权注册案。涉案照片系安基特·萨尼(Ankit Sahni)使用AI软件“RAGHAV”制作而成。萨尼将自摄的“日落”照片输入该软件,然后以梵高画作《星空》的副本作为“风格”输入,并选择一个“决定风格转移量的可变成值”,从而生成日落照片。萨尼以其与“RAGHAV”软件作为共同作者提出版权注册申请。美国版权局认为无法将人类作者创作与人工智能生成作品分开,遂以缺乏人类作者为由,拒绝该作者注册。在后来的复审评议报告中,版权局强调萨尼对“RAGHAV”照片的控制,认定该软件将萨尼的照片演绎成梵高的风格,是基于人工智能的操作方式和图像数据训练的结果,不是萨尼的具体创作贡献。
美国著作权法实践是以人类作者为中心来确定版权保护对象的。从这一基点出发,人类的智力活动才能成为“创作”,人类的智力成果才能视为“作品”。2023年《版权登记指南》表达了如下执法立场:对含有人工智能生成材料的作品,版权局是否接受注册申请的标准,关键在于该作品是简单“机械复制”的结果,还是作者“自己独创的内心构想,并赋予其可见形式”的产物。如果“作品的传统作者元素”完全由机器生成,人类作者并没有对机器生成材料进行“最终的创造性控制”,版权局将不予注册。
早在2011年“猿猴自拍案”中,美国版权局就强调只有人类作品才受保护。“对自然力、动物、植物产生的作品,版权局不会予以登记”;“对机器产生的作品,没有任何创造性的输入或没有人类作者的干预而通过自动或随机运作的机器方法产生的作品,版权局也不会登记”。美国法院支持上述立场,认定“著作权法上的作者只能是人类”。美国联邦最高法院宣称:著作权法所保护的作者必须是“人”(person或individuals),著作权是“人类对基于其天然秉赋或智慧所创作的作品而享有的专属权利”。
从上述案例,我们可以总结美国著作权行政执法和司法观点的基本要义:强调作品是人类作者的创作成果。作者身份是认定文学艺术作品包括人工智能生成作品可版权性的起点和归属;人类作者操作人工智能所生成的内容是否授予版权,关键在于其“智力投入”是否控制了作品的“表达”,并“实际形成”了作者身份的“元素”;对人工智能生成内容是否提供版权保护,须结合个案分析,其中自然人个人创作的部分可以授予版权,而人工智能生成部分则不在版权保护范围之内。由此可以认为,美国著作权法实践一般不支持人工智能作品可版权性。
(二)中国著作权法实践
中国司法实践对人工智能作品提供有条件的著作权保护,近年来一系列判决对相关法律难题的解决作出了有益的探索。
(1)菲林律师事务所诉百度公司著作权侵权案。该案是中国首例涉计算机软件创作的著作权纠纷案。涉案文章《影视娱乐行业司法大数据分析报告——电影卷·北京篇》,系原告选定相应关键词,对“威科先行库”的数据进行搜索、筛选,并采用“可视化”功能自动生成的分析报告。法院判决阐明了人工智能作品可版权性规则:生成内容符合文字作品的形式要求,具有一定的独创性,但并非著作权作品的充分条件;根据民法主体规范,自然人创造完成应是著作权作品的必要条件。
就本案而言,法院认为计算机软件生产内容不构成作品,但其凝结了软件研发者和使用者的投入,应赋予软件研发者和使用者一定的权益保护。关于软件智能生成的内容,判决界分为赋权作品与非作品,相关图表、数据来源于“威科先行库”的检索结果,无独创性;但文字内容部分并非“可视化”自动生成,由原告独立创作完成,构成受保护的文字作品。
(2)腾讯公司诉盈讯公司侵害著作权及不正当竞争案。该案在中国首次提出人工智能生成作品独创性的判定步骤。涉案财经报道文章,系原告组织创作人员使用腾讯写作机器人(Dreamwriter)智能写作助手完成。
法院判决主旨在于认定涉案文章是否具有独创性要件,从而提出“两步判断法”的裁判思路:其一,从涉案文章是否独立创作、外在表现上是否与已有作品存在一定程度的差异,以及是否具备最低程度的创造性等角度进行分析判断;其二,从涉案文章的生产过程是否体现了创作者的个性化选择、判断及技巧等因素进行分析判断。在具体认定相关人员的行为是否属于著作权法定义上的创作行为时,应当考虑该行为是否具有智力活动属性,以及该行为与作品的特定表现形式是否直接联系。
法院判决认为,涉案文章具有特定的外在表现形式,源于创作者个性化的选择和安排,并由Dreamwriter软件在技术上生成,上述表现形式和生成过程均满足著作权法对文字作品的保护条件。在“两步判断法”的分析中,法院认定涉案文章是由原告组织的包括编辑团队、产品团队和技术团队在内的主创团队利用人工智能软件完成,得以体现原告发布股评综述类文章的需求和意图的法人作品,应受著作权保护。
(3)魔珐公司诉四海公司侵害著作权及不正当竞争纠纷案。该案系中国首例虚拟数字人视频著作权纠纷案。涉案视频系原告基于其开发的虚拟数字人Ada进行商业化场景应用而制作的视听作品和美术作品。该案判决的意义在于对视频创作主体的认定及相关权利归属的判断。视频中虚拟人的“创作”可以在表演过程中产生文本、图像、音频内容等,实际上是基于深度学习算法而生成的内容。
在该视频创作过程中,虚拟数字人所作的“表演”,本质上是对真人表演的的数字投射,是对“中之人”现实表演到虚拟形象可视化、具象化的再现或重构。在本案中,制作人即原告进行设计、提供文案内容、制作视频;“中之人”即幕后的表演者以声音、动作、表情等进行演绎。法院判决认定,该作品的作者和表演者不是数字虚拟人,其权利应归属于作为自然人的软件开发者和表演者。
(4)李某诉刘某侵害信息网络传播权案。该案被称为中国首例人工智能生成图片著作权纠纷案。涉案图片系原告使用开源软件Stable Diffusion(一款文本、图像的生成式智能模型),通过输入提示词,包括增加提示词、修改随机种子等方式而生成。法院判决根据《著作权法》第3条规定,将著作权客体要件解构为如下要素:是否属于文学、艺术和科学领域;是否具有独创性;是否属于智力成果。
法院认为,涉案图片从外观来看,其与通常人们见到的照片、绘画无异,属于艺术领域范畴,且具有一定的表现形式。本案关键问题在于对智力成果要件的认定:从原告构思涉案图片始,到最终选定涉案图片止,原告进行了一定的智力投入,包括设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关参数、选定符合预期的图片,具备了“智力成果”的要件。判决主张,作品应当体现自然人的智力投入。现阶段生成式人工智能模型不具备自由意志,不是法律上的主体;但人们利用人工智能模型生成图片,在本质上是为人利用工具进行创作,即整个创作过程中进行智力投入的是人而非人工智能模型。
中国没有美国那样“登记—审核”的版权注册制度,在权利自动取得的情形下,有关人工智能生成作品著作权纠纷概由法院处理。近年来,系列案件的处理,不仅是司法实践对人工智能时代著作权问题的积极回应,而且带动了法学界关于人工智能生成内容与著作权保护之间关系的广泛讨论。
上述代表性案件形成了如下裁判立场和审理思路:一是以现行著作权法规定为依据,即围绕作品定义条款进行作品基本内涵的解读,在“一定表现形式”不存争议的情况下,以“独创性”和“智力成果”两要件为重点进行释法,为人工智能作品可版权性认定奠定法律基石。二是以人类作者的必要智力投入为中心。
对此,不同法院在把握尺度上存在差异:菲林诉百度案判决认为,无论智能软件本身还是软件研发者、使用者,都不能成为人工智能作品的作者,因此此类作品不能构成著作权法上的作品。而后多个判决则认为,软件自动生成的作品含有自然人进行选择、安排的智力投入的,可以视为可版权性作品。可以认为,中国法院对人工智能生成作品采取了有条件保护的司法原则。
(三)对法律实践的评析
中美著作权法实践对人工智能生成作品可版权性的认定差异,并不能简单地划分为“保护”与“不保护”的对立立场。需要指出的是,两国在判决、裁决的基本观点上其实有相通之处:一是强调人类作者的著作权主体地位,作品的独创性认定与人类作者的主体性元素具有直接的关联性;二是坚持主客体二分原则,认定人工智能具有创作工具的基本属性,智能机器不可能取得著作权主体资格。
两国裁判的主要区别在于人与智能机器之间关系的分析:中国司法实践主张,只要人类作者有“一定的智力投入”或具“个性化的表达”,就有可能将人工智能作品认定为“智力成果”,即在人类作者中心主义的原则基础上采取了一种较为开放的司法立场;而美国著作权法实践,从版权法保护人类创作物的主旨出发,强调人类作者对人工智能生成物“充分的控制”,须在创作意图、创作过程和创作结果等方面表现出作者身份元素,其实际结果是排除了人工智能生成作品的可版权性。
上述案例、判例的实证分析,描述了ChatGPT出现前后人工智能生成作品的著作权问题的实际解决路径。司法与行政执法机关大抵遵循一个规范性的指导思想,运用相关的技术、方法和规则去处理案件,这是一种以实在法为依据而开展的教义学解决方法。
如何化解独创性标准与传统人格理论的紧张关系,如何重构作品独创性与作者主体性的相互联系,如何解读人类作者与机器作者的创作合意,以及如何重塑事实作者、拟制作者与著作权人的主体构成等,已有判决对上述问题多有涉及,具有促进法律续造、推动法学研究的重要意义。
但是,司法裁判对现行法律制度没有也不可能作出变革性回应,其主要任务依然是释法、用法,而不是变法、创法。对于法律实务部门而言,需要以当下有效法律秩序的合理性确信为前提,对相关案件采取一种经验描述、逻辑建构和规则适用的裁判方法,这是必要和可行的。
应该看到,生成式人工智能的出现对著作权法领域的影响是全方位和深层次的。与法律实务工作者有别,法学研究工作者在著作权法教义学分析的同时,更应进行法理学的反思,即回答人工智能时代著作权法律活动应该是什么以及人工智能生成作品著作权问题应该怎样解决。这里涉及价值判断、制度选择的应然性分析,笔者试在下文进行探讨。
法理反思:如何构建人工智能生成物可版权性的应然理论
在生成式人工智能时代,著作权法面临的最大挑战,即是“作品”(机器生成)独创性和“作者”(机器身份)主体性的问题。上述两个问题具有极强的关联性,在法理上涉及主客体二分法的基本问题。在民法理论中,主体(人)与客体(物)是民法上的两大基本制度;而在著作权法中,作者与作品是为主客体的法律构造。民法学家认为,人与物之间有着严格的类分,凡是人以外的不具有精神、意思的生物概属于物,是为权利指向的对象。
但是在现代民法中,主客体之间这种不可逾越的鸿沟正在发生动摇。对于著作权法而言,主客体之间则呈现另外一种景象:人工智能生成作品能否视为著作权客体,关键在于其“独创性要件”成立须具有主体的作者身份因素;而著作权人资格的确立,又必须说明作者对人工智能作品的“独创性表达”作出实质性贡献。人工智能作品的可版权性及其权利的可归属性,是我们需要讨论的重要问题。
(一)作品属性与独创性要件之疑
“作品”作为著作权法的核心概念,是著作权客体制度构建的基石,也是创造者、传播者权利取得的源头。如前所述,在我国《著作权法》的作品定义条款中,其基本内涵包括两个方面:一是强调作品须为“文学、艺术和科学领域内”的“智力成果”,界定了著作权客体范围即思想表达;二是规定作品须“具有独创性并能以一定形式表现”,描述了作品可版权性要件即独创性(实质要件)和可再现性(形式要件)。
思想表达又称为思想表现形式,是著作权理论中的逻辑概念。一般而言,作者的创作活动可以概分为思想内容和思想表达:前者存在于作者大脑之中,是思想活动过程中的认识、观点和方法的概称,与作品所具有的思想内涵有关;后者外化于作者大脑之外,是主观思想内容得以客观化的外在表达,即是作品创作完成的最终形态。
其实,一部作品皆是思想内容与思想表达的有机共同体,但著作权法保护对象限于其中的思想表达形式,这即是著作权法理论中的“思想/表述二分法”,从而划分了作品中“不受保护的要素”和“受保护的要素”。思想表达即外在呈现为一种可为他人认知的作品,包括文字作品、音乐作品、绘画作品、图形作品等。
人工智能生成与人类作者创作有类似之处,诸如数据的存储、分析和机器学习,是为技术思想的运动过程;而作为智能生成物输出的作品,则可能是符合人类审美需求的思想表达,在作品类型及其外观方面已难与人类作品区别开来。因此,人工智能生成作品能否成为著作权法的保护对象,主要聚焦作品可版权性的核心要件即独创性要素的判断。
独创性又称为原创性,意指作品所具有的独立构思的创造属性。立法文件对这一原则的规范内容并未作出说明。从语义学范畴而言,独创性应包括“独”与“创”两个方面,即作品的“独立性”和作品的“创造性”:
一是“独立完成”,即作品乃作者独立创作完成。根据世界知识产权组织的权威解释:“作品是作者自己的创作,完全不是或基本上不是从另一作品抄袭来的。”独立完成是对创作主体自身独立性的说明,但实质上是作为比较性标准,用以识别在创作作品与已有作品之间的差异性。这意味着作品是作者独立创作而成,而不是复制或抄袭的结果。
二是“智力原创”,即作品须来自作者的创作性活动。在独创性的教义解读中,“独立完成”强调两部作品之间的比较关系,即作品须为作者完成的独立性;而“智力原则”指明作品承载思想表达的创新力,是对作品作为人类智力成果的本质性要求。个性表达即创作主体的人格性表现,强调作品是人类作者智力劳动的成果。
独创性理论将客体即作品与主体即作者紧密地联系在一起,或者说,通过对作者的规定来涵摄作品的要义,基于“作品—创作—作者”的逻辑联系建立了主客体一体化的独创性认定标准。在我国著作权法中,有关独创性认定的规范适用,涉及以下相关条款:“作品”,即“文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”(《著作权法》第3条);“创作”,即“直接产生文学、艺术和科学作品的智力活动”(《著作权法实施条例》第3条);“作者”,即“创作作品的自然人”(《著作权法》第11条)。
由此可见,现行著作权法是以人类作者主体为中心、以人格主义要素为基点的独创性认定规范体系。在大数据和算法时代,人工智能(机器作者)通过增强算法对海量数据进行统计分析和数学建模,学习和模仿人类思维模式(算法创作),最终生成具有作品样态的表达文本(智能作品),这与前述的“作者—创作—作品”的独创性理论体系存在悖离之处:
其一,“算法创作”改变了人类智力创造活动中的传统创作形式。“独立完成”不再是人类创作那样完全的独自性、绝对的自主性,人工智能生成的结果,不一定就是人类作者所控制的,更多呈现一种随机性和或然性。
其二,“机器作者”突破了“作者=自然人”的人类中心主义假定。生成式人工智能表现了类人化的创作能力,在人工智能与人类智慧具有相似性的情景下,可能从辅助创作工具转变为与人类作者合作的创作机器或者机器作者。我们似应重新认识机器人与自然人在著作权领域的关系(下文将详述)。
其三,“智能作品”疏离了“个性表达”中经典性人格要素。人工智能作品是一种“理性的计算”“情感的计算”的结果,虽然其间也内在地蕴含着人类作者的个性,即综合理念上价值选择(直接表现)和具体表达方面的特定追求(间接表现)。
但总体说来,人工智能自身不具备自然人所特有的自由意志和实践目的,其人格性特征是机器对人类思维的学习和模仿,或者说人类对机器智能的赋予。可以认为,以“人格价值观”为基础所构建的独创性标准,是“人类中心主义”的产物,具有作品的意志性与作者的主体性之要义。这是传统作品与智能作品的区别所在。上述情形表明,有必要在法理上对独创性理论进行重构,包括对个性表达中的人格要素作出新的解读,建立独创性认定中主客体相对分离的评价标准。
(二)作者身份认定及权利归属之困
“作者”作为著作权主体制度的核心概念,是明确权利承受资格即著作权归属的依据。“作者—作品”在著作权法中具有“主体—客体”的逻辑联系;同时,“作者—著作权人”也构成了主体制度的当然内容。根据《著作权法》第11条的规定,“著作权属于作者”;“创作作品的自然人是作者”;“法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者”。该条款是为主体规范,包括作者的权利主体资格、自然人作者(事实作者)、法人作者(拟制作者)等基本内容。
作者是著作权的基本主体和原始主体,是“第一著作权人”。“第一著作权人”的英文表达是“Initial Owners”、“Original Owners”或“First Owners”,意为著作权的“原始所有人”、“最初所有人”或“第一著作权人”。其立法意义在于:当一部作品创作完成时,依照法律规定即产生著作权,首先享有该作品著作权人的人应是作者,而权利首先属于作者。
在著作权主体制度中,有两类作者:一是自然人作者。这是从事创作活动的事实作者,也是完成了个性表达作品的当然作者。作者即创作作品的自然人,是作者身份认定的一般原则。其要点包括:以人格要素为基础(具有作者主体性和创作意志性之特征);以创作行为为要件(表现为从思想内容即“说什么”到思想表达即“怎么说”的过程);以自然人为评价对象(自然人是作者身份认定和权利归属认定的中心)。
二是法人作者。这是在特定条件下被视为作者的情形,即基于法律规定所拟制的作者——“法人作者”。在著作权领域,“拟制作者”表现了法人主体的一般特征:是为自然人的集合体;同时具备“法人作品”的作者主体资格,即由法人主持(以法人名义创作并发表)、代表法人意志(依赖自然人创作但与其个人感受无涉)、由法人承担责任(责任能力是法人人格的重要构成)。
生成式人工智能的出现,对传统的著作权法律主体理论带来挑战。
首先是作者概念问题。“自然人即作者”的作者观是“人类中心主义”的产物。人工智能从辅助创作到“算法创作”的跨越,不仅是对传统创作方式的突破,而且带来智能机器是人还是机器的争议。“算法创作”在技术原理上表现为一系列的数据挖掘、分析和运算,以模仿甚至可能取代人类智力创造活动。人工智能不具有人类作者的心性和灵性,但表现了类人化的思想表达能力、创作能力。生成式人工智能不仅丰富了“后人类时代”的精神生产活动,而且由于其高效、便捷的智能优势有可能产生巨大的商业价值。在机器介入创作成为常态的未来,法律对人工智能有条件、有限定地承认“机器作者”身份,似有必要且可能。
其次是“机器作者”与人类作者的关系。人工智能从创作机器到机器创作,是根据人工智能与智力创造之间的频谱关系所作的区分。学者们根据智能机器在最终智力创造成果(发明和作品)中贡献力程度,将人工智能的功用分为辅助生成、合作生成和独立生成。后两者即涉生成式人工智能的主体性问题。
“人机交互、人机协同、人机共生”,这是对当下以至未来人机关系的新的认知。未来学家称21世纪将是一个机器人科学家与人类科学家并存的时代,同样,我们可以看到这也是一个机器作者与人类作者共创的时代。在著作权领域,人工智能无论是与人类作者合作生成作品,还是其相对独立完成作品,我们在作品中都可以看到人类智力劳动的贡献,后者在人工智能生成物中发挥了目标制定(创作意图)、输入数据(创作素材)和表达样态选定(创作结果)的作用。
总的说来,“人机合一”是对人类作者与机器作者共创作品的样态描述和表象概括。这种作品是“智能版权”时代合作作品的特殊类型,“机器作者”类人化的智力创作,既蕴含着反映人类作者创作意图的“合意”,又表现了接受人类作者指引的“共创”。最后是“机器作者”的权利主体资格问题。“机器作者”身份来源,难以在现有的著作权主体理论中得到圆满的解释。
我们看到,机器作者具有事实作者的一般特征,人工智能在算法创作中表现了相当的自主性,自我思考、自我生成的创作能力似与人类作者无异。类人化的创作行为是一种事实行为,因此,机器作者类似于通过创作事实而成为主体的自然人作者。根据科学家的预测,基于人工智能可进化性、高效率和精确化的发展趋势,未来时代的智能机器人有可能独立自主进行智力创造活动,由此产生独立生成的发明和作品。因此,重构著作权法作者理论,探讨机器作者身份问题是有意义的。
当然,这一理论假设有待在未来法中得到认可。未来法可能赋予机器作者以拟制作者的一般资格。机器作者身份的取得并非表明人工智能独立于自然人,所谓法律拟制即以实定法解释论为基础,运用拟制的法律技术,将特定情形的人工智能认定为法律主体。这一主张在著作权领域可界定为“拟制作者”,即类似于自然人作者以外的法人作者。但是智能机器作为拟制作者,没有完全独立的意思能力,更没有真正的思维能力。
综上所述,我们可以承认机器人的作者身份,但不必赋予其著作权人资格,从而实行创作主体与权利主体界分。在民法主体理论中,凡是权利的主体必为意思的主体。机器作者不能成为著作权人,关键在于其民事能力的缺失,即以自己的名义去理性并实际地享有权利、履行义务和承担责任。正如美国学者所言,著作权法保护赋予作品以专有权利,从而激励作者产生创作动因,践行立法宗旨的权利人只能是自然人和法人,而不是机器人。
(三)“作品—作者”著作权理论框架之变
面对人工智能技术迭变,著作权法理论需要反思和重构,其思想成果既要对或然世界的智能机器表达进行理论解读,更要为未来时代法律制度变革准备思想资料。生成式人工智能“作品独创性—作者主体性”之问,在法理学层面首先涉及的问题即是“后人类时代”法价值取向的变化。“理论是灰色的”,但会因应科技之变、时代之变而充满活力。
变化一涉及“后人类时代”的“人类作者中心主义”。自近代以降,“人类中心主义”是为人类摆脱上帝权威而确立人为中心的思想主张。但进入后人类时代以来,人类在自然界乃至社会活动中的唯一性主体地位受到挑战,其独霸主体资格的假定正在被改写。在专利权领域,智能机器可以独立从事智力创造活动,俨然成为未来时代的“发明人”;在著作权领域,机器作者的出现势必对人类作者的中心地位产生冲击。
承认非人类创作主体的意义,在于矫正“人类作者中心主义”在生成式人工智能时代的不适应性。机器作者的主体性假定,没有也不可能颠覆人类在智力创作领域的主导地位。我们应该看到“机器作者”的局限性和狭隘性,其智能创作拘泥于精神生产活动的有限领域,数据偏差和算法偏见也会影响其思想表达的结果。因此,机器作者并不等同于具有独立人格、自由表达能力的人类作者,更多是电子流水线上的“生产者”“制作者”。
变化二,“智能作品”生成中的“读者中心主义”。根据人工智能的技术原理,智能作品的产生过程大抵为“数据驱动—算法创作”,即通过分析用户数据、发现、引导和实现“智能作品”的消费需求(包括创意方向、表达类型、传播路径等);通过算法学习,在计算中生成内容,形成符合用户需求的表达文本。
“智能作品”的生产及应用离不开用户即读者的介入与参与,由此使得“智能作品”与人类作者的关联相对疏离,同时又突出人类读者的中心地位,以至于美国学者声称“读者的参与(即人类阅读)构成了当代著作权法的核心”。
“读者中心主义”不仅意味着用户参与作品的评价与感受,还表现为用户参与作品的创作和生成。从网络平台上的“用户创作内容”(Uesr-generated content),到“人工智能生成内容”(AI-generated content),呈现出普通大众广泛参与文学艺术创造的社会图景。可以认为,新的传播技术特别是人工智能技术推动着“创作平权时代”的到来。“读者中心主义”在著作权领域的重要意义,在于解构了作者与作品的内在关联性。具言之,作品独创性判断不以揭示作者身份为前提,“智能作品”的思想表达及其人格内涵,以社会公众的评价为依据。
在上述法律价值取向的指引下,我们有必要遵循一定的原则立场,调适“作品独创性—作者主体性”的理论框架:
一是人工智能作品独创性的限缩解释原则。独创性是判断作品可版权性的客观标准,其基本内涵应聚焦“作者独立完成”(是为作者独自创作或使用工具创作不限)和“必要创作高度”(是为智力投入还是“额头冒汗”不论)。限缩独创性的解释范围,凡作者的思想、身份、创作过程等因素,不是作品可版权性的依据。但是,独创性原则应具有人类智力劳动的要义,即人类作者对人工智能作品做出的“必要安排”(不必是创作全过程安排)和“实质贡献”(不要求作出主要贡献)。
二是“人机合成创作”中的人本主义原则。作者主体性是作品独创性认定的重要因素。有学者主张,“作品来源”和“最低程度的创造性”都体现了“人的主体性特征”,可以此作为人工智能生成物可版权性认定的“人本逻辑”。
笔者进一步认为,在生成式人工智能的场景中,作品可版权性要求有人类作者的介入,但同时不可能排除智能机器参与创作,或者说借助人工智能进行创作。智力创作领域中的人机共存、人机合作将成为未来世界新的社会特征。“机器作者”之说,是对生成式人工智能的实然状态描述,是一种修正“人类作者中心主义”的理论假定。在建立人类作者与机器作者的“二元创作主体结构”的时候,我们仍应秉持“以人为本”的著作权法立场,不能随意偏离人的主体性原则。
三是权利主体资格认定中的意思能力原则。在民法理论中,意思能力是民事主体能够判断自己的行为性质和后果并作出真实意思表示的能力,包括认识力、预期力和表现力。从意思能力原则出发,我们对人工智能似可建立“创作者—权利人”相分离的“二元主体结构”。具言之,根据创作活动即事实行为的原理,人工智能可以作为机器作者;而依照行使权利、履行义务即法律行为的属性,人工智能不能成为智能作品的著作权人。概言之,凡权利的主体须为意思的主体,著作权人应是自然人或自然人的集合体。
鼓励作品创作的著作权法宗旨,不会因为机器作者或是人类作者的身份而有所改变,但对著作权法激励创作的功能做出反映的,只能是具有意思能力的著作权人。2017年,欧洲议会通过的《机器人民事法规则》确立了一条重要原则:人工智能无论如何发展,最终要受到法律规制的依然是人(无论是自然人还是法人),而不是任何机器或装备。总的说来,二元主体的机构理论不仅削弱了作者与作品联系,也削弱了作者与著作权人的联系。直言之,在未来的著作权制度中,自然人并不等同于作者,而作者并不当然是著作权人。
制度构想:如何对“作品—作者”著作权规范体系进行法律再造
知识产权制度源于科技革命而生,基于科技革命而变。在法律制度创新和科技创新相互依存、相互促进的过程中,相对于科技的不断迭变和发展,法律规则总是相对滞后。“我们既需要敬畏技术的革新力和创造力,也需要尊重法律的保障性和引导性。”对此,日本学者中山信弘提出警示:让法律领先于事实,特别是技术,而以应有的姿态进行引导是困难的。由于难以正确地判断社会发展方向,法律如果先行往往产生朝着错误方向引导的危险。同时,他也表示期望:应注意至少要努力在最低限度上,不使法律成为多媒体改变的阻碍。
在生成式人工智能面前,著作权法既不能熟视无睹,对新的创作方式和生成作品无动于衷,同时也不要贸然变革,颠覆著作权法“作品—作者”的规范体系。笔者认为,在不根本改变既有基本制度的前提下,应该而且可以对相关法律规范进行补充和完善。
关于人工智能生成作品可版权性的法律构造,立法者往往持审慎的立场。尽管欧美国家的法学家、法律家展开了激烈的争论,其间也不乏有益的建议,但在立法层面并未产生实际的成果。美国版权立法对人工智能作品著作权问题未作回应,其法律变动和规范调整主要来自于法院判例和主管部门规章,即对纯粹机器生成作品拒绝提供版权保护。就其他国家立法动向而言,大抵有两种情形:
一是援用已有著作权法规定,扩大法律适用范围,将“机器作品”纳入受保护对象。英国版权法1998年修正案第9条第3款规定了“计算机生成作品”,由对该作品进行“必要安排”(the arrangements necessary)之人享有版权。在英国版权法传统中,“必要安排”认定的基础是“实质性贡献原则”。到目前为止,引用该项条款的唯一案例仅涉及计算机手机游戏截图。但从立法本意来说,“计算机生成作品”可以包括人工智能生成作品,英国知识产权局在“人工智能与知识产权”的征求意见书中声称:在既有的法律框架下,人工智能生成内容可以受到版权保护。因此目前不会对既有的法律进行修改,但是会在国际层面保持沟通,并且在需要的时候进行法律修改,替换或者取缔保护条款。
二是拟定专门法案,界定人工智能发明与作品的“独立智力创造标准”,为机器作品提供著作权保护。2017年,欧洲议会法律事务委员会提出“关于机器人的建议报告”,特别强调“对计算机或机器人创作的可确认著作权作品,需要制定相关‘独立智力创造标准’,以便认定作品著作权归属”。这一建议未被采纳。2020年,欧洲议会发布“关于人工技术发展的知识产权决议”,强调在人工智能作为作者创作工具的情形下,当前的知识产权框架仍能适用,但是智能机器自主创作的作品可能没有资格获得版权保护,以遵守与自然人相关独创性原则。上述情况表明,各国著作权领域并无有关人工智能生成作品的专门立法,更多是对现有著作权规范进行扩张解释,以增强法律的适应张力和调整弹性。
从长远来看,著作权法终须保持与时俱进的时代进步性,但不必建立一套独立于著作权法之外的规则体系,也无须对既有著作权法进行体系化改造,而是对现有制度进行适度调适,以解决人工智能作品的可版权性问题。概括说来,著作权修法应坚持以人为本原则,以人与人之间的关系为调整对象,在下列问题展开:对人工智能生成作品提供有限保护,对人工智能参与创作事实予以有条件的确认,对作者身份与权利主体的关系进行有例外的调控。
(一)人工智能作品的客体规范
在著作权法客体规范体系中,“作品条款”包括作品定义条款、作品类型条款、作品特别条款和作品除外条款等规定,涉及作品的基本内涵、构成要件、主要例示类型、特别表现形式,以及非作品“表达”与非保护“作品”等内容。现就有关问题分述如下。
1.作品定义条款。著作权法关于何谓作品的定义性规范,其核心内涵就是独创性标准。立法文件对此多有规定,但并未给出具体说明。因此,该问题症结不在于立法创设,为人工智能生成作品作出专门规定,而应着眼于法律解释,为新类型作品预留适用空间。最高人民法院《关于审理著作权民事纠纷案件适用法律若干问题的解释》(法释〔2020〕19号)第15条认为,作品具有独创性并享有独立著作权,其条件是“作品的表达系独立完成并且有创作性”。由此可以认为,独创性要义在于创作的独立性和原创性,即前已述及的“独立完成”和“智力原创”。
笔者认为,对“有人类介入的机器作品”与人类自身创作的作品应持相同尺度,无须对前者另立严苛标准。人工智能生成内容呈现了人类心智活动的“无机化”并表现了人类思想表达的“随机性”,即可以认为是具独创性的“个性表达”。
具言之,独创性内涵不应该以创作者身份为必要,“机器作品”与他者作品不构成“实质性相似”(实质标准),并基于以人类读者为基础的“一般社会公众”认可(评价标准),即可作为著作权作品看待。在未来时代,人工智能提供信息内容将会成为常态,“机器作品”将在更大程度上由智能系统自主完成,但是只要该作品有人类介入,著作权法对此就不能简单采取排斥的立场。
2.作品类型条款。著作权法按照一定标准对作品类型作出规定,是为作品的主要类别或者说规范类别。该项条款的功能在于:明确著作权客体所涉的作品范畴,将不同领域的不同作品进行类型化,有助于“找法用法”,正确适用法律规范;同时,指明著作权客体类型与相关权能之间的关系,基于不同的作品类型而产生不同的利用方式,法律由此赋予不同的财产权项。
在著作权立法体例中,各国大抵采取“例示主义”方法,即例举作品类型+“兜底”其他作品说明。该项条款在例举文字作品、口述作品、音乐作品、戏剧作品、舞蹈作品、美术作品、摄影作品、视听作品、图形作品等之后,特别规定“符合作品特征的其他智力成果”。这一开放式条款,可以解决作品类型列举不全的弊端,涵摄新技术下可能出现的新作品类型。
生成式人工智能已经广泛应用于文学艺术领域,目前主要集中在音乐、电影、诗歌、绘画、摄影、图形设计中以及新闻报道等方面。因此,机器作品在作品外观及类型上与人类作品无异,无妨对标适用一般作品类型条款,当然也可以适用“兜底条款”,由法律对其作出专门规定,或者司法机关根据“作品定义条款”作出裁判认定。
3.作品特别条款。作品特别条款泛指著作权法例示规定的“其他作品”,涉及非规范行使的客体类型。在我国《著作权法》中,即是“民间文学艺术作品”“计算机软件”以及“符合作品特征的其他智力成果”。人工智能生成作品应为“特殊作品”,在《著作权法》的作品规范中可设立人工智能作品的专门条款,其条款细则包括特殊作品定义、独创性判断标准、自然人作者介入认定、创作类型及其权利归属等。
(二)人工智能创作的主体规范
著作权法的主体规范,与著作权原始取得有关。我国《著作权法》在“著作权归属”项下规定了“作者”条款,主要包括作者身份认定条款、自然人作者条款、拟制作者条款和作者认定的证明条款,其规范内容涉及作者主体与权利主体的关系、作者身份确认的实质标准与形式标准、作者的主要类型。现就有关问题分述如下。
1.作者身份条款。著作权法关于作者规定有两个要义:一是作者身份基于创作而生(作者认定的实质标准),二是著作权属于作者(原始权利主体确认)。因此,著作权法建立了“创作—作者—著作权人”的逻辑框架。根据民法关于法律事实的规定,创作行为属于事实行为,对著作权原始取得具有重要意义。“作者”是著作权的基本主体和原始主体,一般作品的权利归属概莫如此,这是“创作主义原则”在主体规范体系中的具体表现。
但作者(无论是自然人作者还是法人作者)并不完全等同于著作权人,《著作权法》在诸如视听作品、职务作品、委托作品等特殊作品类型中,即规定了著作权全部或者部分不归属于作者的情形。人工智能生成作品应为一种特殊作品,在智能机器自主创作并成为“拟制作者”情形下,其著作权主体应是自然人或法人。
2.自然人作者条款。在著作权主体制度中,自然人是从事创作活动的事实作者。作者身份是智力创作这一事实行为的结果,具言之,无论是作者认定的一般原则(以自然人为作者),还是法律“视为”作者的特别规定(以法人作者为例外),真正创作作品或者事实完成创作的人只能是自然人。但在人工智能时代,机器创作作品是一种客观样态,可能被“视为”作者,因此有必要对“自然人作者条款”进行改造。在承认“拟制作者”的同时,仍须强调人类作者要素的存在,即自然人对该作品的必要介入。机器作者与人类作者共存,是人工智能作品生成的创作主体构成,也是该作品可版权性的重要条件。
3.拟制作者条款。著作权法中的法人作者,即基于法律规定的“拟制作者”。根据民事主体制度,法人组织具有一种“拟制人格”,即以自己的名义所表现的共同意志和团体人格,因此,成为著作权法规定的“拟制作者”。英国、美国、日本和我国立法大抵有此类规定。随着信息技术的发展,新的作品形态如计算机软件、电子数据库等交由法人组织,由其投入人力、物力,并承担法定责任。在这种情况下,将法人“视为”作者是适宜的。未来立法似可扩大拟制作者条款的适用范围,将生成式人工智能“视为”作者,这是对智能创作事实的一种法律确认。在拟制作者那里,机器作者与法人作者有着重大区别,即前者的作者身份并不能取得著作权主体资格。
4.作者身份推定和证明条款。在著作权法中,作者身份的推定和证明包括两个方面的规范内容:一是认定规则,即在作品上署名,且在该作品上有相应的权利;二是除外规则,如有相反证明,则不以署名作者认定(作者认定的形式标准)。对于一件具体作品而言,作者是谁以及确认谁是真正的作者,各国著作权法大抵采用“推定”方法:一般情况下,作品的署名人即为创作人;但存有“相反证明”的例外,署名人并不都表示“作者”。这就是说,该条关于署名“推定”或“视为”作者的表述,具有“不确定但又可处于保存地位”的法律效果。
作者身份推定,涉及权利归属认定,须以相关证据证明为必要。在著作权“自动取得原则”的指引下,作品版权登记是证明权利归属的“初步证据”。未来法似可建立人工智能生成作品著作权登记制度,其申请材料包括:人工智能作品样品,人工智能作品原创性证明,开发者或使用者对人工智能作品介入证明,自然人或法人的身份证明,人工智能的类型和性能说明等。人工智能作品著作权登记,具有表彰作品独创性和作者主体性的初始证明意义,但不是完全确定的,第三人可以提出相反证明,且在发生争议时可以诉诸法院解决。
(三)人工智能生成作品著作权的本体规范
“作品—作者”的主客体规范建构,其目标指向是确定著作权归属,即作品的可版权性和作者的著作权主体地位问题。人工智能生成作品的著作权本体规范涉及以下相应条款内容。
1.特殊作品类型条款
特殊作品的著作权归属,根据法律直接规定确认(如职务作品、视听作品等),或是依照当事人合同约定确认(如委托作品),因而存在创作主体与权利主体不尽一致的情形。人工智能生成作品不能作为一般作品而依作者身份确定权利归属,因此当为特殊类型作品,须由法律特别规定权利为谁享有。学者们曾提出如下方案:
一是“法人作品说”。法人作品是由法人主持,以法人名义创作并发表的作品。正是基于法人作品(客体)的事实存在,才产生了法人作者(主体)的法律拟制。有学者认为,人工智能生成内容可由独创性标准事实认定,亦可借鉴“法人作品”制度来确定权利归属。司法实践中亦有将人工智能作品适用法人作品规则的判例。
“法人作品说”的主要问题是,第一,人工智能生成作品并不一定是由法人组织主持和创作,在一些时候,还存在自然人利用人工智能创作作品的情形;第二,该学说并未回答法人作品背后谁是该作品生成的事实作者,创作活动中的人机关系难以用法人作品规则进行调整。
二是“雇佣作品说”。雇佣作品通常是指员工在雇佣关系存续期间和受雇佣工作范围内为雇主创作的作品。在我国著作权法中,该类作品被称为职务作品。与前述法人作品不同,职务(雇佣)作品中,自然人作者(雇员)始终保有其作者身份,根据不同情形,由作者所在单位(雇主)享有不同范围的著作权。美国学者认为,雇佣作品表明,该类作品存在“事实上的作者”(雇员)和“法律上的作者”(雇主)。
似可借鉴美国版权法,将人工智能作品视为雇佣作品,让雇主成为著作权人。但美国联邦最高法院的判决并未采用上述主张,否认将人工智能作品纳入雇佣作品的范畴,排除了将机器视为雇员的可能性。“雇佣作品说”旨在确定人工智能作品的著作权归属,并未触及“雇员”作者(即拟制作者)是否保有作者身份这一前置性问题。
此外还有“演绎作品说”和“委托作品说”。前者将人工智能创作视为一种演绎行为,其智能作品符合邻接权客体特征,采取了智能机器所有者为核心的权利构造;后者将人与机器的关系比拟为委托人与受托人的关系,智能机器设计者提出了创作意图和创作实体,因而享有该作品的著作权。上述两种学说重点在于分配著作权的归属,未能说明人工智能在创作中的地位,以及创作主体与权利主体分离的理由。
鉴于上述情况,笔者建议拟定新的合作作品条款。合作作品一般是两人以上共同创作完成的作品。在生成式人工智能的语境中,可指为人类作者(法律作者、事实作者)与机器作者(拟制作者、事实作者)共同创作完成的作品。该合作作品属于共同作品,即创作成果无法分割的整体作品。
其规范构造的意义在于:一是强调人类作者对作品创作的实质介入,这与雇佣作品、委托作品有别。二是承认机器作者“自主创作”的事实,这与法人作者、演绎作者不同。三是建立创作主体与权利主体的“二元结构”,其权利分配可采取创作者(自然人或法人)权属模式或投资者(自然人或法人)权属模式。
2.人类必要介入条款
人工智能作品著作权保护的规范设计,必须把握以下原则和方法:强调智能作品中人类作者的主体性元素。人工智能生成作品,寓意着机器参与创作,是为增强人类智力创造活力,丰富人类精神生产方式,而不应是完全摆脱人类、绝对替代人类的失控行为。
确认人类作者对智能作品的介入方式和程度。在人机合作共创作品的情形下,人类作者介入的方式包括设定“创作意图”、选择“创作方案”、确定“创作成果”等。所谓“介入”并不是全过程的,但应是必要的,为此学者提出过“实质贡献论”和“创新过程控制论”的认定标准。“实质贡献论”是英国版权法关于“计算机生成作品”著作权认定的基础。具有功能主义价值的“贡献论”,意在摆脱“智能机器—创作工具”的窠臼,试以人类智慧或人工智能对创造性表达的贡献度作为创作作品可版权性的基础。我国学者强调谁贡献多谁享有权利,并分析了不同主体不同贡献度的应用场景。
笔者认为,人类作者对智能作品的介入,强调的是实质贡献,但不应解读为主要贡献。在法哲学范畴中,“实质”是一种本质性认识,表达了一个对象或事物成为其所是的原因和基础。人工智能作品之所以为可版权性作品,须有人类作者决定该作品本质属性的贡献,这在不同类型作品中有不同表现。“创新过程控制论”的基本逻辑是“谁控制,谁有权,谁负责”。这一控制并不需要对独创性表达的形成进行直接干预,只需要对从创作启动到作品完成的整体过程进行控制。
“控制论”强调了人类学者在人工智能作品中的地位,主张机器创作乃是人类控制下的创新过程;在著作权分配方面,“创新控制论”亦是对“投资保护论”的突破和超越。但是,人类对智能作品的介入,不必是整个过程的控制,这在作品生成事实上不可能,也在法律认定上无必要。在创作意图发动、创作过程指引、创作成果选择等方面,只要人类作者进行了必要的干预,达到决定该作品基本属性的后果,即可认为实现了“控制”。因此,应根据作品的类别特征采取分类认定,结合人机合作创作的不同应用场景实行个案认定。
设定著作权人关于智能作品的标示义务和举证责任。作为著作权人的自然人和法人,在发布和传播其人工智能生成作品时时,有义务注明“人工智能生成作品”或“AIGC”的标记。记号标示不具备权利公示的法律效力,但可能产生对潜在侵权行为的“事先告知”的作用。更为重要的是,记号标示有助于加强生成式人工智能服务领域的专门管理,有利于消费者和使用者对人工智能生成作品的识别。此外,在人工智能作品权益发生纠纷时,著作权人应承担举证责任,对人机合作事实、人在作品中的实质贡献等作出说明。
总的来说,人工智能生成作品著作权条款的核心规范内容包括:(1)独创性标准。即强调创作的独立性和原创性,不以自然人人格为基础,但须有人类作者对人工智能作品的介入;(2)作者身份认定。在人机合作的情景下,承认拟制作者即人工智能的创作主体身份,以及与人类作者共同创作作品即合作作品的创作事实;(3)人的主体要素构成。确认人对作品的必要介入,即达到决定作品本质属性的贡献程度;(4)著作权归属。根据“创作主义”或“投资主义”原则,将著作权分配给有意思能力和责任能力的自然人或法人。
结语
人工智能技术总在不断改写时代篇章,我们或许真的看到“未来已来,将至即至”。
行文至此,科技世界又发生一件大事:2024年2月,美国人工智能研究公司OpenAI对外发布视频生成大模型——Sora。该模型仅需提交简要的文字指令,就可生成场景逼真、细节丰富、光影考究、动作流畅的视频。OpenAI公司宣称,Sora不仅仅是视频生成工具,而且是一个物理世界模拟器,旨在为真实世界建模。
从ChatGPT到Sora,人工智能技术展示了惊人的迭代变速,这不仅预示内容生成方式和生产速度的惊人变革,同时使得人工智能生成物的权利认定及其分配问题解决变得更加迫切和复杂。无论如何,我们需要正视科学的力量,充分认识人工智能对著作权制度的深刻影响;同时保持制度的理性,坚守激励创新、规避风险的法治理想。总结司法实践、进行法理反思、探索法律重构,对于知识产权界而言是一个长期任务和必要过程。
本文转自《中国法律评论》2024年第3期
俞可平:中国绝对专制主义的经典——韩非政治思想再释评
对法家及韩非著作的研究长期是中国古代思想史研究的显学,但从政治哲学的角度对韩非思想做系统阐释与评析的研究却不多见。韩非是先秦法家思想的集大成者,但他首先是一位政治思想家。韩非整个思想体系包含了十分丰富的内容,法律思想只是其中的内容之一,他更关注的是国家、君主、人臣、农战和治术等重大政治问题。韩非重视法律在国家统治中的重要作用,强调要任法而治,但法治并不是韩非所追求的最高价值,他追求的根本政治价值是君主的统治地位及其统治事业,即韩非眼中的“霸业”。与此相一致,韩非的法家理论首先是一种政治学说,《韩非子》一书首先是一部中国古代专制主义的政治经典,包括国家起源、政治统治、君臣关系、战争与和平、权力与权术,以及国家间关系理论,等等。故此,韩非的法家学说实质上不仅是“形名之学”,更是“法术之学”“帝王之学”。“用现在的话说,法家学说,就是一种纯粹的政治学说。”本文将从政治哲学、政治统治和政治权术三个维度重新阐释《韩非子》的政治思想体系,并形成自己的最后结论。
一、道·德·理
对于古人来说,天是至高无上的存在,是不可企及的境界,是一切生命和世间万物的最终来源。上天的命令和法则是最高的命令和法则,天命不可违,天理不可逆。在上天面前,人类的个体和集体都是微不足道的。握有最高权力的君王可以是地上之人的主人,可称“人主”,却也仅是天的儿子,只能称“天子”。韩非秉承了古人关于天的这一基本理念,并以之为政治思想的逻辑起点。
韩非在《大体》篇中阐述了他心目中的理想社会和理想政治。这是一种“至安之世”:“法如朝露,纯朴不散,心无结怨,口无烦言。故车马不疲弊于远路,旌旗不乱乎大泽,万民不失命于寇戎,雄骏不创寿于旗幢……故曰:利莫长乎简,福莫久于安。”(《大体》)法律就像朝露一样沁人心脾,民众自觉服从,大家心无结怨,和睦相处。百姓没有长途跋涉的劳累,士兵无须在战争中丧命。人们从清明简约的政治中获取利益,从国家的长治久安中享受幸福。在这样一种理想政治中,“君子乐而大奸止”(《大体》)。社会没有严重的犯罪,正人君子能享受生活的快乐。统治者与被统治者之间、上级和下级之间没有利益冲突,“上无忿怒之毒,下无伏怨之患,上下交顺”(《大体》),全社会形成了政通人和的局面。这样,“大人寄形于天地而万物备,历心于山海而国家富”(《大体》)。统治者便可以全身心地致力于国家的建设大业,国家就会变得富裕强大。这样的理想状态才是国家治理的最高境界,韩非称之为“治之至也”(《大体》)。
要达到这样一种“治之至”的理想政治状态,首先就要认识社会发展和国家治理的整体趋势和一般规律,韩非称之为“全大体”。要做到“全大体”,就要敬畏上天,顺应天命,服从天理。即所谓“因天命,持大体”(《大体》)。他进一步说,要把握社会国家的大局,首先要有像天一样的胸怀,遵循天地的运行法则,不得悖逆天理。“古之全大体者:望天地,观江海,因山谷,日月所照,四时所行,云布风动。”“不逆天理,不伤情性”。(《大体》)没有天一样的广阔胸怀,就无法承担起“全大体”的宏大责任,也就无法达到治理国家的最理想境界。
上天运行的普遍法则便是道,后天的法则只是道的展开。遵循天道与遵守国法,是内在一致的。故而,“全大体者”既要顺应天道,亦要完善法律。只有“因道全法”(《大体》),方可“君子乐而大奸止”。正如司马迁所说,韩非“归本于黄老”(《史记·老子韩非列传》),根本的一点,就在于他把道视为万物的本源。与黄老之学一脉相承,韩非这里所说的道,即是天地万物生成的最终来源,是天地万物演化的普遍法则,也是国家分合治乱的纲纪所在。“道者,万物之始,是非之纪也。是以明君守始以知万物之源,治纪以知善败之端。”(《主道》)道也是世间万物的本性所在,是万物之所以成为万物的根本原因。“道者,万物之所然也”,“道者,万物之所以成也”。(《解老》)
道是独一无二的,是万宗归一。道生万物又不同于万物,道是万物之本,是多样性的统一。“道不同于万物,……道无双,故曰一。”(《扬权》)道是世间万物的母体,道衍生出夺取和维护国家政权的各种方法技术。有了道才有国家,从这个意义上说,道也是国之母。“母者,道也;道也者,生于所以有国之术;所以有国之术,故谓之‘有国之母’。”(《解老》)道就像树木的根柢,认识并把握了道,就是培植和强固了树木之根柢,树木就会生长得快,生命就会长久。“体其道者,其生日长,故曰:‘固其柢。’柢固,则生长;根深,则视久,故曰:‘深其根,固其柢,长生久视之道也。’”(《解老》)统治者若用道来处理世间事务,则其生命和事业就会长久,国家也能长治久安。“夫道以与世周旋者,其建生也长,持禄也久。故曰:‘有国之母,可以长久。’”(《解老》)
掌握了道,大可保全国家,小可保全生命。道无论对君主还是对民众,都至关重要。因为认识并掌握了事物的规律和法则,说明他的智慧和见识高深莫测,能够深谋远虑,在思想和行动上远远超越其他人。掌握了道的人,就能看到常人所看不到的远景,做常人无法预测的事情,从而保全自己的生命和国家。“夫能有其国、保其身者,必且体道。体道,则其智深;其智深,则其会远;其会远,众人莫能见其所极。唯夫能令人不见其事极,不见其事极者为保其身、有其国。故曰:‘莫知其极。莫知其极,则可以有国。’”(《解老》)
把握了道并且按照道的要求去行事,到了一定程度就能产生功效。这种由道的积聚而发生的功效,便是德。在韩非看来,德只是道的效用,没有道就没有德。有了德之后,进而有仁、义、礼,后三者又是德的功效。因而,道、德、仁、义、礼是一个有机的整体,具有内在的一致性。道是德之本,而德则是仁、义、礼之本。“道有积而积有功;德者,道之功。功有实而实有光;仁者,德之光。光有泽而泽有事;义者,仁之事也。事有礼而礼有文;礼者,义之文也。故曰:‘失道而后失德,失德而后失仁,失仁而后失义,失义而后失礼。’”(《解老》)
德不仅是道的功效,也是道在世间万物的体现。道宏大而无形,德则是世间万物普遍之理。道和德相结合,便产生世间万物和天地阴阳。“道者,弘大而无形;德者,核理而普至。至于群生,斟酌用之,万物皆盛,而不与其宁。”(《扬权》)“道不同于万物,德不同于阴阳”(《扬权》),但世间万物和天地阴阳却离不开道与德。
德虽是道的功效,但却是人内在的本质,而不是外在的东西。最高的德,就是人的内在精神,而不是游离于身外之物。能够恪守内在的精神,就能保持自身的完整。换言之,自身的完整便是德,有德的人才能有自身的完整。“德者,内也。得者,外也。‘上德不德’,言其神不淫于外也。神不淫于外,则身全。身全之谓德。德者,得身也。”(《解老》)要拥有德,对身外之物就不能有很强的欲望和积极的作为,否则,反而会失去德的功效。“凡德者,以无为集,以无欲成。”(《解老》)刻意去追求德,反而得不到最高的德。“德则无德,不德则有德。故曰:‘上德不德,是以有德。’”(《解老》)
德不仅能够全身,而且能够齐家治国平天下。如果说自身以积聚内在的精神为德,那么家庭则以积聚资财为德,乡里、国家和天下则以民众为德。“身以积精为德,家以资财为德,乡国天下皆以民为德。”(《解老》)修身不为外欲所乱,方能有真德;治家不为无用之物所乱,方能有积余;治理地方、国家和天下也能这样,那么富裕的家庭和道德的民众就会更多,天下之人便都能广泛受其德惠。“今治身而外物不能乱其精神,故曰:‘修之身,其德乃真。’真者,慎之固也。治家者,无用之物不能动其计,则资有馀,故曰:‘修之家,其德有馀。’治乡者行此节,则家之有馀者益众,故曰:‘修之乡,其德乃长。’治邦者行此节,则乡之有德者益众,故曰:‘修之邦,其德乃丰。’莅天下者行此节,则民之生莫不受其泽,故曰:‘修之天下,其德乃普。’”(《解老》)
重视积德的人,就能克服各种艰难险阻,无往而不胜。因为重视积德的人,内心必定清静专一,就可以想出万全之策应对现实中的各种挑战,从而在理论上使众人心服,在战场上容易制服敌人,拥有天下社稷,使万民服从。“积德而后神静,神静而后和多,和多而后计得,计得而后能御万物,能御万物则战易胜敌,战易胜敌而论必盖世,论必盖世,故曰‘无不克’。无不克本于重积德,故曰‘重积德,则无不克’。战易胜敌,则兼有天下;论必盖世,则民人从。”(《解老》)
国家的统治者若能既有道又有德,道德兼备,那就抓住了国家治理的根本。圣人治国的关键,就在顺应道德。“圣人为法国者,必逆于世,而顺于道德。”(《奸杀弑臣》)顺应道德,国家之间就不会发生战争,奢侈之风就不会盛行,民众就会专心于农耕,天下就会太平无事,连马、甲都可弃之不用了。“有道之君,外无怨仇于邻敌,而内有德泽于人民。夫外无怨仇于邻敌者,其遇诸侯也外有礼义。内有德泽于人民者,其治人事也务本。遇诸侯有礼义,则役希起;治民事务本,则淫奢止。凡马之所以大用者,外供甲兵而内给淫奢也。今有道之君,外希用甲兵,而内禁淫奢。上不事马于战斗逐北,而民不以马远通淫物,所积力唯田畴。积力于田畴,必且粪灌。故曰:‘天下有道,却走马以粪也。’”(《解老》)
既然德如此重要,而且是道的功效,与仁、义、礼有着内在的一致性,那么,德治应当是理想的政治状态,以德治理国家应当是理所当然的结论。然而,这恰恰不是韩非的结论,崇尚德治是儒家的主张,韩非明确反对儒家的德治理想,而主张“圣人治国,务法不务德”(《显学》)。
韩非认为,德治是一种理想政治,但这种理想政治是远古时代的政治,已经一去不复返了。他说:“上古竞于道德,中世逐于智谋,当今争于气力。”(《五蠹》)古代的人践行德治,大家竞相追逐德行;到了中世德治就让位于智治了,大家竞相追逐智谋;而现在则是实力政治的时代,大家竞相角逐力量。古代之所以能够践行德治,是因为那时的器物简陋,政治事务非常简单,所以大家可以相互揖让。现在的政治事务已经变得非常复杂,是一个各种力量的竞争较量的时代。在这样的时代再用德治就不是理想的“圣人之治”了。“古人亟于德,中世逐于智,当今争于力。古者寡事而备简,朴陋而不尽,故有珧铫而推车者。古者人寡而相亲,物多而轻利易让,故有揖让而传天下者。然则行揖让,高慈惠,而道仁厚,皆推政也。处多事之时,用寡事之器,非智者之备也;当大争之世,而循揖让之轨,非圣人之治也。故智者不乘推车,圣人不行推政也。”(《八说》)
道在人身上的展开和体现是德,德为道的功效;道在物体上的展开和体现便是理,理为道的属性。将道与德合而为一,韩非更多的是传承老庄的思想;而将道与理有机地结合,则更多的是韩非的独创。在韩非看来,道是万物的根本性质和普遍规律,而理则是万物的表现形式和具体规制。“道者,万物之所然也,万理之所稽也。理者,成物之文也;道者,万物之所以成也。故曰:‘道,理之者也。’物有理,不可以相薄;物有理不可以相薄,故理之为物之制。万物各异理,万物各异理而道尽。”(《解老》)道与理的结合,使得世间万物既形态多样,变幻莫测,又万变不离其宗,遵循着无形的共同规律。“凡道之情,不制不形,柔弱随时,与理相应。万物得之以死,得之以生;万事得之以败,得之以成。”(《解老》)
理是事物的具体规定,它体现为形形色色的世间万物。道是看不见摸不着的,而理则是看得见摸得着的,它表现为事物的方圆长短,使世间万物展现出丰富多彩的多样性。因为世间万物皆有其理,所以我们才能区分出事物的颜色、大小、轻重、方圆、长短、粗细、坚脆,等等。“凡物之有形者易裁也,易割也。何以论之?有形,则有短长;有短长,则有小大;有小大,则有方圆;有方圆,则有坚脆;有坚脆,则有轻重;有轻重,则有白黑。短长、大小、方圆、坚脆、轻重、白黑之谓理。理定而物易割也。”(《解老》)理是我们区分和认识万物的关键所在,而不同事物之理的背后,都存在着普遍的道。只有认识了事物之理,才能最终把握万物的根本之道。“凡理者,方圆、短长、粗靡、坚脆之分也,故理定而后可得道也。”(《解老》)
不同的事物有不同的理,同一事物在其不同的阶段也有不同的理。因此,理变动不居,天地万物便处于变化发展之中;理有兴衰存亡,天地万物便有生长死亡。“故定理有存亡,有死生,有盛衰。夫物之一存一亡,乍生乍死,初盛而后衰者,不可谓常。”(《解老》)天地万物的变化发展和兴衰存亡,是普遍的和永恒的,从这个意义上说,事物的“无定理”恰恰又是一种常态。对这种天地万物“无定理”的常态,实在难以形容,只能勉强称为“道”:“唯夫与天地之剖判也俱生,至天地之消散也不死不衰者谓‘常’。而常者,无攸易,无定理。无定理,非在于常所,是以不可道也。圣人观其玄虚,用其周行,强字之曰‘道’。”(《解老》)
韩非关于道、德、理的观点,是其全部政治思想的哲学基础,由此发展出了关于君臣之道和治国之理的整个政治理论。从某种意义上说,道、德、理以及作为整体的道德与道理,既是韩非所揭示的治国安邦的内在逻辑,也是其评判邦国之兴衰和君臣之好坏的基本标准。在他看来,无论是君主还是臣民,唯有恪守各自之道和万物之道理,才能安身立命,兴旺发达;反之,则会国破家亡。“夫缘道理以从事者,无不能成。无不能成者,大能成天子之势尊,而小易得卿相将军之赏禄。夫弃道理而妄举动者,虽上有天子诸侯之势尊,而下有猗顿、陶硃、卜祝之富,犹失其民人而亡其财资也。”(《解老》)
二、君·臣·民
道无形却无处不在,世间万物莫不体现着某种无形之道。道不仅是万物之源,也是是非之纪。君主只有掌握了道,才能认识国家治理的兴衰之理;只有按照道的要求去治理国家,天下才能太平。“道者,万物之始,是非之纪也。是以明君守始以知万物之源,治纪以知善败之端。”(《主道》)韩非认为,君有君道,道是君主立身处事的根本法则,有道之君才称得上“明君”和“圣人”。臣有臣道,依臣道行事,才能尽人臣之责。韩非不仅把君主和大臣的根本行事规则称之为道,而且把君臣的区别也提升到道的高度,认为君臣不同道;进而认为道归一,君主之道独一无二。恪守君臣之道,以正君臣之名,才能上下和睦。这样,韩非把君主独揽大权和臣民对君主的俯首听命视为“天道”,从而为君主的绝对专制奠定了根本的哲学基础。
君臣不同道,君主之道,为君主所独有,即君主成其为君主的那些根本法则,是上天专门为君主而设立的,具有排他性,不为臣民所分享。这就是韩非所谓的“明君独道”思想。韩非认为,道是无形的,它产生万物而又隐藏于万物之中。道不但决定着事物的不同性质,而且支配着事物的生长死亡。君不同于臣,也是道生万物的一种形式。“夫道者,弘大而无形”,“道者,下周于事,因稽而命,与时生死。参名异事,通一同情。故曰:道不同于万物,德不同于阴阳,衡不同于轻重,绳不同于出入,和不同于燥湿,君不同于群臣。——凡此六者,道之出也。道无双,故曰一。是故明君贵独道之容。君臣不同道,下以名祷。君操其名,臣效其形,形名参同,上下和调也。”(《扬权》)
明君独道的政治要求和现实体现,便是君主掌握至高无上的统治权力。君主执掌国家的最高权柄,可对臣民生杀予夺。“君执柄以处势,故令行禁止。柄者,杀生之制也。”(《八经》)君主的这种至高无上的生杀大权是绝对的和唯一的,不与任何其他人分享,其他所有人都须服从并服务于君主的绝对权力。君主身份最尊贵、权势最强大,没有任何人可与君主相提并论。“万物莫如身之至贵也,位之至尊也,主威之重,主势之隆也。”(《爱臣》)这既是天之“大命”,也是人之“大命”。“天有大命,人有大命。……权不欲见,素无为也。事在四方,要在中央。圣人执要,四方来效。”(《扬权》)君主牢牢掌握至高无上的绝对权力,依据这个唯一的根本法则去正名分定规则,那么一切就会名正言顺,事物便会井然有序。“用一之道,以名为首,名正物定,名倚物徒。故圣人执一以静,使名自命,令事自定。”(《扬权》)如此,君主便能顺从天命,不失其要,成为圣人,使“万民一从”。“谨修所事,待命于天,毋失其要,乃为圣人。”(《扬权》)
既然君主“执要”方为“圣人”,独揽大权,方可“四方来效”“万民一从”,那么必然的结论便是:只有绝对遵从君主,既给君主以最大的权力,也给君主以最高的尊严,国家方能安定,天下才能太平。这就是韩非的“尊主安国”理论。在韩非看来,只有绝对遵从君主的权威,国家才能安定;要使国家安定,就必须绝对服从君主。如果君主恪守君道,把握国家治理的根本方向和原则,掌握国家的根本决策大权,其他的事就让大臣们去做,实行最大程度的无为而治,那么国家就能长治久安,而这样的有道之君便是真正的人主、贤主、明君和圣人。“明君无为于上,君臣竦惧乎下。明君之道,使智者尽其虑,而君因以断事,故君不躬于智;贤者勑其材,君因而任之,故君不躬于能;有功则君有其贤,有过则臣任其罪,故君不躬于名。是故不贤而为贤者师,不智而为智者正。臣有其劳,君有其成功,此之谓贤主之经也。”(《主道》)
君有君道,臣有臣道,有道之臣才是贤臣、哲臣、良臣或忠臣。韩非认为,臣道中最重要的莫过于对君主的忠心不二。一心一意事君,对君主保持绝对的忠诚,在任何情况下都没有任何异心,这是臣道之根本。韩非说:“贤者之为人臣,北面委质,无有二心。”(《有度》)韩非认为,对于大臣来说,比起其仁、义、礼、智、信等儒家倡导的贤德来,最重要的就是对君主的忠贞不二。臣子一旦没有忠诚之心,那么即使拥有其他贤德,对国家来说也是危害。正像贤子必忠于其父一样,贤臣必忠于其君,否则便贻害无穷。“父之所以欲有贤子者,家贫则富之,父苦则乐之;君之所以欲有贤臣者,国乱则治之,主卑则尊之。今有贤子而不为父,则父之处家也苦;有贤臣而不为君,则君之处位也危。然则父有贤子,君有贤臣,适足以为害耳,岂得利焉哉?所谓忠臣,不危其君;孝子,不非其亲。”(《忠孝》)从臣必须忠于君这一根本性的君臣之道出发,韩非甚至对尧舜禅让和武王伐纣等传统的政治美谈也持根本否定态度。“非其亲者知谓不孝,而非其君者天下此贤之,此所以乱也。故人臣毋称尧舜之贤,毋誉汤、武之伐,毋言烈士之高,尽力守法,专心于事主者为忠臣。”(《忠孝》)
对君主的绝对忠诚,势必要求对君主的绝对服从。贤臣仅对君主忠心不二是不够的,还必须无条件地服从君主的命令。“朝廷不敢辞贱,军旅不敢辞难;顺上之为,从主之法,虚心以待令,而无是非也。”(《有度》)这也正是韩非心目中的臣道:臣子必须对君主言听计从,急君主之所急,图君主之所图,竭尽所能,献身于国君。因此,韩非所推崇的后稷、皋陶、伊尹、周公旦、太公望、管仲、隰朋、百里奚、蹇叔、舅犯、赵襄、范蠡、大夫种、逢同、华登15位理想大臣,“皆夙兴夜寐,单身贱体,竦心白意;明刑辟、治官职以事其君,进善言、通道法而不敢矜其善,有成功立事而不敢伐其劳;不难破家以便国,杀身以安主,以其主为高天泰山之尊,而以其身为壑谷洧之卑;主有明名广誉于国,而身不难受壑谷洧之卑”(《说疑》)。
良臣不得以权谋私,而须秉公办事。韩非是中国历史上最早明确区分公与私,并将公与私视作评价君主和群臣品行优劣的思想家,这一点堪与古希腊伟大思想家亚里士多德媲美。他说,“公私不可不明”,“明主之道,必明于公私之分,明法制,去私恩”。(《饰邪》)君臣如果齐心协力为国家公共利益奋斗,国家就能长治久安;如果追逐私人利益,国家就将动乱不安。因此,君主须明于公私之分,崇尚公义。人臣同样如此,必须居官无私。人臣如果致力于谋取一已之私,则既害已又乱国。“私义行则乱,公义行则治,故公私有分。人臣有私心,有公义。修身洁白而行公行正,居官无私,人臣之公义也;污行从欲,安身利家,人臣之私心也。明主在上,则人臣去私心行公义;乱主在上,则人臣去公义行私心。”(《饰邪》)
作为一名绝对专制主义的政治思想家,韩非对民众持极端鄙视态度。他认为,民的本性是好逸恶劳,贪图享受,除了追逐私欲外,没有其他任何高尚的需求。“夫民之性,恶劳而乐佚。”(《心度》)趋利避害,是每个人的本来面目。“民之政计,皆就安利如辟危穷。”(《五蠹》)例如,民众为了一己私利而逃避兵役,宁可贿赂权贵豪门,也不愿无私为国家奉献。“穷危之所在也,民安得勿避?故事私门而完解舍,解舍完则远战,远战则安。行货赂而袭当涂者则求得,求得则私安,私安则利之所在,安得勿就?是以公民少而私人众矣。”(《五蠹》)不仅如此,在韩非看来,民众为了自己的私利甚至常常六亲不认。他曾经不止一次举过一个品性极端自私恶劣的例子,来说明人性之败坏堕落。齐桓公有一位年轻侍仆叫竖刁,得知桓公喜女色而妒忌男性,便将自己阉割了后去管理后宫。然而正是这位竖刁,在取得齐桓公信任并授以权柄执政三年后,公然发动政变将桓公囚在守卫室中,使其活活饥渴而死,死后三个月无人收尸。(《十过》)
在韩非眼中,民众不仅天性自私,而且愚昧无知,完全不可救药。民众生性懒惰,目光短浅,只见到眼前的小利,而看不到长远利益。“是以愚戆窳堕之民,苦小费而忘大利也。”(《南面》)民众不仅鼠目寸光,看不到真正的利害关系,而且常常不知好歹,即使贤君的惠民利民举措,也总是得不到民众的认可。韩非举例说:“今上急耕田垦草以厚民产也,而以上为酷;修刑重罚以为禁邪也,而以上为严;征赋钱粟以实仓库,且以救饥馑、备军旅也,而以上为贪;境内必知介而无私解,并力疾斗,所以禽虏也,而以上为暴。此四者,所以治安也,而民不知悦也。”(《显学》)韩非据此得出结论说:“民智之不可用,犹婴儿之心也。”(《显学》)民心根本就不重要,因为民众的智商就像婴儿一样低下,不值得君主的重视。一味强调顺应民心,只会导致天下大乱。“夫民智之不足用亦明矣。故举士而求贤智,为政而期适民,皆乱之端,未可与为治也。”(《显学》)
民众愚昧自私,也完全不值得信任。韩非认为,民众除了追逐自己眼前的个人私利之外,毫无诚信可言;追逐个人私利是人类的本性,大夫为人看病,车夫给人赶车,木匠打造棺材,不是为别人做好事,其实纯粹是为了个人私利。“医善吮人之伤,含人之血,非骨肉之亲也,利所加也。故与人成舆,则欲人之富贵;匠人成棺,则欲人之夭死也。非舆人仁而匠人贼也,人不贵,则舆不售;人不死,则棺不买。情非憎人也,利在人之死也。”(《备内》)即使是最亲近的夫妻之间和父子之间,一旦事关个人切身利益,相互之间也常常会勾心斗角,甚至到了你死我活的地步。因此,一般的人都是不可信任的。他还以赵武灵王被其儿子赵惠文王饿死沙丘宫以及晋献公受其宠妾骊姬怂恿害死亲生儿子为例,来证明人性可恶,即使夫妻父子也不可信任。“夫以妻之近与子之亲而犹不可信,则其余无可信者矣。”(《备内》)
君主的天职就是治民,圣人或明主治民的要害,在于抓住民众的本性,用刑罚去遏制民众的欲望,这才是真正的爱民。“圣人之治民,度于本,不从其欲,期于利民而已。故其与之刑,非所以恶民,爱之本也。”“故治民无常,唯治为法。”(《心度》)韩非认为,圣人治民所要达到的理想目标,就是避免六种“奸伪无益之民”,而塑造六种“耕战有益之民”。韩非眼中的六种“无益之民”是:畏死避难的“降北之民”、信奉方术的“离法之民”、悠闲享乐的“牟食之民”、巧言令色的“伪诈之民”、行剑攻杀的“暴憿之民”、包藏奸贼的“当死之民”。他所倡导的六种“有益之民”是:殉身赴难的“死节之民”、寡闻从令的“全法之民”、勤劳耕作的“生利之民”、敦厚淳朴的“整谷之民”、遵命畏事的“尊上之民”、勇斗奸贼的“明上之民”。(《六反》)
韩非政治思想的实质,就是维护专制君主的统治。因此,他关于君、臣、民思想的根本目标就是君主如何依靠人臣去治理民众,实现国家的所谓长治久安,即维护君主至高无上的人主地位。为了实现这一目标,君主既要治民,但更要治臣。如何治臣和治民?这就涉及到韩非政治思想的另一方面重要内容:法、术、势。
三、法·术·势
作为法家思想的集大成者,韩非政治思想的核心内容是法、术、势理论,特别是法治理论。韩非并不是法家理论的创立者,但却是公认的主要代表人物。他对法治的意义、性质、特征、作用、后果、方式等做了最为系统而深刻的论述,从而达到了中国传统法治思想的高峰。
“奉法者强”,法治是实现国家强盛繁荣和长治久安的根本途径,这是韩非的核心政治主张。他首先用国家兴衰的历史经验证明“国无常强,无常弱。奉法者强,则国强;奉法者弱,则国弱”(《有度》)。韩非分别以楚国、齐国、燕国、韩国、魏国等国的兴盛衰落为生动鲜活的实例,来说明国家的强盛和衰败并非一成不变,世上不存在长盛不衰的国家,所有国家兴衰的背后存在着一个普遍的规律,这就是:“故当今之时,能去私曲就公法者,民安而国治;能去私行行公法者,则兵强而敌弱。”(《有度》)凡依法治国者,国家就会兴盛;反之,国家则会衰弱,直至灭亡。“荆庄王并国二十六,开地三千里;庄王之氓社稷也,而荆以亡。齐桓公并国三十,启地三千里;桓公之氓社稷也,而齐以亡。燕襄王以河为境,以蓟为国,袭涿、方城,残齐,平中山,有燕者重,无燕者轻;襄王之氓社稷也,而燕以亡。魏安釐王攻燕救赵,取地河东;攻尽陶、魏之地;加兵于齐,私平陆之都;攻韩拔管,胜于淇下;睢阳之事,荆军老而走;蔡、召陵之事,荆军破;兵四布于天下,威行于冠带之国;安釐王死而魏以亡。故有荆庄、齐桓公,则荆、齐可以霸;有燕襄、魏安釐,则燕、魏可以强。今皆亡国者,其群臣官吏皆务所以乱而不务所以治也。其国乱弱矣,又皆释国法而私其外,则是负薪而救火也,乱弱甚矣。”(《有度》)
接着,韩非从多个方面对“奉法者强”的结论进行理论上的系统论证。在韩非看来,法是社会公共秩序的核心,以法为准绳就可以明辨是非,区分善恶好坏,从而对国家进行有效治理。“法分明则贤不得夺不肖,强不得侵弱,众不得暴寡。”(《守道》)只要有了法的准绳,君主用法去约束臣民,那么奸诈偷盗之人就会因惧怕受到惩罚而变得规矩,民众就能各守本分,社会就能井然有序。“明主之守禁也,贲、育见侵于其所不能胜,盗跖见害于其所不能取,故能禁贲、育之所不能犯,守盗跖之所不能取,则暴者守愿,邪者反正。大勇愿,巨盗贞,则天下公平,而齐民之情正矣。”(《守道》)韩非进而认为,君主乾纲独断,掌握着治理国家的根本大权,但君主不可能通晓一切,事事亲为,他必须依靠大臣去治理国家。君主要管理众多的臣僚,法是主要手段。“夫为人主而身察百官,则日不足,力不给。且上用目,则下饰观;上用耳,则下饰声;上用虑,则下繁辞。先王以三者为不足,故舍己能而因法数,审赏罚。先王之所守要,故法省而不侵。”(《有度》)
韩非认为,赏罚是君主有效治理国家的两种基本手段,他称为国之“二柄”:“明主之所导制其臣者,二柄而已矣。二柄者,刑德也。何谓刑德?曰:杀戮之谓刑,庆赏之谓德。为人臣者畏诛罚而利庆赏,故人主自用其刑德,则群臣畏其威而归其利矣。”(《二柄》)君主善于运用“二柄”的关键,在于依法治国。赏罚适当,则君安国强;若赏罚不当,则君危国弱。君主要做到赏罚适当,就必须奉法为大,把法律视为赏罚的基本标准。韩非以魏、赵、燕三国为例说,当它们以法作为赏罚的主要标准,做到有功者赏有罪者罚,那么国家就会兴盛;反之,当法不受重视,赏罚失准时,国家就迅速衰落。“当魏之方明《立辟》、从宪令行之时,有功者必赏,有罪者必诛,强匡天下,威行四邻;及法慢,妄予,而国日削矣。当赵之方明《国律》、从大军之时,人众兵强,辟地齐、燕;及《国律》满,用者弱,而国日削矣。当燕之方明《奉法》、审官断之时,东县齐国,南尽中山之地;及《奉法》已亡,官断不用,左右交争,论从其下,则兵弱而地削,国制于邻敌矣。故曰:明法者强,慢法者弱。”(《饰邪》)
既然依法治国是国家兴盛的关键所在,那么君主治理国家就要以法为本。按照韩非的逻辑,道和法是内在一致的,道是天地万物的根本法则,法则是世间治理的根本之道。道和法是万全的,智和能是靠不住的。“而道法万全,智能多失。夫悬衡而知平,设规而知圆,万全之道也。”(《饰邪》)法制严明,君主就能受到尊重,否则,国家就会动乱,君主的名位也无法维持。“故先王以道为常,以法为本。本治者名尊,本乱者名绝。”(《饰邪》)以法为本,就要任法而行,既不能“任贤”,也不能“任智”。韩非认为,儒家墨家等竭力倡导的贤能政治,实际上是天下动乱的根源。他以齐国和宋国的政治动乱为例,力图证明尚贤任智是逆道而非治道:“今夫上贤任智无常,逆道也,而天下常以为治。是故田氏夺吕氏于齐,戴氏夺子氏于宋。此皆贤且智也,岂愚且不肖乎?是废常上贤则乱,舍法任智则危。故曰:上法而不上贤。”(《忠孝》)韩非甚至认为,“任贤”和“任智”是君主治理国家的祸患。“人主有二患:任贤,则臣将乘于贤以劫其君;妄举,则事沮不胜。”(《二柄》)“事智者众,则法败;用力者寡,则国贫:此世之所以乱也。”(《五蠹》)他引用老子的话说:“以智治国,国之贼也。”(《难三》)因此,君主应当尽量远离仁义和智能,“故明主之道,一法而不求智”(《五蠹》),“有道之主,远仁义,去智能,服之以法”(《说疑》)。
韩非将法提升到治国之道的高度,把法看作是强国的关键,那么,他心目中的法究竟是什么呢?韩非关于法治的作用有过大量的论述,但对于法本身究竟是什么,反而没有集中而系统的论述。但从其相关论述中,我们仍可以大体概括出韩非关于法的定义。首先,韩非认为,法就是由官府公开发布并使民众周知的成文条例。“法者,编著之图籍,设之于官府,而布之于百姓者也。”(《难三》)其次,法虽然是官府制定颁行的,但却是君王用来赏罚臣民、维持安定的基本工具。“法者,宪令著于官府,刑罚必于民心,赏存乎慎法,而罚加乎奸令者也。此臣之所师也。君无术则弊于上,臣无法则乱于下,此不可一无,皆帝王之具也。”(《定法》)再次,法令是言和行唯一的最高准则,其中令是最高的指示,法是最合适的规则。凡不符合法令的言行,均必须禁止。“明主之国,令者,言最贵者也;法者,事最适者也。言无二贵,法不两适,故言行而不轨于法令者必禁。”(《问辩》)最后,韩非还认为,法令要公开、普及,须让广大民众广泛知晓,“法莫如显”(《难三》);要让臣民严格守法,就要努力创造条件,让臣民及时学法知法。“法也者,官之所以师也。然使郎中日闻道于郎门之外,以至于境内日见法,又非其难者也。”(《说疑》)
韩非法治思想的一个重要特点是,强调法是变与不变的辩证统一。韩非与其同时代的思想家一样,也崇尚“先王”的政治制度和政治价值,并以此作为其政治主张的合法性来源。但与其他思想家不同的是,韩非特别强调政治法律制度具有时代性,时代条件改变了,政治制度和统治方式必须随之改变。他说:“故治民无常,唯治为法。法与时转则治,法与世宜则有功。故民朴而禁之以名则治,世知维之以刑则从。时移而治不易者乱,能治众而禁不变者削。故圣人之治民也,法与时移而禁与能变。”(《心度》)例如,他认为仁义之治适合于上古时代,智慧之治适合于中世,而在他所处的大变动时代,国家之间的竞争完全取决于实力,只有法治方可救国,韩非称此为“事异则备变”(《五蠹》)。不懂得国家治理的人,才会僵硬地死守成法;政治法律制度若不随时代的实际条件而变革,国家就不会兴盛,不变法汤武就不能称王。“不知治者,必曰:‘无变古,毋易常。’变与不变,圣人不听,正治而已。则古之无变,常之毋易,在常古之可与不可。伊尹毋变殷,太公毋变周,则汤、武不王矣。”(《南面》)然而,韩非又十分清楚法律应具有相对的稳定性。韩非倡导变法,认为时代不同法律制度也应随之变革,是从长远的角度来说的。从短期来说,韩非认为,“法莫如一而固”(《五蠹》),法律应当具有某种稳定性。他阐释老子的观点说:“治大国而数变法,则民苦之。是以有道之君贵静,不重变法。故曰:‘治大国者若烹小鲜。’”(《解老》)在这一点上,他还批评申不害变法过于频繁,导致奸贼众多。“晋之故法未息,而韩之新法又生;先君之令未收,而后君之令又下。申不害不擅其法,不一其宪令,则奸多。”(《定法》)
从本质上说,韩非所说的法是君主的权力意志。韩非认为,君主必须拥有至高无上的绝对权力,君主的这种权力在现实政治中就体现为法和令。他说:“夫国之所以强者,政也;主之所以尊者,权也。故明君有权有政,乱君亦有权有政,积而不同,其所以立异也。故明君操权而上重,一政而国治。故法者,王之本也;刑者,爱之自也。”(《心度》)君主要掌握国家统治的最高权力,就必须牢牢掌握国家的立法大权。国家的立法权为君主所独掌,不与其他任何人分享。明主的立法,必须具有最高的约束力和最大的权威,并不折不扣地贯彻执行。“圣王之立法也,其赏足以劝善,其威足以胜暴,其备足以必完。”(《守道》)一旦君主的法令不能完全贯彻落实,而在执行过程中因顾及民意而发生偏差,那么国家就将陷入动乱。“乱世则不然:主有令,而民以文学非之;官府有法,民以私行矫之。人主顾渐其法令而尊学者之智行,此世之所以多文学也。”(《问辩》)
在韩非那里,法与术常常是并用的,“人主之大物,非法则术也”(《难三》)。韩非认为,术与法一样,也是君主统治国家的基本工具。“君无术则弊于上,臣无法则乱于下,此不可一无,皆帝王之具也。”(《定法》)《韩非子》一书有许多篇幅专门用来谈术,如《南面》《用人》《和氏》《爱臣》《主道》《八奸》《有度》《心度》《奸劫弑臣》《六反》《八说》《内储说上七术》,等等。有人统计,仅从篇幅上看,《韩非子》一书论“术”的内容甚至超过论“法”的内容。
韩非所说的术,主要是君主控制臣下的手段,是君主的统治权谋或权术。“人主者不操术,则威势轻而臣擅名。”(《外储说右下》)韩非说得很明白,术就是君主用来控制和驾驭群臣的工具。“术者,因任而授官,循名而责实,操杀生之柄,课群臣之能者也。此人主之所执也。”(《定法》)韩非认为,法与术是相辅相成的,两者缺一不可。仅讲法而不讲术,或仅重术而不重法,都不能使国家富强。他举例说,申不害治韩,只重术不重法,韩国长期不能强盛。“故托万乘之劲韩,七十年而不至于霸王者,虽用术于上,法不勤饰于官之患也。”(《定法》)反之,商鞅治秦,重法而不重术,虽使秦强盛却一直不能助秦称帝。“商君虽十饰其法,人臣反用其资。故乘强秦之资数十年而不至于帝王者,法不勤饰于官,主无术于上之患也。”(《定法》)术与法都是君主的统治手段,但术与法所不同的是,法是可见的,它以文字的形式编著于书籍之中,而术则是不可见的,它是隐藏在君主心中的控制臣民的办法。法越显越好,而术则是越隐越好。“术者,藏之于胸中,以偶众端而潜御群臣者也。故法莫如显,而术不欲见。”(《难三》)
韩非认为,君主首先要掌握识人之术,善于识别那些真正的治国之才。对于君主来说,最有用的治国之才就是术士。“主有术士,则大臣不得制断,近习不敢卖重;大臣、左右权势息,则人主之道明矣。”(《主道》)韩非把治国之才喻作和氏之壁,君主要像识美玉那样善于辨识人才。韩非以自己的切身体会不无感慨地说,这些法术之士尤其不容易为君主所器重。法术之士所献之策有利于君主和国家,却常常会损害大臣和民众的利益,所以,不免遭到大臣的忌恨和民众的讥讽。君主不应听从这些流行的偏见。“主用术,则大臣不得擅断,近习不敢卖重;官行法,则浮萌趋于耕农,而游士危于战陈;则法术者乃群臣士民之所祸也。人主非能倍大臣之议,越民萌之诽,独周乎道言也,则法术之士虽至死亡,道必不论矣。”(《和氏》)韩非告诫君主说,要特别警惕那些夸夸其谈,听起来学富五车的儒墨之士,在治国理政方面,这些儒墨之徒与法术之士相比,有天地之别。“俱与有术之士,有谈说之名,而实相去千万也。此夫名同而实有异者也。夫世愚学之人比有术之士也,犹蚁垤之比大陵也,其相去远矣。”(《奸劫弑臣》)然而,君主很容易被这些人欺骗,奖励并重用他们,造成国家的动乱。“藏书策,习谈论,聚徒役,服文学而议说,世主必从而礼之,曰:‘敬贤士,先王之道也。’……夫斩首之劳不赏,而家斗之勇尊显,而索民之疾战距敌而无私斗,不可得也。国平则养儒侠,难至则用介士。所养者非所用,所用者非所养,此所以乱也。”“故举士而求贤智,为政而期适民,皆乱之端,未可与为治也。”(《显学》)
识人是为了用人,如何用人是君主最重要的统治术,直接关系到政权,是国家兴亡盛衰的关键所在。“任人以事,存亡治乱之机也,无术以任人,无所任而不败。”(《八说》)既然只有懂得法术之人才是治国之才,那么君主用人术的关键就在于任用有术之人。君主若能识得并重用这些有术之士,自己就能尊贵无比,而国家则安宁稳定。“夫有术者之为人臣也,得效度数之言,上明主法,下困奸臣,以尊主安国者也。”(《奸劫弑臣》)君主如果在用人上不讲究术数,任用一些不懂得“智辩之士”或“清洁之吏”,就会给国家带来灾难性的后果。因为“智士者未必信也,为多其智,因惑其信也。以智士之计,处乘势之资而为其私急,则君必欺焉。为智者之不可信也,故任修士者,使断事也。修士者未必智,为洁其身、因惑其智。以愚人之所惽,处治事之官而为所然,则事必乱矣。故无术以用人,任智则君欺,任修则君事乱,此无术之患也”(《八说》)。韩非认为,有道的君主依靠的不是任用廉洁之士,而是善于觉察臣下奸邪腐败的方法,从而使得官吏不敢贪赃枉法。“明主之国,官不敢枉法,吏不敢为私利,货赂不行,是境内之事尽如衡石也。此其臣有奸者必知,知者必诛。是以有道之主,不求清洁之吏,而务必知之术也。”(《八说》)
韩非认为,君主治国并非直接治民,而是要通过臣僚,所以,君主治国的重点是治臣。“故吏者,民之本、纲者也,故圣人治吏不治民。”(《外储说右下》)与此相一致,治臣之术便是君主统治术的重中之重。为了使君主能够轻松驾驭人臣,韩非可谓竭尽智谋,他向君主提出了众多的御臣之术,择其要者,主要有以下几点。
韩非认为,过于信任和倚重臣僚是君主的通病。“万乘之患,大臣太重;千乘之患,左右太信;此人主之所公患也。”(《孤愤》)因此,他告诫君主,要始终与臣下保持相当的距离,不能与臣僚亲近,不能使臣下的地位太显贵,也不能使大臣们很富有。与臣僚太亲近,君主就容易受到伤害;臣下位高权重,则容易使臣下篡夺君位;人臣的权势过大,君主就很危险。“爱臣太亲,必危其身;人臣太贵,必易主位;……臣闻千乘之君无备,必有百乘之臣在其侧,以徒其民而倾其国;万乘之君无备,必有千乘之家在其侧,以徒其威而倾其国。是以奸臣蕃息,主道衰亡。是故诸侯之博大,天子之害也;群臣之太富,君主之败也。”(《爱臣》)君主必须依法治臣,无论臣属的智慧、功劳有多大,都要受到法律的约束,否则贻害无穷。“人主使人臣虽有智能,不得背法而专制;虽有贤行,不得逾功而先劳,虽有忠信,不得释法而不禁。”(《南面》)人主必须使臣下诚实守信,奖励守信者,惩罚失信者,即使对那些办事有功的大臣,只要发现有不诚实守信的言行,也必须严厉惩罚。“不信者有罪,事有功者必赏,则群臣莫敢饰言以愍主。主道者,使人臣前言不复于后,复言不复于前,事虽有功,必伏其罪,谓之任下。”(《南面》)君主不能轻信臣僚,即使对近臣也要严格保守政治机密,否则会国破身亡。“主有三守。三守完,则国安身荣;三守不完,则国危身殆。何谓三守?人臣有议当途之失,用事之过,举臣之情,人主不心藏而漏之近习能人。”(《三守》)君主要使臣僚专心致志做事,就不能让人臣身兼数职。“明主之道:一人不兼官,一官不兼事。”(《难一》)因为人臣若身兼多职,就容易分心并引发各种纷争。“明君使事不相干,故莫讼;使士不兼官,故技长;使人不同功,故莫争。”(《用人》)韩非还别出心裁地给君主支招说,君主要把声誉和功劳归于自己,而将恶名和责任推诿给臣僚,并称此为“贤主之经”。“有功则君有其贤,有过则臣任其罪,故君不躬于名。是故不贤而为贤者师,不智而为智者正。臣有其劳,君有其成功,此之谓贤主之经也。”(《主道》)
除了治臣之术外,韩非所强调的另一种统治术便是刑赏之术。韩非看到,其实每一个国家都有其法律,那么,为什么它们之间有兴衰存亡之别?这是因为有些君主不懂得刑赏之术。“故治乱之理,宜务分刑赏为急。治国者莫不有法,然而有存有亡;亡者,其制刑赏不分也。”(《制分》)他从人的本性好利畏死出发,认为赏罚是治理人臣最有效的手段。“凡治天下,必因人情。人情者,有好恶,故赏罚可用;赏罚可用,则禁令可立而治道具矣。”(《八经》)君主治国如能善用刑赏之术,则如行路有舟车之便,可轻易达到目的。“治国之有法术赏罚,犹若陆行之有犀车良马也,水行之有轻舟便楫也,乘之者遂得其成。”(《奸劫弑臣》)反之,君主如果不能掌握刑赏之术,赏罚不当,就不能称为明主。“凡治之大者,非谓其赏罚之当也。赏无功之人,罚不辜之民,非谓明也。”(《说疑》)运用赏罚手段是驾驭人臣最有效的手段,因此,君主必须牢牢将刑赏之权掌握在自己的手中,绝不能使其旁落于大臣之手,若刑赏出于多人,则君主就十分危险。“利出一空者,其国无敌;利出二空者,其兵半用;利出十空者,民不守。”(《饬令》)如何掌握好赏罚尺度,对于君主来说也十分重要,“以刑治,以赏战、厚禄,以用术”(《饬令》)。韩非明确主张重刑轻赏,他劝导君主说,重罚轻赏反而更能体现其爱民之情,也更能激发臣民的奉献精神。“重刑少赏,上爱民,民死赏;多赏轻刑,上不爱民,民不死赏。”(《饬令》)总之,在韩非看来,只有高超地掌握刑赏之术的君主,才称得上是“圣人”和“明主”。“故善为主者,明赏设利以劝之,使民以功赏而不以仁义赐;严刑重罚以禁之,使民以罪诛而不以爱惠免。是以无功者不望,而有罪者不幸矣。”(《奸劫弑臣》)
韩非把法和术视为君主统治臣民和治理国家的两种相辅相成的基本工具,认为只要君主能依靠法和术,而不是仁和智来治理臣民,那么国家就能长治久安。君主正确运用法和术的工具,必然会产生一种客观的后果,就是给君主带来“势”。所以,韩非的思想体系中,法、术、势是三位一体的关系。
法家所说的势其实是权力的一种功能,也是君主运用法和术两种统治工具的结果。只要君主拥有至高无上的权力,他就必然拥有一种压倒众人之势。“君执柄以处势,故令行禁止。柄者,杀生之制也;势者,胜众之资也。”(《八经》)君主之势并非先天的自然产物,而是后天人为造就的。“夫势者,名一而变无数者也。势必于自然,则无为言于势矣。吾所为言势者,言人之所设也。”(《难势》)进而言之,君主之势,从某种意义上说,就是其权位的一种属性,没有权柄势也就无从谈起。韩非在论及势时,总是将“势”和“位”连在一起,并称“势位”。“万乘之主、千乘之君所以制天下而征诸侯者,以其威势也。威势者,人主之筋力也。”(《人主》)君主拥有至高无上的绝对权力,正是这种权位使得君主拥有居高临下的“制人之势”。“今人主处制人之势,有一国之厚,重赏严诛,得操其柄,以修明术之所烛。”(《五蠹》)
与上述观点相一致,韩非认为,君主的势源自其权位,而与贤和智均无关。“贤智未足以服众,而势位足以屈贤者也。”(《难势》)他举例说,暴君桀乏贤可陈,却因身为天子大权在握,作乱天下;尧是贤者,却因无权而几个人也管不了。可见,势来自于权而与贤德无关。“尧为匹夫,不能治三人;而桀为天子,能乱天下:吾以此知势位之足恃而贤智之不足慕也。”(《难势》)他还举例说,集仁义和智慧于一身的孔子是公认的圣人,但跟随他的不过70名弟子;而智慧与道德低下的鲁哀公,却能使全体国民都服从他,孔子自己也是他的臣民。要是仁义和智慧带来势,则鲁哀公应当服从孔子才对,可见君权才是势的来源。“仲尼,天下圣人也,……以天下之大,而为服役者七十人,而仁义者一人。鲁哀公,下主也,南面君国,境内之民莫敢不臣。民者固服于势,诚易以服人,故仲尼反为臣而哀公顾为君。仲尼非怀其义,服其势也。”(《五蠹》)
既然法和术与君主自身的安危与国家的兴亡紧密相关,那么作为法术之功能的势当然也直接关系到国家的安危了。用韩非自己的话来说就是:“抱法处势则治,背法去势则乱。”(《难势》)韩非认为,势位是君主功成名就的基本要素之一:“明君之所以立功成名者四:一曰天时,二曰人心,三曰技能,四曰势位。”(《功名》)君主具有势位,方能享有莫大的尊贵和安全。“千钧得船则浮,锱铢失船则沉,非千钧轻锱铢重也,有势之与无势也。故短之临高也以位,不肖之制贤也以势。人主者,天下一力以共载之,故安;众同心以共立之,故尊。”(《功名》)韩非以宋桓公和齐简公的历史教训告诫君主说,君主一旦失势就可能身死国亡。“今势重者,人主之爪牙也,君人而失其爪牙,虎豹之类也。宋君失其爪牙于子罕,简公失其爪牙于田常,而不蚤夺之,故身死国亡。”(《人主》)
势事关君主生死和国家存亡,那就只能由君主独自一人拥有,而不能与群臣们分享,这是韩非对君主的又一告诫。君主如果让臣僚分享其权势,那就必定大权旁落。“权势不可以借人,上失其一,臣以为百。故臣得借则力多,力多则内外为用,内外为用则人主壅。”(《内储说下六微》)韩非以擅长驾车的王良、造父不能同驾一辆车,擅长弹奏的田连、成窍不能同奏一个调为例,警告君主切忌与臣僚分享其势。“夫以王良、造父之巧,共辔而御,不能使马,人主安能与其臣共权以为治?以田连、成窍之巧,共琴而不能成曲,人主又安能与其臣共势以成功乎?”(《外储说右下》)君主一旦失势于臣,就很难再收回来,就像鱼离开深渊一样。“势重者,人主之渊也;臣者,势重之鱼也。鱼失于渊而不可复得也,人主失其势重于臣而不可复收也。”(《内储说下六微》)
四、结论与反思
韩非并不是法家的创立者,其实质性的独创观点并不多,却是公认的标志性法家代表人物。一方面,韩非把法术优先推到了极端,从“任法而治”的法家一般主张,推到了“唯法为治”的至高境地。他不仅把“任法而治”视为国家强盛和政治安定的基本手段,而且把其当作判断君臣的价值标准。在韩非的眼中,奉法而治的君主才是明主圣王,法术优先的臣僚才是良臣善士。他的《韩非子》一书,既从理论上系统地批驳不同于法家主张的儒墨等其他思想流派,又按照法家的标准选用大量的案例事实来论证只有凭借法术之治才能达到“治之至”,实现他所理想的“至安之世”。另一方面,韩非将他之前各家法术思想流派最大限度地融合于一体,将管仲、李悝、吴起、慎到、申不害和商鞅等人关于法、术、势的观点吸纳于自己的著作之中,从而形成了中国思想史上最为完善的法家思想体系。由于上述两个方面的原因,韩非成了中国政治思想史上最重要的法家代表人物,是法家思想的集大成者。在这一点上,两位民国时期研究《韩非子》的著名学者陈启天和常燕生的判断是对的。陈启天说:“当战国时,诸子百家争鸣而最合其时势之显学厥为法家。法家之集大成者,当推韩非。故谓《韩非子》书为战国时代思潮之代表作品亦无不可。自有是书而后,列国生存于战国时代者,有所师法矣;自有是书而后,中国由封建政治进入君主政治之理论确立不移矣;自有是书而后,秦得依其理论以结束战国,完成一统,为中国奠一新基矣。由汉以来,是书在政治思想上之价值,虽不甚为学人所推尊,然每当鼎革之际,其能由纷争而复归于一统者,实赖有政治家实际运用其学说也。故若明于《韩非子》之学术,不惟有可知战国时代之思想主潮,即两汉以迄清末政治思想之伏流,亦可略识其消息矣。”新法家的重要人物常燕生也说:“我们说法家是古中国学说之最进步者,而法家的钜子韩非子尤为集上古学术之大成。犹如他的同学李斯完成了政治统一的工作一样,他也可以说完成了学术统一的工作。”
如前面所述,《韩非子》一书不仅集合了早期法家各个流派的主要观点,而且从黄老之学吸取了“道”和“形名”思想。道家学说为韩非的全部政治思想奠定了哲学根基。不仅如此,韩非还从儒家、墨家和兵家、农家等诸子百家中吸取大量的知识和思想。《韩非子》对儒家、墨家,乃至法家等各种当时流行的学说多有批评,然而,这种理论的批评过程同时也是从其他学说中吸取理论营养的过程。“先秦主要学派,照司马谈所说,分为阴阳、儒、墨、名、法、道德六家(参见《史记·太史公自序》)。韩非学说,既为法家,自与儒、墨、名、阴阳、道德五家不同,甚至根本相反。不过,韩非学说,也有源于法家以外各家的。”韩非是荀况的学生,荀子是儒家的重要代表人物,儒家的思想不可避免地给韩非打上了深刻的烙印。除了尊君、循名、忠孝等思想外,荀子的性恶论,更是韩非人性论的实质性来源。荀子说:“人之性恶,其善者伪也。”(《荀子·性恶》)韩非传承了这种人性观,屡屡告诫君主切莫相信人性之善。正是基于这种人性极端自私的观点之上,韩非才发展起其整个法术思想体系。韩非虽然贬称墨学为“愚诬之学”,但其关于“选贤任能”和“法不阿贵”的思想却与墨子以下的观点如出一辙:“官无常贵,民无终贱”;“列德而尚贤,虽在农与工肆之人,有能则举之”。(《墨子·尚贤上》)从广泛综合并吸取诸子百家思想的角度看,韩非是法家思想的集大成者,《韩非子》一书在某种程度上也是对春秋战国时期诸子百家思想的一种综合。正如陈启天所说,韩非的法家学说,是“一种综合的、集成的、完整的法家学说”。或如梁启超所论:“韩非为先秦诸子之殿,亲受业荀卿,洞悉儒家症结;‘其归本于黄老’,监道家之精;与田鸠游,通墨家之邮;又泛滥于申、商、施、龙,而悉抉其藩,以自成一家言。”
国家主义是《韩非子》一书的显著特征,韩非是中国政治思想史上最早的国家主义倡导者。“我国之有国家主义,实自法家始。”在韩非所处的战国时代,普遍实行君主专制政治,国家在性质上既非贵族所有,更非民众所属,而是君主的政权组织。虽然在君主政治条件下,国家政权的本质是君主个人专制的工具,但国家从其产生开始便是人类最重要的政治共同体,国家权力体系也具有某种内在的公共性。即使按照马克思主义的国家观,国家是阶级统治的工具,“是统治阶级的各个人借以实现其共同利益的形式”,君主也只是统治阶级的政治代表,国家政权也有着某种程度的公共性。《韩非子》政治思想的一个重要特征就是区分公与私,并将公与私视为政治评价的一个基本标准。他说:“公室卑则忌直言,私行胜则少公功。”(《外储说左下》)奉公则治,任私则乱,从而把公共利益与私人利益的区分提升到了关系国家兴衰治乱的高度。在韩非看来,“私者,所以乱法也”(《诡使》),私人利益优先,就会导致国家的混乱。厉行法治,就是为了遏制私人利益。“夫立法令者,以废私也。法令行而私道废矣。”(《诡使》)如此明确地将国家利益等同于公共利益,这在中国政治思想史上具有开创性的意义。虽然韩非没有使用马基雅维利的“国家理性”(reason of state)概念,但却先于马基雅维利1700多年,将国家与君主在一定程度上区分开来,并视国家利益为公共利益。由于韩非所说的公即是国,倡导公共利益优先,即是倡导国家利益优先于个人利益,所以说,韩非是中国政治思想史上最早的国家主义者。
韩非政治学说的本质特征是绝对君主专制主义。韩非所处的战国时期,是中国历史上典型的封建政治时代。庞大的西周王朝分崩离析后进入东周时期,形成了众多诸侯国家,这些诸侯国家普遍实行君主专制制度。这些诸侯国家经过长期相互兼并,形成了不少实力强大的君主国家,例如所谓的“春秋五霸”,即齐桓公、宋襄公、晋文公、秦穆公、楚庄王。他们成为各自诸侯国的最高统治者,并建立霸业。进入战国时期后,列国之间的争雄更加激烈,最终形成了所谓“战国七雄”,即齐、楚、燕、韩、赵、魏、秦七大君主国。如何夺取和维护君主权力,如何使君主治下的国家更加强盛,成为当时诸子百家共同的政治课题。在维护君主制度的共同前提下,儒、法、墨、道等诸家流派各有自己追求的理想政治,并发展出了各种君主政治观。其中儒法两家对现实政治的影响最大,信奉的统治者和政治精英也最多。它们分别代表了中国传统的相对君主专制主义和绝对君主专制主义两大政治思想体系。在“忠君”“尊主”或维护君王主权的共同前提下,儒家倡导仁义、爱民、礼治等柔性的“王道”理想政治,而法家则主张暴力、苛政、法治等刚性的“霸道”理想政治。韩非作为法家思想的主要代表,则把绝对君主专制主义发展到无以复加的地步。按照《韩非子》的统治逻辑,君主不仅必须掌握最高的统治权,而且也不能与其臣僚分享任何统治权。为了维护这种至高无上的君权,君主不仅可以不择手段,而且必须使用各种权术。相对于君主的统治地位和至高权威而言,其他所有大臣和民众都是微不足道的。君主的威势来自其实力,君主获得实力的关键在于其法术。简言之,对于作为绝对君主专制主义者的韩非来说,君主及其至高无上的君权本身就是国家的核心政治价值,这是其《韩非子》一书的根本特征。
《韩非子》作为传统法家最重要的代表作,强调“任法而治”,严格按照法律治理国家,从根本上说,它所阐述和宣扬的是传统的法制(rule by law)思想,而不是现代的法治(rule of law)思想。表面上看,传统的法制观与现代的法治观两者十分相似,两者都把法律当作治国的基本工具,强调依法治国的极端重要性,强调严格按照法律行事,但实质上两者之间有着根本的区别。传统的法制观在强调法律和依法治国的重要性时,始终有一个默认的前提,即君主的权威凌驾于任何法律之上,或者说君主的意志即是国家的法律;与之根本不同,现代的法治观则强调法律本身就是国家的最高权威,任何人和任何组织,包括国家最高统治者本人,都必须在国家的法律框架内活动,法律面前人人平等。韩非反对依贤智治国,主张依法治国,但他的“任法”治国论同样将君主的权威置于法律之上,法律只是巩固君主权威的工具,法律的制定权和执行权最后都在君主手中。作为传统法家思想的集大成者,与其他所有传统法家人物一样,韩非的法治观同样没有超越传统法制的思想,远不是现代意义的法治理念。从君主拥有统治国家至高无上的绝对权力并且这种君权凌驾于法律之上而言,韩非的法治思想实质上也是一种人治思想。正如萧公权所说:“韩子取申之术以合于商之法,其意殆在补法治之不及。易词言之,韩子之学实调和人治与法治两派之思想。虽然,吾国古代法治思想,以近代之标准衡之,乃人治思想之一种。盖先秦诸子之重法,皆认法为尊君之治具而未尝认其本身具有制裁元首百官之权威。”
韩非的绝对君主专制主义思想,是一种典型的现实主义政治观。任何人在分析社会政治问题时总是自觉地或不自觉地遵循某种方法论原则。在众多的方法论原则中,最高层面的方法原则是理想主义与现实主义。理想主义重视应然(ought to be)的价值甚于实然(to be)的价值,它并非不关注现实,更不是与现实毫无联系,但比起“事实是什么”来,它更关注“应该是什么”。理想主义者总是用“应当怎么样”来分析和评判“现实是什么”,并据此对现实提出种种批评。与此不同,现实主义重视实然的价值甚于应然的价值,它也并非不关注理想,更不是没有长远理想,但比起“应该是什么”来,它更关注“现实是什么”。现实主义者着眼于用“现实是什么”,去解释和预测“未来应当怎样”。在春秋战国的诸子百家中,儒家、道家、墨家更偏重于理想主义的思想体系,而法家则属于典型的现实主义思想体系。与《君主论》作者、欧洲思想史上伟大的现实主义政治理论家马基雅维利一样,韩非也公然倡导君主的权力和地位是至高无上的,君主为了达到自己的政治目的,可以而且必须不择手段地运用一切权谋和治术。韩非强调,现实政治在不断发展变化,君主的统治必须从实际出发,“不法常可”,“事因于世,而备适于事”(《五蠹》)。韩非的法、术、势思想都不是凭空而来的,甚至也不是对早期法家思想的简单继承,而是本源于古代中国残酷的政治现实,是“观往者得失之变”(《史记·韩非列传》)的结果。几乎对每一个重要观点的阐述,韩非都会佐以相应的历史与现实案例。这是《韩非子》一书的最大特点之一。与马基雅维利的君主理论一样,韩非的政治学说把人类现实政治生活中最丑陋阴暗的一面毫无遮掩地展示在世人眼前,这也是为什么许多统治者暗暗地践行着其法术权谋理论却不敢公开承认的重要原因。
韩非绝对专制主义思想得以产生和流行的根本原因,是君主专制政治的现实需要。韩非所处的战国时代,是一个诸侯林立、战火纷飞、列国争雄、弱肉强食的社会政治转型时代。在这样一个时代,国家的兴亡和政权的更替,就像走马灯一样。韩非在《亡征》中列举了47种导致国家灭亡的原因和征兆,涉及到内政外交、政治经济等各个方面。若国家贫弱不强,则随时可能被外敌吞并亡国;若统治者软弱无能,则随时可能被臣下篡权夺位;若国内动乱不定,则最强大的国家也会很快衰亡。“春秋战国之际,是旧的奴隶制向新生的封建制转变的时期。……加强君主集权,则是这一时期各国政治体制的共同特征。”韩非的全部政治学说,都是围绕着如何通过强化君主集权,达到国家强盛,防止国家衰亡这一根本目的而展开的。熊十力评论说,韩非是“列强竞争时代之极权主义者,其志在致国家于富强以兼并天下”。毫无疑问,在韩非所处的战国时期,“普天之下,莫非王土;率土之滨,莫非王臣”(《诗经·小雅·北山》),国家无一例外都是君主的领地,“国者君之车也”(《外储说右下》),君主是国家兴衰存亡的关键。韩非紧紧抓住了君主这一关键,并把它推到极端。他把君主奉为最高政治价值,急君主所急,忧君主所忧。包括其农战、君臣、法术和权势观在内的全部政治学说,归根结底都是关于如何增强君主的力量,维护君主的绝对权力,从而实现国家的长治久安。从这个意义上可以说,韩非的政治学说,“是由封建国家转变而成君主国家的极必要工具,也是由列国纷争转变而成一统帝国的必要工具”。
《韩非子》是中国历史上影响最为深远的典籍之一,韩非的政治学说不仅对秦以后的整个中国政治思想史,而且对秦以后的整个中国政治发展史,都产生了难以估量的巨大影响。无论是喜欢还是憎恶韩非的政治观,都不能否认韩非政治思想的划时代影响。仅以韩非的法术思想对中国历史上第一个大一统帝制国家秦王朝的兴起和衰亡的评析为例就可明了:赞成者将秦朝的建立归功于秦始皇全盘采纳了韩非的统治理论;而反对者则将秦朝的灭亡同样归因于秦始皇信奉韩非的法术思想。前者如郭沫若,他说:“秦始皇的作风,没有一样不是按照韩非的法术行事的。焚书坑儒两项大德正好是一对铁证。”后者如苏东坡,他说韩非的学说“及秦用之,终于胜广之乱,教化不足而法有余,秦以不祀,而天下被其毒”。韩非的思想不仅对秦始皇产生了重大的影响,而且对中国历史上许多伟大的政治家都产生过影响。例如,专门的研究表明,诸葛亮的执政风格具有明显的韩非色彩,“《韩非子》犹如一个事先预备的剧本,诸葛亮则是一个很好的演员,恰当地呈现了剧本所具有的精神特质”;曹操“唯才是举”的思想渊源,也“实实在在来自《韩非子》”;“唐太宗鼓励群臣进谏的言论,处处表明他受到了韩非子思想的影响”。
关于《韩非子》对中国政治思想史和中国政治史的巨大影响,几乎没有什么争议,但对于这种巨大影响的评价却有着天壤之别。赞成者将它看成是富国强兵的必备工具,是国家兴盛的宝典秘籍;反对者则视它为泯灭人性的异端邪说,是祸国殃民的害虫毒药。从古至今对韩非思想一直存在着正反两种极端的评价,这一现象本身就值得深入研究和思考。纵观《韩非子》对后世思想史和政治史的深远影响以及后人种种对其的评价,我们至少可以得出以下三点结论。
首先,从政治思想的本质来看,韩非的政治学说是中国政治思想史上典型的绝对君主专制主义理论,君权至上是其全部理论的根本目标。只有抓住韩非思想的这一实质,才能真正深刻把握《韩非子》一书的精髓。“韩非的全部政治思想,是以加强君主独裁和维护君主利益而开展的,这是韩非观察问题和处理问题的出发点和归结点。”
其次,从政治学说史的角度看,韩非从理论上系统地总结了春秋战国时期各国君主专制政权的兴亡更替经验,形成了中国政治学说史上最为完备的专制主义政治理论,《韩非子》几乎成为个人专制独裁的百科全书。“韩子已参照历史之经验,改进前人之成说,于专制政体之蔽,几乎备见无遗。其六微、七术、八奸、十过诸说亦几成秦汉以后二千年中昏君失政之预言。”因此,无论对韩非的学说喜欢还是憎恶,无论是研究专制独裁的思想理论,还是实践专制独裁的统治权谋,谁都无法绕开韩非的著作。
最后,从政治价值观的角度看,对韩非的学说必然会存在截然相反的评价。一方面,韩非公然宣扬君贵民贱、背信弃义、贪欲自私、专权暴虐、不择手段、欺诈陷害、残酷无情等人类的政治之恶,与历史的进步潮流和人性的正义良知背道而驰,从本质上说是极端反动的。另一方面,韩非强调变法强国、任法而治、法不阿贵、耕战并重、强兵富国、赏罚分明、唯才举吏等政治策略和统治智慧,在处于人类政治发展早期的君主专制阶段,特别是在社会政治转型的战国时期,有其历史的进步意义。因此,韩非给后人留下了两份重要遗产:一份是君权至上的消极遗产;一份是依法治国的积极遗产。在现代民主政治的条件下,对待韩非及其《韩非子》,应当像对待马基雅维利及其《君主论》一样,坚决抛弃其君主专制的消极遗产,努力弘扬其依法治国的积极成分。
本文转自《政治思想史杂志》
崔志海:鸦片战争失败原因再反思
鸦片战争已过去180多年,这场战争深刻改变了中国历史的走向,被称为中国历史的一道“分水岭”和中国近代史的开端。在这场事关中国历史走向的中外战争中,有着4亿人口80万军队的清朝政府竟然败于远涉重洋的2万余名英军,武器的相对落后固然是其中一个因素,但显然并非主要原因。诚如战前一位英国侵略者所分析:与中国开战,“攻打者恐有艰难不利之事。我等思想打仗,只利攻打首城,但中国宽大,有好几省地方,可以攻打,然皆离省城路远;即攻打这些地方,亦不能令北京为难,我等亦不能夸扬自己熟习兵法。即如攻打中国,必须起大兵,此是一件实事。然中国海陆皆宽大,此又是一件难事。我等已不知内地如何情形,又不知其如何办理拒敌;若径去攻打,是为最危险之事”。即使是采取占领中国沿海港口策略,也会遇到英军“驻扎地方,相距路远,又必须要好多兵船保护”的难题。魏源在《海国图志》中总结和反思清军战败的原因时,亦认为主要不在于武器的落后,而在于人的因素,说道:“城,非不高也;池,非不深也;兵甲,非不坚利也;委而去之,是器利不如人和也。”为了更好地总结历史教训,本文在前人探讨的基础上,重读史料,着重就“人和”方面再做一些深层的分析和反思。
一
在中外民族战争中,广大民众的支持是胜利之本。在鸦片战争中,英国政府和英军都十分注意争取中国百姓的民心。事实上,英国决定发动侵华战争,除了清军军队的腐败和武器军事的落后之外,就是看到中国民众在清朝专制统治下普遍缺乏民族意识和爱国心,不会起来反抗外敌的入侵。一位英国侵略者在1836年8月英文《中国丛报》上发表的一篇文章中就曾这样鼓吹道:“在一切亚洲国家里,农民已被迫到仅仅能够生存的境地,使得他们无心去问谁是总督,谁是皇帝;实则,无论骑在他们头上的是谁,反正他没有什么东西可丢失,因为新的征服者为了他自己的利益,将不试图折磨不再有什么东西可以榨取出来的他们了,而且征服者的战利品——土地,非依靠他们的勤劳,是不会产生价值的。所以,在一切变革与改朝换代中,农奴和农夫只沉默地生活着,对于他们的所谓爱国心,只是一种对他自己生长所在地方的一种爱家乡的感情,而不扩大到统治着国家的王朝;即使扩大些,它也不比对于自己家乡的感情更多些。这是东方的大帝国所以很快地就被蚕食的秘密;只要迅速给这个国家的元首以致命的打击,或粉碎了他的防御军队的战斗力,一切就都完了……至于和平的农民和工人则对于战争既全不为意,对于谁胜谁负也无所偏倚。中国、印度、波斯的重复被征服可以充分地证明这一点。从此,我们也可以判断,中国的兵力既这么松懈,这么无能,它的被征服将比过去更为容易实现。”
为了争取中国百姓的民心,英国政府在下达给海军部的训令中明确指示:“女王陛下政府特别希望不对中国人民采取任何不必要的暴力行动。因此,女王陛下政府的意愿是,如果没有必要或没有重大的挑衅行为,舰队司令官将不进攻炮台,不损害或破坏城镇,除了他将要占领的那个岛屿或那些岛屿之外,不对中国的任何部分领土采取任何积极的战争行动。”1840年3月4日,英国政府又专门向英国全权大臣、侵华远征军总司令懿律下达如下训令:“为了尽量防止中国人民方面对于英国政府将要对中国政府采取敌对行动的原因和目的产生一切惊慌和误解,我不得不希望,当你们沿中国海岸前进的时候,你们应散发那些将要为该项目的而印成中文的传单,向人民简短地叙述和阐明英国政府抱怨的理由,以及已经采取的海陆军事行动的目的。”根据英国政府的指示,英军在侵华过程中每至一地都散发传单、张贴告示,声称他们发动战争是因为受了清政府的不公正对待,只对官不对民,在中国百姓与清朝政府之间进行离间,并釆取诸如高价购民间食物等措施,以笼络中国普通百姓和民众。
在侵华战争过程中,尽管英军也遭受沿海沿江民众的一些自发抵抗,其中以广州三元里人民的抗英斗争最为典型,但始终没有陷入人民战争的汪洋大海之中;相反,受英军的欺骗宣传和笼络,出现大量汉奸助敌行为,帮助英军攻打清军。如在广东战场,1841年1月英军进攻沙角、大角炮台,就有汉奸配合英军,“洋船炮攻其前,而汉奸二千余,梯山后攻其背”,导致“陈连升父子战死,贼遂据沙角、大角两炮台”。2月英军进攻虎门各炮台,又有汉奸为其“沿途探水”,“暗放小舟,四测水势,因而内河沙澳,尽为夷稍所悉”,且“导白洋人遍历营垒,尽得虚实,归报无备。于是分路深入,破凤凰冈营,进攻东西炮台、海珠炮台,尽扼猎得、大黄滘两咽喉矣”。在英军进攻定海、镇海、宁波、慈溪等地过程中,也有汉奸假扮乡勇,分为数队,配合英军作战,还由于有“汉奸处处为之引导”,致使英军对于战区的山势陆路“较我兵反为熟悉”。而在英军占领定海、宁波等地时,也有汉奸帮助英军维护地方殖民统治,充当巡捕,“帮同办事”。除了为英军提供情报,配合英军军事行动和统治外,还有汉奸为英军采购食品和物资,为英军提供后勤保障,如在定海被乡民捕获送官的布定邦就是专门为英军提供后勤服务的汉奸。在英军进攻镇江过程中,瓜洲、义征的盐商竟然不顾民族大义,推出代表颜崇礼,主动前往英军军营赠送牛、羊、鸡、酒、豚和新鲜瓜果蔬菜,另送上50万元,作为英军免征瓜洲、义征两地的“赎城费”,并还借刀杀人,控告和指引英军炮轰进行反抗斗争的老河影一带的盐民,致使“数千私枭,几无噍类矣”。
汉奸的这些资敌行为,为侵华英军提供了极大帮助。在定海人民将帮助英军采买食物的汉奸布定邦擒获后,侵华英军就供认这是“一个最严重的打击”“引起了军队的后来的全部苦难”。正是鉴于汉奸的帮凶作用,英军在发动侵华战争过程中,一直要求清朝政府不得捉拿和惩处为英军服务的汉奸,加以保护,并将这一要求最后写入《南京条约》,规定:“凡系中国人,前在英人所据之邑居住者,或与英人有往来者,或有跟随及俟候英国官人者,均由大皇帝俯降御旨,誊录天下,恩准全然免罪;且凡系中国人,为英国事被拿监禁受难者,亦加恩释放。”
在争取民心和民众支持方面,清朝政府虽然也进行过一些宣传活动,如张贴告示,奖励民众杀敌,并进行过一些募勇活动,但对民众始终抱利用和不信任态度,作为“不过羁縻匪类,不使内讧而已”和“安内攘外”的权宜之策。并且,在清朝专制统治家天下政治和愚民政策以及统治阶级的长期无情剥削和压迫下,中国民众的民族意识和爱国心也不可能在一夜之间唤醒或被激发,如广东民众在战争爆发后刚开始时因为英军采取“要结民心”的政策,就没有响应官府的号召,抗击英军的入侵,“虽有擒斩敌人之赏格,无一应命。当洋兵攻城,居民多从壁上观”。而广州的买办和仆役虽然因广东地方当局的命令离职,“但不久却又回到雇主那里去了”。并且,许多当地居民也没有起来反抗英军的占领,如英军第二次占领定海时,城内的居民就“好像很高兴的样子,不到三天就设起一个好市场,一切安然进行”。而在英军攻陷吴淞时,当地百姓因受清朝官吏的搜刮到了“忍无可忍的地步”,大胆起来“反抗这些官吏的压迫”,“起誓说决不容许他们再回来”。
而需要特别指出的是,道光皇帝和清朝统治阶级最后放弃抵抗,采取投降政策,除了看到英国的船坚炮利之外,一个很重要的原因就是担心官民矛盾威胁自身统治,产生攘外必须安内的思想。浙江巡抚刘韵珂、署乍浦副都统伊里布、琦善、耆英等主和派官员劝说道光皇帝放弃抵抗的一个重要理由就是官民矛盾的尖锐,担心境内“外患未平,内讧又起”,“另有不逞之徒乘机而起”,认为英国“其意不过求赏马头、贸易通商而止,尚非潜蓄异谋”;“自古远猷,攘外必先安内”,“内不自安,何暇攘外?”而道光皇帝最后走上投降道路,匆匆决定接受江宁条约,也是因为认同内忧为“心腹之患”,于是,于7月18日便密谕授权耆英求和,表示愿意通过答应英国割让香港和增辟通商口岸等侵略要求达到退兵的目的,谓:“该逆如果真心求和,于通商而外别无妄求,朕亦何乐而不罢兵?即令仅止给香港一处栖止贸易,或该国船只偶至闽、浙口岸,暂时停泊,售卖货物,旋即驶去。虽非旧制,然随时变通,朕岂不思保全沿海生灵,聊为羁縻外夷之术”,指示耆英向英方转达此意,将结果“据实密奏,断不准走漏消息,致懈军心”。这一点甚至也被当时英方官员窥破,一位英军官员在《缔约日记》中这样写道:“中国官吏并不隐饰他们是急于求和。混乱、不满、暴动与日俱增,内地的不法匪徒,横行抢掠,须等和议成功后,才能派兵去剿。”
战后,两江总督耆英也做过深刻反思,认为英军利用清朝官民之间的矛盾进行离间是清军战败的一个重要原因,说道:“至于英夷,本系远来穷寇。我圉若固,彼亦何敢鸱张。而连年以来,频遭残破,其中殆亦有故,盖我之官兵,情同乌合,我之民心,又皆涣散,久已为所窥破,所到之处,必先扬言专与官兵打仗,与民无涉……该夷之假仁假义,要结民心,事事反我之道而行之,实属信而有徵。我之官员兵役,犹存故智,事事与民为难,何异为丛驱爵?此攘外之难于措手者一也。”徐继畬在厦门之战后写给友人的信中,亦认为官民矛盾、得不到民众支持是英军之所以能连连取胜、清军连连败北的根源,谓:“彼以重资买我内地之奸民,为之爪牙,我之虚实,彼无不知,战则驱奸民为前导,为之致死,而我之官兵,则承平日久,人不知战,名之为兵,实则市人,无纪律,无赏罚,见贼即走,此所以败也。”
一位英国侵略者在他的战记中就曾为此十分得意地写道:“这真是在战争中出现的一种不可思议的现象:在一个地方,我们和当地的老百姓做着买卖,在另一个地方,我们则和他们交战;在一个地方,我们伸出右手和本地人谈交情,在另一个地方,我们竟用真刀真枪和他们打个你死我活。显然这是由于我军作战的对手,是中国政府而不是中国老百姓。我们希望将战争的痛苦加诸于中国政府方面的愈多愈好,而使中国老百姓所受战争的影响愈少愈好。我们应该这样说,战争既然是残酷的,然而从全部欧洲战争史来看,我们还找不出一个先例,能和这次战争对比:它所加于老百姓的困苦是这样少,所给予他们的恩惠是这样多。”
清朝在鸦片战争中表现出来的官民矛盾和民众缺乏民族精神,清楚表明中国在进入近代以后不但亟需进行深刻的军事变革,同时也急需政治变革,推翻封建君主专制统治,建立民主制度,改变官民关系,唤醒国民树立近代民族国家思想。
二
任何战争,军队和士兵的战斗力都是决定胜败的一个重要因素。除了武器的相对落后之外,清军在“人和”方面也存在严重问题,缺乏战斗力。清军虽号称有80余万军队,但由于清军的八旗和绿营都实行世袭兵制,再加上承平日久,八旗和绿营兵不但缺乏训练,且多老弱病残,同时存在严重的将弁吃缺冒滥现象,武备废弛,军纪败坏,除少数将领和士兵之外,清军的整体素质极差,不足以言战。魏源在《海国图志》中谈到沿海各省的水师时作出如下描述:“闽、广水师,每省三万有奇,江、浙水师,每省二万有奇,虚冒半之,老弱半之,未必有数千之可用。”鸦片战争中清廷调派到广东的清兵则毫无军纪,“路中有抢夺人财物者,有殴伤差役者。及到省,兵不见将,将不见兵,纷扰喧呶,全无纪律”。而作为广东清军最高统帅的靖逆将军奕山“自抵粤以来,不问军旅之计作何整顿。地势之谋,作何防堵,以及运筹决胜之策,折冲御侮之计,一无所出。唯知爱购钟表,喜买呢羽而已。唯知供应丰盛,养尊处优而已。如孩提之情性,作稚子之行为”。参赞大臣隆文则“自居文员,不谙武备”,置身度外,不问军情。作为武将出身的参赞大臣杨芳起初对广州防务做了一些布置,但不久便丧失斗志,耽于“耳目之欢娱,觅狡童之侍奉”,致使“军心散漫”“军士解体”。同样,清廷调派到浙江的军队和扬威将军奕经也是一路耽延,“淫娼酗酒,索财贪贿”,“索供乏,征歌舞,纵樗蒲,招揽威福,其门如市”。道光皇帝任命赴浙剿夷的统帅只有参赞特依顺有过赴台湾镇压农民起义经历外,扬威将军奕经和参赞文蔚从未有过军旅经历,根本不懂军事。他们赴浙后,居然荒唐地以他们梦到英军“悉弃陆登舟,联帆出海,宁波三城已绝夷迹”,就以为“佳兆昭著,连城恢复,在指顾间”,于是便不顾时势,决定向英军发起全面反攻,结果被英军打得一败涂地。在鸦片战争中,尽管涌现出像林则徐、关天培、陈化成这样英勇的官员和将领,但清朝官场的整体情况是“文官爱钱而惜死,武官惜死而又爱钱”。
对于清军的腐败、素质的低下,在鸦片战争爆发之前在华的英国人就有观察和评论,指出虽然满人的祖先有过尚武精神,但在乾隆皇帝之后就“腐化变质”了,“满洲人不但已遗忘了他们的军事训练,甚至连他们自己的语言也弃而不用了”;清朝的绿营也同样“全不中用,连一般的暴动也不能平定”,“依靠贿赂、招抚才得平息”,这些绿营“兵士世世代代驻在同一城镇,除非被遣出征,平日就宁愿坐领粮饷的同时做一点和平的副业,或耽溺于那种在中国被认为天赐之福的安逸生活,而不愿去经受战场上的危险”。并据此反复鼓动英国政府对华发动战争,谓清政府现在已是“一个可悲的民族,令人难以想象的腐化堕落”,英国动用武力并不需要付出巨大牺牲,“有三、四艘巡洋舰和双桅船以及少数可靠的英国军队(不是印度兵),将以难以想象的短暂时间内解决这件事件”;或曰“如果我们要和中国订立一个条约,这个条约必须是在刺刀尖下,依照我们的命令写下来,并要在大炮的瞄准下,才发生效力的”;“我们不须大动海军,也不须多费钱财;需要的不过几只中等的和小型的军舰”。而需要特别指出的是,这也是当时英国政府做出发动战争决定的一个重要依据。1839年11月4日英国外交大臣巴麦尊在向海军部解释这次军事行动时便表示:“陛下政府有理由相信中国政府的海军数量很小,其性能与装备极端无用;因此,上面所说的行动,可以用很小的兵力就执行成功,这兵力远较就其活动的漫长海岸线及其任务规模初看起来所需要者少得多。”而战争的进程和结果,最后亦坐实了英国侵略者所说的情况。
在鸦片战争中,尽管清军调派到驻守广东、福建、浙江、江苏四省的兵力约22余万名,加上鸦片战争期间增援的外省兵,总计258 000名,是英军的12余倍,在人数上明显占优,但交战区的清朝官员和将领为逃避责任,却只求自保,互不配合,并没有发挥清军的兵力优势,不以战局为重。如英军北侵进攻浙江后,香港空虚,奕山和两广总督祁(图片)“目睹夷但扰闽浙,绝不与粤为难”,为避免广东“衅端再启,触夷怒,势不可收”,并不遵命相机进剿,“以牵制闽、浙贼势,皆以造船未就为词,惟以填塞河道为事”;闽浙总督颜伯焘同样为避免英军转而攻闽,“为浙受祸”,不乘机克复英军占领鼓浪屿,命令军队“宜饬坚守,勿令挑衅;脱有贪功名心,则夷必撤浙省之兵船来与我控,是我为浙受祸也”,因此而遭革职。英军发起扬子江战役,定海守军空虚,奕经也以兵力不敷为辞,拒绝出兵进攻、牵制。清军的一盘散沙局面,就这样为英军克服兵力不足、集中兵力、各个击破,创造了天机。
同样,在各个战役中清军也彼此不配合,不能一致抗敌。第一次定海之战,总兵张朝发与知县姚怀祥一主以师船迎战一主守城,互不配合,张朝发在师船迎战失败后竟以守城非其责乘船内逃镇海。英军进攻虎门各炮台,关天培深感前线兵力单薄,派李廷钰回广州“哭求增兵”,而琦善“惟恐其妨和议,固拒不许”,坐视沙角、大角两炮台被英军攻占。镇江之战,副都统海龄率领的驻守镇江的八旗兵拒绝与前来增援的由汉人组成的绿营军合作,拒绝他们入城,提供食物,以致这些增援清军“欲开枪炮攻城,取都统生啖之”;而这些增援的绿营军在英军发起进攻后,也没有配合城内的旗兵,率先溃逃,以致“夷人大笑”。更有甚者,还互相残杀、加害。如1841年5月英军进攻广州,城内却发生湖南兵与广东南海县义勇互斗、“杀人放火,较场中尸骸如积”的事件。1842年5月18日乍浦之战,“我陕、甘兵以扛炮伤敌甚众,敌转攻南门。驻防旗兵,平日凌辱汉人,至是又动斥为汉奸,由是福建水勇积愤,纵火内应,贼遂逾南城入,尽焚满营,都统长喜、署乍浦同知韦逢甲死之”。因此,尽管清廷在主场作战投入高达3 000万两的战费,远高于客场作战的英军1 263万两的战费,亦终归无济于事。如鸦片战争期间,清军为缩少与西方在武器方面的差距,也仿制和采购了不少西洋火炮,但并没有发挥应有的作用,“而适以资敌也”。
再者,清军的颟顸和无能也体现在布防和战术等方面的落后和呆板上。清军的布防和战术就没有做到扬长避短,采取以逸待劳、诱敌深入策略,只知在沿海沿江城镇要塞一线布防,修筑炮台,调动军队,株守一地,与英军进行前沿阵地战,将军队置于英军坚船利炮的优势火力打击之下,同时也没有纵深布防,将炮兵与步兵进行有机配合,只顾正面,不顾侧后。英军沿海沿江登陆作战,正是利用清军布防上的这一弱点,以舰炮正面轰击、侧翼包抄方式,击溃和破除清军的布防,虎门各炮台的失守,广州北郊阵地的丢失,以及定海和吴淞的失陷,莫不如此。耆英在访查吴淞等处失守原因的奏折中就指出了清军防线的这一弱点:“中坚一破,风鹤皆惊,又无后路,以致官兵遂成瓦解。”魏源在《海国图志》中也对清军在鸦片战争中的这一布防做了严厉批评,指出:“其破城者,皆小舟渡贼登岸,攻我背后,我兵望风辄溃,及夷至,则城中已无一人,何尝与炮事哉?”
并且,这种落后呆板的防御战术还导致清军疲于奔命,防不胜防,丧失主场作战的人数优势,出现有学者研究所说的在一些战场上清军人数不及英军的情况。尽管根据前方将领的报告,道光皇帝亦曾意识到存在的问题,在战争之初下达的一道上谕中指示说:“英夷沿海滋扰,所恃船身坚大,枪炮便利,我兵水战骤难制胜,不若诱之登陆,可期聚而歼旃。”但这一正确的策略和意见并没有在战争中得到执行和落实,清军的实际布防和战术始终没有任何变化,不断重复同样的错误和失败。
清军在鸦片战争中表现出来的各种弊端和落后及缺乏战斗力,清楚表明中国面对西方列强的侵略,不但面临武器现代化的需要,更加面临由古代传统军制向近代军制转型的急迫使命。诚如魏源在《海国图志》中总结所说:“以无律无谋之兵,即尽得夷炮夷艘,遂可大洋角逐乎?不知自反,而惟归咎于船炮之不若,是疾误庸医,不咎方而咎药材之无力也。”
三
战争是外交的延续和最高形式,需要最高统治者根据内外形势,做出正确决策。而清朝统治者由于思想观念和认识的落后,夜郎自大,不谙世界大势,既不知己亦不知彼,在外交和军事上都不能做出正确决策,这也是其战败的一个深层原因。
战前,清朝统治者从道光皇帝到各省督抚都以天朝上国自居,对英国等西方资本主义国家缺乏基本了解和认识,将他们都看作“化外蛮夷”,对中西贸易体制、法律制度和外交体制冲突可能引发战争毫无认识和准备,或根本没有将这些被目为“化外蛮夷”的西方列强放在眼里,将对外通商看做对西方人的一种恩惠。1839年12月13日,道光皇帝下谕彻底断绝中英贸易就是抱着这种心态,谓:“区区税银,何足计论,我朝抚绥外夷,恩泽极厚,该夷等不知感戴,反肆鸱张,是彼曲我直,中外咸知,自外生成,尚何足惜!著林则徐等酌量情形,即将英吉利国贸易停止,所有该国船只尽行驱逐出口,不必取其甘结。”1840年3月29日,林则徐奏报:“传闻该国有大号兵船,将次到粤等情。臣等思此等传闻,无论虚实,总当于粤洋各要口加意严防。”道光皇帝则不以为然,轻蔑地朱批道:“无论虚实,总当不事张皇,严密防范,以逸待劳、主客之势自判,彼何能为也。”在7月接到浙江巡抚乌尔恭额关于英军侵犯定海的奏报时,道光皇帝虽表“痛恨”,但仍抱着轻敌思想,说“此等丑类,不过小试其技,阻挠禁令,仍欲借势售私,他何能为。该督抚提督果能认真防堵,水陆交严,何至纵令登岸有三四千人之多”。甚至在1842年5月,中英开战快结束时,仍对英国的情况一无所知,发问“该国制造鸦片烟卖与中国,其意但欲图财,抑或另有诡谋?”“究竟该国地方周围几许?所属国共有若干,其最为强大不受该国统属者共有若干?又英吉利至回疆各部有无旱路可通,平素有无往来?俄罗斯是否接壤,有无贸易相通?此次遣来各伪官,除璞鼎查系该国王所授,此外各伪职是否授自国王,抑即由带兵之人派调?”
同样,清朝的地方督抚官员也都是抱着传统天朝上国思想看待和处理中西关系。如后来被称为主和派官员的直隶总督琦善在1838年的《议奏查禁鸦片章程》折中就是这样看待中西关系的,谓:“推原当日外夷通商之意,天朝大体,不过略示羁縻,初非利其货物。乃从前司事诸臣,不能杜渐防微,以致玩好之物充斥,天下洋货日见其多。”即使被称为中国近代第一个睁眼看世界的林则徐由于受时代和阶级的局限,对英国和西方也存在许多错误认识和判断。在中英贸易方面,他错误地认为茶叶和大黄都是“外国所不可一日无也,中国若靳其利而不恤其害,则夷人何以为生”。他对英军则有“除枪炮之外,击刺步伐,俱非所娴,而其腿足裹缠,结束紧密,屈伸皆所不便,若至岸上,更无能为,是其强非不可制也”的错误认识。他还错误地认为英国政府不支持在中国的鸦片商人和鸦片贸易,在虎门销烟之后以天朝的口吻致书英国女皇,谓:“我天朝君临万国,尽有不测神威,然不忍不教而诛,故特明宣定例。该国夷商欲图长久贸易,必当懔遵宪典,将鸦片永断来源,切勿以身试法。”对中英冲突可能引发战争毫无认识,他在1839年9月的上奏中向道光皇帝保证英国“万不敢以侵凌他国之术,窥伺中华”,劝说后者不用担心中英之间因为鸦片问题、司法管辖权问题和外交体制问题引发“边衅”,表示:所谓“边衅”,只是英国驻华商务总监义律“藉此暗为恫喝,实则毫无影响”。甚至在1840年6月中旬,英国舰船陆续抵达广东海面的时候,林则徐仍向道光帝奏称:“英夷近日来船所配兵械较多,实仍载运鸦片”,“借以扬言恫喝,冀可准其贸易之求”。现在各船“见臣等拒之益坚,不为所动”“亦只在外洋往来游奕,此东彼西,总无定处……此外别无动静,诚如圣谕,(该夷)实无能为”。
对于战前清朝政府不谙世界大势和敌我形势,对英军和本国国力、军力及动向缺乏一个基本判断,不顾强弱和时机,采取断绝通商和出具保证书方式,强行推行禁烟政策和逼迫英国交出人犯,拒绝就通商、禁烟、外交体制等问题与英国举行谈判,在没有充分战备的情况下与英国开战,魏源事后就批评清政府犯了策略错误,认为应该在整顿内治,引进西方先进武器,进行充分的强军备战之后,做到“内审诸己,又必外审诸时”,方可与英国开战,达到目的,指出:“《春秋》之义,治内详,安外略。外洋流毒,历载养痈。林公处横流溃决之余,奋然欲除中国之积患,而卒激沿海之大患。其耳食者争咎于勒敌缴烟;其深悉详情者,则知其不由缴烟而由于闭市。其闭市之故,一由不肯具结,二由不缴洋犯。然货船入官之结,悬赏购犯之示,请待国王谕至之禀,亦足以明其无悖心。且国家律例,蒙古化外人犯法,准其罚牛以赎,而必以化内之法绳之,其求之也过详矣。”“诚能暂宽市舶之操切,以整水师之武备,尽除海关之侵索,以羁远人之威怀,奏仿钦天监用西洋历官之例,行取弥利坚、佛兰西、葡萄亚三国各遣头目一二人,赴粤司造船局,而择内地巧匠精兵以传习之,如习天文之例,其有洋船、洋炮、火箭、火药,愿售者听,不惟以货易货,而且以货易船,易火器,准以艘械、火药抵茶叶、湖丝之税,则不过取诸商捐数百万,而不旋踵间,西洋之长技,尽成中国之长技。兼以其暇,增修粤省之外城内河之炮台,裁并水师之员缺,而汰除其冗滥,分配各舰,练习驾驶攻战;再奏请遍阅沿海各省之水师,由粤海而厦门,而宁波,而上海,城池炮台不得地势者移建之,水师缺冗者裁并之,一如粤省之例;而后合新修之火轮、战舰,与新练水犀之士,集于天津,奏请大阅,以创中国千年水师未有之盛:虽有狡敌其敢逞?虽有鸦片其敢至?虽有谗慝之口其敢施?夫是之谓以治内为治外,奚必亟亟操切外洋从事哉?”魏源的这番总结和反思,是很值得令人警醒的。
而在中英正式开战之后,道光皇帝和清政府依然对英军的侵略意图一无所知,依然盲目自信,道光皇帝下达的剿抚命令都不是基于敌我形势的正确评估和判断,并不了解战场真实情况,忽剿忽抚,进退失据。如道光皇帝收到义律在天津提交的《巴麦尊子爵致中国皇帝钦命大臣函》,英国政府明明向清政府提出赔款、开埠、割地要求,道光皇帝却一厢情愿地以为英国只是来“伸冤”,加以款待,幻想通过惩处林则徐换回和平,达到英国退兵的目的,答应派遣钦差大臣前往广东秉公查办,“代伸冤屈”。对于英军因兵力不足和季节等原因同意南返广东,道光皇帝自我庆幸、自我陶醉,自谓“好在彼志图贸易,又称诉冤,是我办理得手之机,岂非片言片纸远胜十万之师耶?”而当英军退回广州、重新提出赔款、开埠、割地等要求并占领香港时,道光皇帝又为之震怒,派兵进剿。在清军广州“剿夷”完全失败后,道光皇帝却根据奕山谎报的取胜军情,谕令沿海各省督抚“凯撤”兵勇,谓“现在广东夷船经奕山等叠次焚击,业已退出虎门,粤省所调各路官兵,现已陆续撤回归伍。所有各省调防官兵,著该将军督抚等体察情形,如可酌量裁撤,迅速奏闻请旨。将此由四百里各谕令知之”。但就在道光皇帝下令“凯撤”沿海军队的时候,英国却下达了扩大侵略战争的决定,不久再陷厦门、定海。道光皇帝作为清军最高统帅,身居庙堂,不但对世界大势和敌情茫然无知,同样也不了解前线清军和英军的真实情况。光绪年间,一位日本人在所写的著作中就批评鸦片战争中国的失败是由清政府“顽僻倨傲”所致,哀叹道:“中国文化,二千余年前,已灿然可观。若能骎骎进步,虽以今日欧美之强,不能望其肩背。惜哉,进步中绝,徒守旧制,顽僻倨傲,无一明大势者,目外人为蛮夷戎狄,绝不知仿人智识,共求强盛,以致病入膏肓,坐以待毙,岂不哀哉!”
总之,在整个鸦片战争时期,由于清朝统治阶级的自大和思想认识的落后,他们都没有做到“内审诸己,又必外审诸时”,结果,和、战都进退失据,诚如魏源所批评的那样:“其战也,不战于可战之日,而偏战于不可战之日。其款也,不款于可款之时,而专款于必不可款之时。其守也,又不守于可守之地,而皆守于不可守不必守之地。”
纵上所述,清朝在鸦片战争中的战败,主要原因不在物质方面,而在于更为深层的“人和”方面,昭示中国需要一场全面的政治、军事、经济、社会和思想观念的大变革,方能应对数千年未有之大变局的到来。而鸦片战争另一个令人痛心的失败是,由于历史的惰性,清朝政府在经历这场失败之后,雨过忘雷,除少数像魏源、徐继畬这样开始睁眼看世界的思想家外,整个统治阶级依然沉浸在天朝上国的梦幻里,对外部世界和时代的发展一无所知,错过20年自强改革良机。鸦片战争失败的教训,在时过180年之后,仍然值得后人深刻记取!
原文载于《清华大学学报》(哲学社会科学版)2024年第2期
牛世山:百年考古书写辉煌的商文明
商族是上古古老的部族之一,有关商人始祖契的降临叙事明显具有神话色彩。中国古老的诗歌总集《诗经》的《商颂》诸篇提到商人祖先契的降生,如《玄鸟》篇:“天命玄鸟,降而生商,宅殷土芒芒。”《长发》篇:“有娀方将,帝立子生商。”即上天让玄鸟降临而生了商契,由此以下商族走上发达之路并奠基了广袤的居地。《商颂》诸篇为商人后裔、春秋时期宋国国君等高等级贵族祭祀祖先的颂词,其中有关商人祖先的追述不能忽视。这个传说在西汉司马迁撰写的正史《史记·殷本纪》中又具体一些:“殷契,母曰简狄,有娀氏之女,为帝喾次妃。三人行浴,见玄鸟堕其卵,简狄取吞之,因孕生契。”说商契的母亲简狄在郊外,看见天上的玄鸟掉下了卵,简狄取而吞之,就有了身孕而生下商契。类似的记载还见于战国吕不韦的《吕氏春秋·音初篇》、西汉刘向《列女传》等。这成为近代以来历史学界流行的所谓玄鸟为商祖先或图腾说的根据。
有关商人起源和商王朝的系统文献文本见于《史记·殷本纪》,司马迁说“余以颂次契之事,自成汤以来,采于书诗。”但殷本纪的叙事明显超出《诗》《尚书》的有关记载。此外,西晋太康年间出土的《古本竹书纪年》,其中《殷纪》部分也记载有商王所居以及重要事件;战国时的《楚辞·天问》中,屈原所提一百七十多问中也有围绕商人起源、商王活动之问。
人类的历史记忆经历了从口头传说到文字记录,再到专门史官出现与书写的改变。近代以来,包括商代史在内的上古史的构建经历了基于传世文献的文本撰写到以考古材料为主科学构建的转变。此后,商代史的构建走上了以田野考古为主要方式的道路。
1928年,殷墟考古工作开启,这是中国国家考古机构的第一个发掘项目,此后工作一直持续,迄今已近百年;20世纪50年代又发现郑州商城,明确了两者分别属于商王国晚期和早期的文化。近百年来,有关商王朝的考古资料日益丰富,研究不断深入,这个《殷本纪》仅用3500多字描述的王朝面貌逐渐清晰。现在,传世文献、出土文字和考古资料相互印证,从而构建起真正的商代史,商文明规模宏大、立体和作为青铜时代鼎盛时期辉煌阶段的风貌随之逐渐展现出来。今天,对于商代年代、商族起源、商王朝的都城以及与四方的人群互动、商文明的内涵、商王朝的政治地理架构等等有了全新的认识。
文献所见,商王朝是中国历史上第二个王朝,王位共传十七代、三十一王,历时500多年。基于考古研究的夏商周断代工程确认,商王朝的年代区间在公元前1600—公元前1046年。考古学的商文化分为以郑州二里冈为代表的早商文化和以安阳殷墟为代表的晚商文化两个阶段,各自还可区分更细的时段。
商王朝的聚落等级有国、都、邑、聚,其中最高级为王都,即国一级,成书于战国时期的《考工记·匠人营国》之国即建设王都。传世文献记载,商王朝的王都经多次迁移,先后有亳、敖(嚣)、相、邢、奄、殷(或称商邑或大邑商)等。考古发现和研究确认都城以郑州商城、安阳殷墟为代表,分属于商代早、晚期。郑州商城为商代早期亳都,由内、外城两部分组成。内城呈长方形,周长约6960米,其中东、南两墙各长约1700米,西墙长约1870米,北墙长约1690米,面积290万平方米;加上外郭城区,总面积达13平方千米。这个规模,与经过数百年后的东周时期人口明显增加的形势下中小国都城的规模接近。宫殿区位于内城的东北部,范围东西长约750米,南北宽约500米。发现数十处夯土基址,小者100余平方米,大者2000多平方米。手工业作坊区位于城市的外郭区,有南关外与紫荆山北铸铜作坊区、铭功路制陶作坊区、紫荆山北制骨作坊区等。在内城周边以及外郭城区有墓葬区。殷墟即传世文献中的商邑、殷墟甲骨文中的大邑商,面积达30平方千米,城市人口有10多万人,有一百多个家族居住生活于此,举族而居,举族而葬。中心是商王宫(小屯宫殿区),其中乙组建筑基址最重要,如以乙二十为主殿的组四合院为朝寝,宽超过90米,深超过45米。殷墟西北部的西北冈是王陵区,埋葬有商王武丁到帝乙的历代商王,还有大量祭祀坑,数量超过3000座。手工业作坊有铸铜、制陶、制骨、玉石、漆木作等,规模有大有小,大的多类手工业作坊区铸铜、制陶、制骨等集中连片分布,所见有四个片区;小的功能单一散处于某个族邑之中或附近。殷墟大邑商的道路有宽、中、窄三种,其中已发现干道(最宽的)有三横两纵,宽度超过10米,构成商都的骨干道路网络,其中两条南北向的干道直通王宫(小屯宫殿区)方向;在洹河以南还有西北——东南向的干渠,长度超过3.1千米,在东端还有支渠,为向都城南部,尤其是东南部的手工业区供水之用。
到商代晚期,商文明达到中国青铜时代的顶峰。殷墟商文物种类多,有甲骨、青铜和铅器、陶质类器、玉石器、骨角牙蚌器以及人和动物骨骼等。最能彰显商文明基本形态及其特点的是陶器和青铜容器。据研究,商代晚期(含部分周初)带铭文青铜器超过7000件,当时青铜器的总数可能为有铭文青铜器的十倍以上。青铜器的使用功能多样,有礼器、兵器、工具、车马器以及其他杂器等。如传出土了安阳商王陵区的后母戊鼎重832.84千克,为存世最重的青铜器;安阳殷墟西部铸铜作坊区出土铸造铜盘的模型,口径超过1.56米,为已知口径最大者。殷墟商文化青铜器中酒礼器最多,又以高等级的贵族墓葬出土最多,这是古人“事死如事生”观念的反映。如殷墟妇好墓随葬器物有1928件,在214件青铜容器中,酒器有觚、爵、角、斝、觯、尊等类,共163件,占青铜容器总数的76%。殷墟所见陶容器达26类之多,广泛用于生活、生产领域;据此溯源可见,殷墟大邑商的居民以本地人群为主,但还有来自商考古学文化区内部的河南郑州与许昌地区、登封一带、山东西南部一带的人群,有来自商王国周边的人群,具体有陕西关中地区的先周文化、晋陕高原青铜文化(黄河西为李家崖文化)、内蒙古清水河县黄河拐弯部的西岔文化、京津唐地区的大坨头文化、安徽江淮地区的青铜文化、湖北东部蕲春市毛家咀组遗存、山东半岛的珍珠门文化等地区者;此外,还有一些暂不能确知来源但文化风格非典型殷墟文化的特殊器物。由此可见大邑商社会的构成以及形成、变化过程,还呈现出大邑商与商王朝其他地区人群的交流与互动关系,其中与郑州地区的联系始终较多,其次是山东西南部,与其他地区的联系相对比较少。
考古研究确认,商王朝的疆域辽阔,东到山东潍坊,北近北京,西到陕西西安,南抵汉水,东西、南北跨度超过1500千米。统治模式采用内外服制,其中商代晚期以安阳为中心,北到邢台,南抵郑州,西近太行山脉,东接古黄河,分布着以殷墟都城为代表的典型商文化类型,分布区与传世文献如《尚书・酒诰》记载的商王朝的内服地区相当。围绕在殷墟类型以外有多个商文化的非典型类型,结合传世文献、殷墟甲骨卜辞研究可知,它们基本是商王朝分封的诸侯国统辖区,亦即是商王朝间接管理的外服地区。此外商文化还包括像陕西关中的先周文化、湖北蕲春的毛家咀组遗存等与商王朝都城有密切联系的外圈其他一些考古学文化的分布区。所以,商文化包括以都城文化为代表的主流商文化和外围广大地区的非主流文化两种形态,它们分别对应商王朝疆域的三层地理空间:中心区域(对应考古学上的典型商文化分布区),次级区域(对应考古学上的非典型商分布区),外围区(考古学上的商文化外围其他某些考古学文化)。
龚为纲:再论彩礼价格的区域差异:社会变迁与文化堕距的视角
文章选编时略有删节。
2024年春节期间,微博、新浪新闻联合武汉大学中国乡村治理研究中心、中国社会科学院新闻与传播研究所传播调查研究中心,开展了家乡问卷调查,共收集城乡11万份的有效调查问卷。这次调查对城乡的彩礼价格专门进行了调查,同时还对彩礼习俗进行了专门调查。
图1 各地级市彩礼价格指数 这次调查从抽样调查的角度,所呈现的彩礼价格的区域差异(图1),和我们基于裁判文书所得出的彩礼价格的区域差异的空间分布格局,大体类似:即江西、福建以及浙江等泛长三角地区彩礼价格处于全国彩礼价格最高的区域,其次是华北的黄淮海地区,以及山西等地区;而长江流域以及汉文化的边陲地带比如说云贵川、新疆、西藏等地区彩礼价格都很低。另外,广东和广西两个重要的南方地区,彩礼价格也很偏低。
通过这次调查我们发现,不同区域因为彩礼习俗的差异,而引发彩礼价格的区域差异。彩礼习俗的区域差异背后,实际上是彩礼规范与彩礼变异的区域差异,在彩礼仍然坚持其原始的礼物含义的广东和广西地区,彩礼主要给父母,彩礼还保持了其原初的礼物含义,彩礼主要是男方给女方父母的“奶浆钱”,彩礼的含义主要是回馈女方父母的养育之恩,人们还遵守彩礼相关的社会规范,彩礼并没有在社会变迁的过程中走向“失范”和变异,因此彩礼价格上涨的幅度相对较低。
而在同样是作为南方宗族性地区的江西和福建,以及以厚重型的代际交换为特色的黄淮海地区,彩礼的含义早已出现了退化,彩礼主要是给女方和子代小家庭,彩礼的含义已经从原来回馈女方父母的养育之恩,蜕变为女方和子代小家庭对父母遗产的一种提前转移支付,也就是说彩礼从原来的礼物的功能变成了父代财产的转移支付功能,正是因为彩礼的含义出现了这种蜕变,人们不再遵守原来约定俗称的彩礼规范,彩礼在出生性别比失衡的背景下,就有节节上涨的风险和动力。
问题是,这些地区的父母为什么愿意去支付高额的彩礼?子代索要高额的彩礼,但是如果父代不愿意支付或者拒绝支付,那么子代也就失去了索要高额彩礼的空间,也就不存在高额彩礼的问题。问题恰恰就在出在,江西、福建和黄淮海地区的代际关系是以家庭绵续、香火继承和传宗接代为价值基础的传统型代际关系,这些地区的父母为了家庭的延续,有很强的价值动力来为子代承担婚姻成本,并以子代成家立业作为自己的人生任务。
这样,就出现了两种社会规范在社会变迁的过程中因为变迁速度不一样而产生的失衡和冲突,即在江西、福建和黄淮海地区等这些地区,彩礼规范已经出现了松动和变异,但是在代际关系上的规范却还是在坚守传统的传宗接代理念,并使得父代有支付高额彩礼的意愿。彩礼的规范和传宗接代的规范在社会变迁过程中这种速度不一致的变动关系,所引发的社会问题,就是社会学领域的经典命题,即社会变迁过程中的“文化堕距”问题。
在一个快速变迁的社会,由于不同方面的社会规范的变迁速度不一样,就会产生“文化堕距”的问题,文化堕距使得不同维度的社会规范对人们的社会行动的指引方向不一样,甚至相互冲突,这样就会产生一系列的社会问题。在中国的婚姻家庭领域,在一些区域,彩礼价格的快速上涨和失控,就是文化堕距的结果使然。
那么,在彩礼价格失控的过程中,究竟是哪些社会规范在变迁过程中的冲突引发彩礼价格上涨呢?
图2 彩礼给女方父母的占比(%) 首先是彩礼有关的规范。彩礼的原初含义是男方对女方父母的养女之恩的感激,彩礼主要是一种礼物的象征,在广东和广西等地区,彩礼的含义是“奶浆钱”,正是因为彩礼的象征意义浓厚,彩礼一般是给女方父母,其价格水平也不会太高,一般有约定俗成的水平。在当前两广地区,彩礼依然坚守了这样一种含义,人们也还在遵守着这样一些关于彩礼的规范。
但是在社会变迁的过程中,全国大部分地区,彩礼的规范都出现异化,彩礼的含义已经背离了其初衷,彩礼已经不再是给女方父母的“奶浆钱”和礼物,而是变成了对父代财产的一种提前转移支付。正是因为彩礼已经失去了其原初的含义,原有的彩礼规范已经失效,在婚姻市场已经失衡的条件下,彩礼成为女方以及小家向父代索要财产的工具和手段。
通过调查数据显示(图2),彩礼规范在不同区域被遵守的情况不一样。两广地区,以及中西部部分地区,还在坚持彩礼给女方父母,维系彩礼的原初礼物含义,而在全国大部分地区,彩礼已经主要给女方和子代小家庭,彩礼已经背离了其原初的含义。也就是说,从彩礼规范的角度来看,全国不同区域彩礼规范的变迁速率是不一样的。
如果彩礼依然还是维系礼物的含义,人们还在遵守彩礼的规范,彩礼就不会上涨,这是社会规范的约束使然;而一旦彩礼规范出现了松动,人们不再遵守原有的彩礼规范,在婚姻市场失衡的背景下,女方要价空间越来越高,彩礼就存在节节上涨的风险。
其次是有关代际关系的规范。在中国的反馈型代际关系中,传统代际关系的价值基础是家庭的绵续和传宗接代。传宗接代构成代际关系的价值基础。正是在这个意义上,传宗接代构成厚重型和反馈型代际关系的价值基础,或者说不孝有三无后为大,是代际关系中的重要社会规范。在传宗接代关系的驱动下,父代为子代成家立业进行不求回报的付出就是必须的,这构成父母基本的人生任务。而只有儿子结婚,这个家庭的绵续才有可能性。因此在子代成家的过程中,父代进行投入和付出就有其价值基础。这是在传统的代际关系中,包括彩礼在内的子代的婚姻成本主要由父代承担的主要原因。
但是传宗接代作为一种社会规范,在中国不同区域被坚守的程度是不一样的。在南方宗族地区,以及华北平原地区,传宗接代的理念依然强烈,代际关系仍然是在传宗接代观念支配下的厚重型代际交换,而在长江流域和东北等地区,代际关系已经完成转型。
传宗接代观念的强度不一样,作为一种价值动力所维系的代际关系就不一样。这也就意味着父代为子代进行付出的动力就不一样。传宗接代理念的区域差异,从各个地区的出生性别比失衡的程度中即可以看出(图3)。
图3 2010年全国各地区出生性别比的空间分布 这样,通过上面的分析,彩礼规范和传宗接代理念在不同区域的变迁速度不一样,两种规范在不同区域的变动速度不一样,其匹配情况也就不同,这样就引发一些区域的“文化堕距”问题,而在一些区域,两种社会规范之间保持了适配。
比如说,在两广地区,两种社会规范还保持了适配的关系,尽管传宗接代理念还很强烈,代际关系依然是厚重型的代际交换,但是因为彩礼规范还保持了其原初的含义,因此就不会出现彩礼价格上涨,因为子女不会将彩礼作为一种向父代索取财产的手段。彩礼主要给女方父母,子代缺乏这种套利的空间。
同样,在长江流域和东北地区,两种规范也保持了适配的关系,即彩礼规范已经变异,彩礼的含义主要是给女方和子代家庭,子代存在通过彩礼转移父代财富的动力,但是因为父代的传宗接代理念已经比较淡薄,父代并不愿意为子代成婚支付过高的彩礼,通过彩礼进行代际剥削缺乏代际关系基础。子代通过婚姻向父代索要高额彩礼的空间不存在。由于缺乏父代家庭的这种强烈的动力,彩礼上涨的空间也很有限。
这两种社会规范在这种类型的地区,也保持了适配的关系,两种规范都出现了剧烈的变迁,或者说这两种社会规范的变迁过程已经完成,二者保持了一种适配的关系。这个时候也不存在文化堕距的问题。
比较麻烦的是在那些彩礼规范已经变异,但是代际伦理依然坚持传宗接代理念的地区,比如说江西、福建和黄淮海地区。这些地区的彩礼规范已经出现松动,彩礼存在节节上涨的动力,但是传宗接代理念依然强烈,父代仍然有很强的动力来为子代婚姻提供支持,彩礼正是在这样的背景下大幅度上涨,因为女方通过彩礼向男方父母索要高额彩礼存在巨大的空间。
正是因为在这些地区,两种社会规范的不同的变迁的速率使然,而使得这些地区的父母成为彩礼价格上涨的牺牲品。而他们之所以成为牺牲品,又与他们所坚持的“传宗接代”价值理念有关系。
是谁把普华永道带入恒大这个火坑的? ——一封公开信
普华永道审计恒大的问题,大家看了不少热闹。大家都谴责普华永道,但没有一个人问,在普华永道,对恒大审计失败的责任人是谁?
普华永道审计恒大失败的最终责任人是赵柏基:
赵柏基现在担任普华永道亚太区和中国区主席、首席合伙人和首席执行官。分 时间段而言:2005-2013,赵柏基担任普华永道审计业务线一把手(恒大是赵 柏基接的客户);2014至今,赵柏基担任普华永道一把手。
恒大财务造假行为如此严重,普华永道10多年审计视而不见,普华永道被视同参与造假。普华永道如此有历史、有经验的事务所,为什么会走到今天的地步?赵柏基是如何把普华永道带入恒大这个火坑的?总结我们近距离的观察和经验,提出原由如下,值得每家会计师事务所和监管部门的反思。
一、追求合伙人高收入。赵柏基的一句口号是:我领导的普华永道的 EPEP—— 权益合伙人收入,在历史上最高,在四大中最高。赵柏基每年从普华永道获取的薪酬收入是5000万港币(注意,他还通过税务安排,实际个人所得税低到 7.5%以下)。在追求合伙人高收入的“奋斗拼搏“中,恒大就是个很好的客户 了。在2014年,普华永道上一代领导合伙人提出质询,要辞退恒大,但被赵柏基给拦回去了,他说:在大陆卖房子像卖蛋糕一样快,普华永道要用好的服 务跟上客户的步伐。在普华永道,有个著名的赵柏基核心圈 (inner
circle), 内部叫“两亿俱乐部”,就是不到10个人,每年从普华永道分走两个亿。会计师事务所的管理合伙人和他的小帮派一旦以分钱为最高目标,走到恒大的火坑就不奇怪了。
二、 审计质量管理在普华永道成为政治斗争中打压对手的手段。普华永道虽是 一个品牌,但在中国是由普华、永道和安达信三家合并组成。众所周知,在普华永道,有300块钱,安达信的人分130块,老普华的人分90块,老永道的人分80块。赵柏基为安达信出身的合伙人。他将安达信的亲信安排为内部质 量管理主管合伙人。几乎所有普华永道的审计质量管理岗位均由安达信的合伙人控制,而且,还留用安达信的退休合伙人,有位安达信出身的黄姓女合伙人,快70岁了,还是普华永道审计质量顾问,天天在太子大厦上班。然后,赵柏基以审计项目质量为由,打压反对他的人。对房地产审计项目很有经验的 一个合伙人是郭志平(前房地产行业审计主管合伙人),原来是老普华系的,他反对安达信合伙人的激进做法,结果招到赵柏基的打压,退休前工资减半,后不幸患了癌症。还有一位反对为恒大出审计报告的合伙人,是普华永道南区审计负责合伙人,叫吴伟伦,他被赵柏基、孙宝源、蔡楚清联手拿下,南区审 计负责合伙人由安达信的人接替。
三 、逃避国际网络所的质量检查。普华永道国际网络会定期对其成员所的审计质量进行检查。赵柏基通过聘用已经退休的资深美国普华永道合伙人,给予高 薪,作为中国所和香港所的说客,掩盖普华永道中国所的实际审计质量情况。 这些在国际上担任过国际网络审计质量检查领导岗位的退休人士,拿了普华永 道中国的钱,就整天说普华永道中国的审计质量好。但事实上,美国监管机构(PCAOB) 后来检查阿里巴巴的审计工作底稿时,一位参与其中的普华永道的 国际质量监督合伙人说,没有想到普华永道中国的审计质量水平腐烂到如此糟糕。普华永道是审计行业的领头羊,但有一个不为外界认识的领头羊作用是:赵柏基等普华永道合伙人,以审计工作底稿在中国大陆、是国家机密这样的理由,拒绝香港和美国监管机构的检查。事实上,他们是为了保全自己分钱的基础, 一方面能挣大钱,但另一方面审计工作质量又不需要被检查。真是这个原 因,才导致了中美资本市场的不信任。
四 、普华永道亚太区管理基本瘫痪。普华永道以中国(包括香港)、澳大利亚、东南亚(包括新加坡)三大市场为主形成亚太地区管理层,过去近10年,赵柏基担任普华永道亚太区主席。但是,在赵柏基所提倡的EPEP (权益合 伙人收入)最高的管理理念下,亚太地区管理不到位,除普华永道中国外,另一场灾难是,普华永道澳大利亚发生了严重的违法行为,因为普华永道多名合 伙人泄露澳大利亚政府机密,澳大利亚政府已经全面解除了与普华永道澳大利 亚所的合作(终止所有合同),并开始对普华永道执行调查。后来,普华永道 国际网络介入对普华永道澳大利亚的调查,停止了赵柏基的亚太区主席一职,普华永道澳大利亚开除了37名合伙人和近500名员工,历史上没有过的举措。赵柏基因为承担亚太区管理责任,现在无法进入澳大利亚,否则会面临被 澳大利亚政府扣留调查的风险。目前来看,普华永道亚太区的管理是全面瘫痪的。
五,关于审计独立性和普华永道为恒大和许家印家族办公室提供的其他服务。 目前,人们普遍关心的是普华永道的审计服务,但必须要问的另外一个问题是,普华永道为恒大和许家印家办提供的税务咨询服务、跨境交易服务中,有否协助恒大、协助许家印偷税、漏税、逃税,是否有非法协助他们把钱转到境 外?这个问题,财政部和监管机构必须要检查的。普华永道服务恒大绝对不是 只有审计服务这一项。
值得下一代普华永道合伙人和业内人士思考的血一般的教训是:
第一 、普华永道为客户建议“相互制衡”的公司治理架构。请问,在普华永道,谁能制衡赵柏基?谁能挑战赵柏基?中国会计师事务所的治理问题已经提 到议事日程上了。比如,是否应该披露中国会计师事务所高管的个人收入?有 一次,监管机构对普华永道执行调查,普华永道对监管的回复是,对赵柏基的 监督由一个名叫孙宝源的人负责,这本身就是个笑话。在普华永道,孙宝源是 有名的为了钱就没有背脊骨的人。就是孙宝源协助赵柏基拿下反对恒大审计项目的吴伟伦的。
第二 、因为恒大的财务造假太严重了,对“房子”和“现金/银行存款”这两个会计科目的审计工作都没有做到位,在法律上,普华永道是否应该被视为参 与造假?普华永道有否参与协助许家印家族把资金转到境外?把这些问题查清 楚,对普华永道的负责合伙人追究法律责任,把害群之马抓出来(也还那些矜矜业业的合伙人一个清白)短期看是普华永道的一个痛,但长期看,有利于普华永道、有利于行业的长治久安。
第 三 、普华永道的管理权力本来是香港合伙人掌握的,为了金钱目的,赵柏基 一直在谋求连任第3.5届(已经完成了10年,2.5届)。现在,他不情愿的让位了,把普华永道中国区主席、首席合伙人的职位交给了中国内地的合伙人李丹。这是第一次、也是第一家四大的管理权由内地合伙人掌握。但这个锅,李丹要接吗?两亿俱乐部的其他成员包括杨志伟、崔志义、蔡楚清等,他们是否应该把每年拿走的两个亿退回给公司,作为恒大赔偿基金?这是合伙人合同要认真考虑的。这几个人退休后,还在和李丹讨价还价,要留在公司当顾问,继 续拿钱。到今天为止,李丹连他的首席财务官都没有任命。这样做,他们对得起普华永道的下一代合伙人吗?
第四、合伙企业选一把手最重要的考虑因素还是人品。赵柏基在一定时期掩盖自己的贪婪、嫉妒心,但一旦权力到手,原形毕露,为了能够从合伙企业多为自己拿到钱,把普华永道100多年来的事业带到了恒大这个火坑,是偶然、也 是必然。这个必然就是基于赵柏基的人品而定的。普华永道的教训惨痛,未来几届的首席合伙人的选举(包括推举)考虑领导合伙人的人品是第一位的。
第五,我们不希望普华永道倒下,普华永道大部分的合伙人是优秀的、敬业的专业人士。市场也需要普华永道。但对赵柏基和他的两亿俱乐部的成员如何追责?每年6月底/7月初,普华永道都要在澳门的威尼斯人赌场召开合伙人大 会,这个是明面的; 一个不让人知道的事实是,赵柏基会先召开一个老安达信合伙人会议,不到三桌,商量安达信的人掌权的大计方针,这是暗地里做的。 赵柏基住总统套间,白天开会,晚上赌博。
今年,普华永道中国的合伙人大会会在哪里召开,赵柏基并不光彩的退休庆功会还会召开吗,我们拭目以待。至少威尼斯人赌场,不是我们推荐的场所了。
另外,赵柏基的退休庆功会的预算是多少呢?前面所说的,被赵柏基打压的原来的房地产行业审计的主管合伙人,郭志平,是1992年进入中国帮助筹建老 普华的。30年后,也就是2022年,他退休。他在普华永道的学徒(包括李丹)为他举办了一个退休庆功会,事实上也是人生告别会(郭志平患了癌症),参加这场活动的人比预期多了一些(事实上就是抱团取暖,对赵柏基等 安达信小圈子合伙人表达不满),超了预算3万元人民币。据说,李丹为了向赵柏基表忠心,就是不批这3万元的支出,后来是郭志平自己付的。历史就是这样在教育人的。我们建议,不应为赵柏基召开退休庆功会,因为钱要省下来 赔偿给恒大的投资者和银行。
赵柏基给李丹提出了一个要求,退休后,他要担任普华永道荣誉主席。蔡楚清提出的要求是,他要在香港给普华永道担任顾问。两个人都是要收钱的(更重要的是,要遮盖自己的屁股)。参考原来安达信在公司担任顾问的退休合伙人 价码是,每人每年800元港币。如果是这样的安排,我们给普华永道合伙人们 的建议是:赵和他的两亿俱乐部的成员,应该一个都不能退休,直至普华永道把恒大的官司打完。
最后的话语:
第 一 、普华永道在中国接受财政部的调查,在香港面对恒大清盘人的起诉,这是普华永道必须面对的。但同时,普华永道必须拿出勇气,如同普华永道在澳大利亚一样,聘请独立专家对普华永道在治理、文化和问责制方面做出独立调查,并向社会公众公开调查报告的内容。普华永道是为公众利益而存在的,建立社会诚信是其最重要的责任,如果不能开展独立调查,那是欠这个市场一个交代。这也是普华永道为自己挽回市场信心的唯一做法。
第 二 、赵柏基在担任普华永道一把手10年期间,用的首席财务官是崔志义,
10年不变。而普华永道内部都知道,崔志义是一个根本没有道德标准的人。普华永道在中国是一家年营业额超过200亿港币,供合伙人分配的年利润额超过 50亿港币的公司。这样一家公司的财务就是一个小圈子,两个人操作的,财务账目不公开(注意,对合伙人也是不公开的)。普华永道国际网络的审计部门,必须对赵柏基担任一把手期间的财务进行内部审计,包括由赵柏基和崔志义掌握的开曼群岛的费用账务,向全体合伙人公开内部审计结果。必须对赵柏 基这10年间的举报信进行认真核实、复查,还普华永道合伙人事实的真相。
请普华永道负责职业道德的合伙人Ewan Clarkeson 安排资源将本公开信翻译 成英文,报送普华永道国际和其网络成员所领导。
第三、2024年7月至9月,这三个月是普华永道合伙人做出业绩评估和确定分 钱基础的时候。如果出现对任何合伙人的打击报复,特别是对老普华、老永道 合伙人的打击报复,我们将发表第二封公开信、并公开部分相关工作底稿。
一部分普华永道合伙人
2024年3月
竺乾威:地方机构改革的困境:人口小县大部制改革思考
一、地方大部制改革再现:人口小县机构改革案例简述
2020年4月,山西省河曲和浮山两个人口小县根据省委部署要求,按照“大部制、扁平化、强基层、重实战、高效率”的原则进行了试点改革,这一改革被认为是机构改革的下半章。事情的起因是山西省在2019年对全省人口小县进行了一次摸底调研,结果发现人口小县财政普遍入不敷出,财政支出主要依靠政府转移支付,且财政供养入不敷出,比例不合理,党政机关和事业单位人浮于事,普遍存在“等、靠、要”的思维惯性,事业单位“小、散、弱”现象突出[1]。改革因此而起。
人口小县的改革目标是建立一个新的,以目标、结果和问题为导向,以职能优化为核心,坚持一类事项原则上由一个部门统筹、一件事情原则上由一个部门负责的县域行政运行体系。显然,这一改革顺应了2018年第八次机构改革中提出的“允许地方根据本地区经济社会发展实际,在规定限额内因地制宜设置机构和配置职能”的原则。为此,河曲县成立了县委书记任组长的改革领导小组,领导小组先后召开多次会议,“征求干部群众意见建议425人次,组织专家学者论证5次,与省、市编办沟通8次,党政机构和事业单位《改革方案》分别修改16次和35次,反复推敲、仔细斟酌,确保了方案既体现省、市要求,又符合河曲实际”[2]。到2020年12月,河曲县民政和人力资源社会保障局、县发展改革和科技商务局、县规划和自然资源局(县林业局)、县城乡建设和交通运输局、县农业农村和水利局(县扶贫开发办公室)、县市场监督管理局(县综合行政执法局)等多家新组建部门相继揭牌亮相。2022年8月,河曲县人口小县机构改革各项任务基本完成,并被认为“取得了阶段性的成果”[3]。其改革举措主要有:
(一)组织结构的改革。改革采用了大部制式的方法精简机构精简人,将36个党政机构精简为22个,将改革涉及的186个事业单位整合为40个,1964名事业编制核减为659名。比如,整合民政、人力资源和社会保障等部门职能,组建县民政和人力资源社会保障局。整合自然资源、林业部门职能,组建县规划和自然资源局,加挂县林业局牌子,县规划和自然资源局干部管理体制调整为属地管理。整合县住房和城乡建设管理局、县交通运输局,组建县城乡建设和交通运输局。对于事业单位,对职责任务相近的机构进行跨部门整合,原则上不再设立10名编制以下的事业单位,县委、县政府直属事业单位不超10个,“大部制目标基本实现”[3]。
(二)重新组合职能相近的党政机构。按照优化协同高效的原则,将职能相近的党政机构重组整合。比如县委办与县政府办、县委宣传部与县文化和旅游局等实行合署办公,两块牌子,一套班子。县委编办、县老干部局并入县委组织部,加挂县委机构编制委员会办公室牌子。县政府办公室承担的外事、对台、港、澳工作职能划入县委统战部。
(三)改革领导体制。改革后的22个党政机构均为正科级建制;减少科级职数75个。领导职数从135名领导精简为114名;县委常委或政府副县长兼任党委工作机关、政府主要工作部门负责人。副县长兼任局长的,同时担任局党组第一书记,由主持日常工作的副职担任党组书记。
(四)改革领导的运行机制。凡涉及“三重一大”等重要事项,由党组第一书记召集党组会议,集体做出决定,其他事项由党组书记主持。副县长兼任局长的政府工作部门,明确由局长负总责;常务副局长主持日常事务,做好分管工作,重要情况向局长汇报;其他副职做好分管工作,对局长负责。
(五)改革后的一些部门采取了新的工作机制,根据工作实际,建立了周例会、公文审签、民主决策等日常运行制度,规范了日常管理。对上制定了与省市部门的对应关系表,对下建立了对乡镇的指导机制。在部门内成立了若干工作组,组长由分管副局长担任,组员由内设股室和对应事业单位人员组成,具体对接省市相应部门,负责相应领域的工作任务落实,以解决“一对多”衔接不到位的问题。
2022年5月11日,山西省召开深化人口小县机构改革试点动员部署会,确定太原市娄烦县、吕梁市石楼县、晋中市榆社县、长治市黎城县4个县为第二批改革试点县。“原本选定的第二批试点为12个,后减少为8个,最后仅有4个县接受改革指导意见并愿意推进改革。”[4]
二、似曾相识的改革:历时性比较
事实上,类似于河曲县这种地方政府大部制改革,早在20世纪90年代就已经发生过,比较典型的地方是陕西黄龙县。2000年以来又有湖北随州市和广东顺德区的改革。从改革的方式上讲,它们共同的特点是:其一,改革的出发点是精简机构精简人,减少行政开支和提高行政效率(顺德的出发点主要是提高政府效率);其二,都是在上级授意或进行试点的情况下展开的(黄龙县是唯一的例外);其三,采用的都是大部制式的改革方式(黄龙县和随州的改革那时还没有大部制的说法,当时流行的说法是精简机构精简人,大部制改革是从2008年开始的),将党政或政府一些职能相同或相近的部门合并;其四,改革后新的政府部门和机构与上级政府的部门和机构不对应,一个部门要应对上面好几个部门;其五,改革的最终结果是回归原有体制,主要原因是大部制式的改革导致了机构部门上下不对应,与单一的集中体制的组织结构体系不相称。
把河曲县改革的做法与上面几个县做一比较,就可以看出,河曲县的方法与这几个县如出一辙。比如,20世纪90年代黄龙县改革的主要做法是:将职能相近的局委合并,比如将科委、体委与文化局合并为科教文体局;对有经济收入的单位分3年逐年减少财政供给,直至全部脱钩。通过努力,全县最终撤并了党政事业单位58个,仅县直机关就减少了228个吃财政饭的人员[5]。湖北随州市2000年的改革也采取了几乎同样的做法,机构合并采用“合并同类项”的做法:职能基本相近的单位能合并的尽量合并设置,职能衔接较紧的单位采取挂牌设置不变,比如保留文化局、文物局、体育局、新闻出版局几个职能相近的局被合并为“文体局”。职能衔接较紧的在合并后原有部门挂牌设置不变,比如保留市档案局与市档案馆、市党史办、市地方志编纂办公室四块牌子,但班子成了一套。内设机构设置时,也不搞“上下对口”,而是综合设置科室,统一确定机关人事、财务,不单设科室,工作由各单位办公室负责承担;科室领导职数统一定为一科(室)一职,绝大多数单位纪检、工会和机关党委(党组)也没有配专职干部。
河曲县的大部制改革除了将政府的一些职能相近或相同的部门合并外,这一合并还跨越了党政的边界,比如县政府办公室承担的外事、对台、港澳工作职能划入县委统战部,这一改革显然遵照了2018年机构改革中党中央三大职能部门直接管理相关行政事务的做法(比如中央统战部管宗教和民族事务),这种做法在2009年顺德的改革中则是一个亮点。顺德的大部制改革就是党政联动,跨越党政边界,将党政职能相近的部门合并(这是以往几次机构改革没有的,有媒体把这一改革称为“石破天惊”的做法),把41个党政机构合并成16个局,减少了近三分之二。党委部门全部与政府机构合署办公,区委办和区政府办合署办公,区纪委、审计局和信访局组成了新的区纪委。区委宣传部同时也是文体旅游局,区政法委和司法局合署办公。而区统战部、农村工作部、工会、共青团区委、妇联、工商联、残联组成了新的党委“社会工作部”。随着党政机构的合一,领导人党政兼顾。新成立的“部局”一把手大多由区委副书记、区委常委和副区长兼任,而原“部局”的正职全部成了副职。此外,在运作机制上,将决策权上移、执行权下移,并将监督权外移,纪检人员由纪委直管,且不从事所在局内的其他任何行政事务,保持独立。
纵观这些县的机构改革,改革要达到的目标同河曲县一样,无非是减少财政支出和提高行政效率(顺德的出发点更多在于后者)。从改革的结果来看,改革在短期内产生了一些成果。比如,河曲县的大部制改革在打破横向阻隔、提升政府工作效率方面也有一定的成就。例如,在农田建设方面,改革前农业部门负责高标准农田建设、水利部门负责坡改梯、农机部门负责农田宜机化改造;改革后,由农业农村和水利局负责,更好统筹政策。特别是副县长兼任局长后,减少了请示层级,落实时间大大缩短[6]。这样一种结果事实上在其他几个县的改革中我们也可以看到。比如在随州,城市规划、土地规划和林业规划改革前由3个部门审批公示,改革后统一由县规划和自然资源局审批,特别是副县长兼任局长后,减少了请示层级,时间大大缩短。仅办理流程和公示时间至少可缩短14个工作日[1]。顺德也一样,在成立了新的卫生和人口计划生育局之后,购买甲流疫苗经费,经局办公会议、局长直接请示区长后,3天内即获批。而按照以往的程序,首先要由疾控中心打报告到卫生局,卫生局上报区府办,区府办给分管副秘书长,副秘书长给分管副区长,副区长报至区长处,区长批示财政局办理后,方原路传达回卫生局,这样的往返至少要一两个星期时间[7]。
尽管如此,改革产生的一个共同的问题是,这种将机构合并的大部制式的改革在解决部门横向的职能重复、运作不畅的同时,增加了与上级部门协调的成本。从组织结构上讲,改革后导致的一个结果就是一个部门要应对好几个上级部门,这种不对应的一个结果就是上下运作的不畅。比如,改革后的黄龙县,“对绝大部分被撤并的部门,上级主管部门是开会不通知,文件不下发,该给的资金也不再下拨”[5]。随州也一样,省里要求把市农村能源推广中心作为一个副处级机构设置,而随州则把该机构作为农业局的一个科级内设机构。这样,省在安排新农村沼气改造计划时就以“机构未按他们的要求设立”为由,将原拟下达给该市的1万口沼气改造目标削减为5500口,相应减少经费投入450万元。再比如,省里要求把移民工作作为单独设立的副处级机构,但随州仍然将移民工作职责赋予民政局,以至于民政局每次到省里参加会议,都会遭受批评[8]。这种上下不对应、上下难协调的问题同样在顺德表现了出来。比如,改革后顺德的社会工作部对应省市部门竟达35个,其中省是19个,市是16个,出现“一个儿子”对应“几个老子”的尴尬局面,单是开会就疲于奔命,而且省、市会议基本上都要求部门副职以上领导参加,部门领导成了“会议专业户”。即使上下对口比较少的部门也有三四个,年终光汇报总结就搞了好多版本。这样一来,即便下面内部如何合理设置,运作如何高效顺畅,还是要应对上面一堆部门,效率很难提高[9]。再比如,顺德在改革中把水利局等9个部门合并成了一个建设局,后来迫于省水利厅的压力,把建设局的名称改成了“建设及水利局”,因为“水利局”几个字不出现,就无法获得来自省水利厅的资源。事实上,这种情况也开始在河曲县发生。“职能相近部门合并产生了一个超大部门,而改革后人员的减少导致部门运转吃力。如改革后的县发改工信和科技商务局法定职责32项,24个编制只有11人在岗,内设的发改股连事业编制人员在内5名工作人员要对接市发改委等多个部门”[1]。
这种上下不对应导致的运作成本显然超过了原有结构产生的成本,使改革的最后结果都回归了原有体制。黄龙县改革的结果是,为了上下对口,出现了“下级模仿上级,级级模仿中央”的局面。上级有什么机构,下级不管是否需要,无论条件是否具备,毫无例外地建立相应的组织机构,以致基层单位设置了诸多门类齐全、重叠不堪的行政机构和部门,甚至在一些乡村和街道居然也设立了体改办、文明办、政策研究办等机构和部门。在改革差不多五六年之后,财政供给人员比改革前增加了1100多人,不少机构恢复了原貌。有人曾形象地总结说:“下改上不改,改了也白改。”[5]随州也一样,改革没达到理想效果,改革成果就被逐步蚕食,旧体制开始反弹。最初“独立”的是科协。2000年,科协被合并到科技局。但2005年市科协换届选举,向省主管单位递交方案后不予批准,理由是随州科协不是个独立单位。最后,市里只好将科协与科技局重新单独设置。此后,市残联、规划局、法制办等多个机构加入这一“分离运动”;还有一些部门是中央明确要求增设的,如安全监督局等。“现在,随州市级机构由最初的55个上升到64个”[8],随州改革的一位主要设计者用了一句与黄龙县改革差不多的话来形容这一改革:“下改上不改,改了又回来。”[8]而作为试点的顺德改革,尽管它坚持了好几年,但它的改革成果也没有在广东省其他地方复制推广,最后在2018年的第八次自上而下的机构改革中一改原来的做法,融入了国家改革的体系,原有的一整套改革结构体系不复存在。
三、地方机构改革的困境:制度变迁角度的分析
尽管可以把这种结构上的不对应看作是向原有体制回归的一个主要原因,但这种自下而上的改革所产生的其他问题可能同样也促使了其向原有体制的回归。从严格意义上讲,这些县的改革都不是完全意义上的自下而上的改革。自下而上的改革完全是由地方发起的,改革的动力来自地方。这一点,黄龙县是一个特例,它完全是因财政拮据问题引发的。而随州和顺德(包括这一次的河曲等县)首先是因上级授意或进行试点而展开的,因此,它们在一定程度上带有自上而下的特点,即既有服从上级指示的一面,也有试图改变现状的一面,并非完全消极。按照新制度经济学理论,可以把这种自下而上的改革看作是一种诱致性制度变迁。诱致性制度变迁通常被认为是对现有制度的变更、改革或替代,一种新的制度创造。“诱致性制度变迁必须由某种在原有制度安排下无法得到的获利机会引起。”[10]108所有这些县的改革都有这种状况:现有的制度安排无法有效地解决财政拮据(顺德可算一个例外)和行政效率问题,改革因此而起。
但是,仅仅考虑这一点是不够的。改革者还必须考虑改革的成本效益问题。用诺斯的话来说,“如果预期的净收益(即指潜在利润)超过预期成本,一项制度创新就会被安排。只有当这一条件得到满足时,我们才可望发现在一个社会内改变现有制度和产权结构的企图”[11]。改革的预期收益超过预期成本,这里包括了对改革成本的计算,其主要的考量因素包括:
其一,尽管改革将横向部门打通可能提升了部门的工作效率,但改革后部门结构上下不对称产生上下之间的协调问题是否会导致对上交往效率的下降?其二,上下不对应导致的一个结果是下级无法像以往那样获取来自上面的资源,这样,资源的缺少是否会影响组织的运作?其三,随着结构的变动,随之而来的就是新的功能履行的问题。结构的变革或许很容易,把几个部门合并一下就完事了,但真正的问题在于新的结构的运作如何得以顺畅?这里不仅仅涉及新的运作机制问题,还涉及组织文化的问题。新的结构不应该是一种几个部门叠加的产物,它应该是一种新的整合,从而产生一种高于改革前的组织的效率。新的部门的整合能否到位?其四,组织成员的利益问题。在官僚制组织内,精简机构精简人的做法通常是不受欢迎的,因为部门或机构的合并减少了职位,导致一些人失去岗位。此类改革的一个难点就是人到哪里去。另外,职位变少也意味着上升空间变窄,晋升的可能性变小。这样会伤害一些原有体制下的既得利益者,即便他们知道新的制度安排可能好于旧的制度,但他们仍然会反对变革或抵制变革。这些人的利益如何补偿?所有这些考虑在自下而上的改革中也可能会因为发现没有“获利”的机会而予以放弃。正如上面提到的,山西的第二批试点的12个县,最后8个县放弃试点。这一放弃可以认为是出于这样的考虑。
但正如前面指出的,这些县的改革(除了黄龙县,黄龙县是因为糟糕的财政状况逼迫它精简机构精简人,如果没有这一压力,它或许也不一定有改革的动力)同时也具有自上而下的特点,即一种被新制度经济学所称的“强制性的制度变迁”的特点。强制性变迁的动力来自于上级,其出发点无疑是为了减少国家管理社会的交易成本,并认为推行一种新的制度安排的预期收益要高于现有的制度安排,比如我国改革初期的那种机构臃肿和人员庞大无疑加大了管理社会的交易成本(1982年第一次机构改革时,国务院的部门有100个,人员有5万。改革后,部门减到61个,人员减到3.2万)。强制性制度变迁的一个优点是它可以以较快的速度推进改革,从而降低改革的成本(这也表现在机构改革有个时间表,通常在一年时间里必须完成),但它可能违背一致性同意的原则,即在没有得到一致同意的情况下强制推行。因此,即便下级没有改革的动力或动力不足,它还得遵循上级的命令指示。从这些县的改革最终回归原有体制来看,我们只能说,改革的预期净收益并没有超过预期成本。就黄龙县后来的发展而言,该县人口至今只有4.07万,是典型的人口小县。该县2019年的财政收入是1.4712亿元(比较2000年为859万元,人口为4.9万),在2019年的机构改革中,该县设置了32个党政部门,上下基本对应,并没有采用大部制的改革方法。
那么,我们的问题在于,在有前车可鉴的情况下,河曲等人口小县在时隔多年后,为什么还是几乎复制了前几个最终回归原有体制的县的做法?如何解释这一现象?
第一是环境压力。这里有两层意思。一方面,正如前面讲到的,河曲的改革是一种自上而下的安排,是省委在那里进行的改革试点,是一种强制性的制度变迁,即便得不到一致性同意,也必须照做不误。官僚制组织奉行的一个原则就是下级服从上级,在这一点上,下级组织没有讨价还价的余地。但是,如果这样的试点不是强制性的,那么地方的反应可能就会不一样。比如,原本山西省选定的第二批试点为12个,后减少为8个,最后仅有4个县接受改革指导意见并愿意推进改革,变动的原因显然是地方有了讨价还价的余地,否则如果作为命令或指示,下级就必须执行,正如河曲那样。另一方面,核心的问题是河曲等人口小县入不敷出、靠转移支付的糟糕财政状况。河曲县的财政自给率低,行政成本畸高,财政供养压力不小。“2021年河曲财政预算收入106100万元,预算支出195187万元。县级可用财力安排的145566万元,用于财政供养人员支出67417万元,其中在职人员工资、社保、绩效支出57774万元,补贴离退休人员支出9643万元”[12]。拮据的财政状况使得与上对应的部门机构齐全、人数相对较多的政府在一个人口不多的小县里面显得非常扎眼,加上党政机关和事业单位人浮于事,事业单位“小、散、弱”现象突出,所有这些促成了上下合一,进行改革。
第二是路径依赖。从我国机构改革的历史来看,改革一开始采用的就是精简机构精简人的做法,也就形成了改革最初的路径选择。这是解决当时人多机构多的一个不二选择(但后来发现,单纯机构和人员数量上的精简不能完全解决问题,因此后来的改革就转向了改变政府职能)。从政府最高层面来看,这种解决方法不存在机构部门向上对应的问题,它要求的是下级机构与它对应。但是,一些地方如上面提到的几个县区后来的改革在结构上另行一套(尽管也有来自上面的授意),首先是事出无奈,这种大部制改革是解决面临困境(财政拮据和效率低下,尤其是前者)的相对较好的做法;其次,按照诺斯的说法,“人们过去做出的选择决定其现在可能的选择”[13]中文本序。初始的选择很重要,因为它有惯性。一般来说,沿着原有的路径往前走,要比另辟蹊径来得容易。大部制改革的一套做法已经驾轻就熟,操作相对容易,短期效果明显。
改革路径的选择取决于改革的目标。河曲县的改革目标是降低行政成本和提高行政效率。但是,引发河曲县改革的第一推动力显然是财政压力问题。而解决这一问题的最简便也是最直接的办法当然是精简机构精简人。机构少了,人员少了,财政费用当然也就降下来了。因此,大部制式的改革就成了差不多最好的选择。河曲县的改革在经过一系列的操作后(比如将事业单位超编人员重新安排,鼓励55岁以上的科级干部退出领导岗位,解决职级待遇,纳入“干部周转池”由县委统一管理等),“2021年,县直部门公用经费支出同比下降11.3%,乡镇同比增长7.6%,‘减上补下’成效明显。改革过渡期之后,县直部门公用经费支出每年减少1050万元,财政供养人员工资福利、‘五险一金’等支出每年减少1.33亿元”[14]。但事实上这一说法是存有异议的。县直部门因机构和人员减少从而使得费用下降,这点没错,但问题在于,减少的人员并没有因此脱离财政供养。从全县的角度讲,这个费用事实上并没有减少,除非让他们离开公共部门,不再由财政供养。要解决这一问题很难,正像前面讲到的,黄龙县在改革差不多五六年之后,财政供给人员比改革前增加了1100多人,不少机构又恢复了原貌。河曲这一改革的唯一意义在于建立了一个新的标准,确定县级机构多少,人员多少。但要使离开县级机构的人最终脱离财政供养,则需要多年的消化。另外,如果要维持改革后新的机构和人员的数量标准,那么正常的人员流动就会在一段时间内消失,新生力量短期很难再进入县级机构。
第三是利益补偿。大部制改革涉及的一个基本问题就是如何对待改革中的利益受损者,这个问题不解决,改革很难推进。利益补偿到位一般不会引发对改革的抵制或反对,尽管要达到帕累托最优很难。河曲县显然还具有能力开展补偿方面的工作。比如,前面讲到的精简下来的人无论到哪里去,他们并没有脱离财政供养。在机构被精简合并后,每个单位原有的一正两副领导职数在整合后的“大机构”中被重新洗牌。县政府、组织部对于职位发生变动的官员,保持了其行政级别不变,并且仍让原有官员负责“大机构”中原来其担任一把手时的领域,同时继续让其负责与市、省相关部门的沟通。另外,用职级晋升换职务下岗,转岗下乡换待遇上升,比如将局长调换为副局长,但职级上升,收入相应提高,虽然正职变副职,但责任小了,原有日常性权力在一定程度上保留,等等,以此来减少改革的阻力。事实上,这一做法同顺德是一样的。顺德在将43个党政部门合并成16个局之后,导致副局长僧多粥少。为此,顺德创造性地在各局设置了多名“局务委员”,和副局长一样进入局领导班子,一样分管2~4个科室。人员不降级,为的是在改革中尽量不伤害利益受损者,以减少改革的阻力。
四、结论与思考
在将河曲县与其他几个县做了比较、分析了河曲县为何如此做之后,我们的另一个问题是,河曲县的改革能避免最终向原有体制回归的命运吗?可以有其他的改革路径吗?
我们姑且不论部门之间的合并是否做到了组织文化的整合和人员的整合,以致产生大部制应有的效率;也不论利益受损人员是否得到了补偿,以至于整个改革相安无事。黄龙县、随州市以及顺德区的例子表明,导致回归原有体制的主要原因是改革后部门机构上下不对应产生的成本显然超过了预期的净收入;用另外的话讲,也就是力图解决部门横向职能设置不合理的大部制改革并没有解决由此带来的纵向部门间的沟通、运作问题和利益问题,以致从最终的成本效益来看这样的改革是不合算的。因此,回归原有体制,上下对齐,左右摆正,与国家层面的行政组织体系保持一致,就成了不二的选择。河曲县步上述几个县的后尘,正如上面讲到的,实是无奈之举,因为它首先要解决的最重要的问题是财政的入不敷出,这才有了精简机构精简人。而这也会使它陷入一个两难困境:即使最终想与其他几个县一样回归原有体制,拮据的财政状况也会阻止它这样做,而按现有的大部制搞下去,从最终的效率来讲,按照成本效益来说可能又是不合算的(黄龙县以及其他几个县都表明了这一点)。因此,它会在这两者之间博弈。博弈的结果取决于对两种做法的计算。而前几个县,尤其是黄龙县在财政极其拮据的情况下,选择了向原有体制回归,但结果是机构和人员再度增多。而黄龙县在2019年的机构改革中能够做到基本上上下对应,或许是它汲取了原来的教训,或许一个很重要的原因在于它没有像河曲县那样面临着如此巨大的财政压力。
那么,有没有一种结构既能解决横向部门之间的职能重复和交叉的问题,同时又能保持上下机构的对应呢?浙江省富阳县多年前就建立了一种被称作专委会的机构,起因是由于部门之间的不通气,导致有人将同一个项目改头换面,从不同的部门中申请到了11笔扶持资金。而部门之间如果通气的话,这种事情就不会发生。专委会由此应运而生,它是一个虚设机构,但有实权,主要解决部门横向的沟通等问题,但不干预部门上下之间的关系。然而这一专委会的机构对河曲县似乎意义不大,因为保持上下对应就意味着不进行大部制改革,而不进行大部制改革(精简机构精简人)就无法解决财政问题。这一点只是对一些没有进行大部制改革的小县有借鉴意义,或许对未来有可能再度回归原有体制的河曲县有借鉴意义。
以河曲县地方政府为例的大部制改革可以启发我们对地方政府机构改革的一些思考。
其一,机构改革是受制于外部环境因素的,尤其是受制于经济因素。很多政府机构改革的起因就是财政问题。这一点中外都一样。比如新公共管理运动在英国的兴起,就是因为当时由石油导致的经济危机使得英国政府的财政状况恶化,因而政府瘦身势在必行。黄龙县的情况如此,河曲县的情况也是如此。如果河曲县经济发展不错,财政实力强大,那么可能就不会进行这样的改革,尤其是精简人的改革(比如今天的黄龙县)。因为在这种情况下,人们一般不会去关注政府和事业单位人多人少的问题,况且政府和事业单位本身也是一个向社会提供就业机会的部门。即便改,也可能采取另外的方式来提高政府的效率。此外,进行精简机构精简人的改革毕竟会受到很多的阻力,打破上下对应也会产生另一种效率问题。由此我们可以认识到经济发展的重要性,认识到经济发展对政府的影响。人口小县要真正解决政府本身的问题,改革不能仅仅局限于政府自身,还要从发展经济着手。河曲县2021年的政府工作报告提出要实施大县城战略,全力推进县城扩容提质,提升城市品质和承载辐射能力,这无疑是一个好的思路。事实上,浙江省在多年前就实施过“小县大城”方案。“小县大城”内涵主要包括以下方面:小县域大城关,少人口大集聚,小产品大产业,小环境大发展[15]。当然,这对地处偏僻的一些人口小县来说,发展经济有点困难,但舍此政府会陷入更尴尬的境地。
其二,我国的单一制决定了权力集中在中央政府手里,因而在行政组织体制的设计上,采用的是机构部门上下对应的做法,下级服从上级。这样一种体制做事效率较高,但也带来了如何发挥地方积极性和创新性的问题。因此,在上下关系方面一直有权力下放的改革,以扩大地方的权限,尤其是在今天行政下沉的情况下。2018年第八次机构改革的一个重要举措就是在坚持维护中央权威和集中领导,省市县各级与国家法制统一,政令统一、市场统一的结构职能基本对应的情况下,赋予省级以下机构更多自主权,突出不同层级职责特点,允许地方根据本地区经济社会法制实际,在规定限额内因地制宜设置机构和配置职能,这意味着上下机构对应的状况有可能被打破,而河曲县的改革恰恰是其产物。但问题是,在上下对应的严密的行政组织系统中,如何给地方有改革的空间是需要考虑的。现有的结构事实上制约了地方的改革,因为一改,正如河曲县所做的那样,就是打破上下对应,而结果,就像黄龙等县一样,最终回归上下对应的体制。这里显然缺少了一种能够发挥上下两头积极性的组织机制。这个问题不解决,地方因地制宜设置机构和配置职能就很难推进。
其三,如何理解河曲县再次复制黄龙等县的改革而没有另辟蹊径?除了上面的解释之外,还有一个重要原因就是政府组织及其体系本身具有的优点使得改革只能采取边际递进而非另起炉灶的方法。正如中央层面一轮一轮的大部制改革一样,这些改革只是在原有组织体系上做一些边际的改革而已,没有大动干戈,其原因显然是单一制的组织体系及官僚制的优点超越了它的缺点。正如前面讲到的,制度的改革一般缘起于对改革预期收益和预期成本的比较。就我国的大部制改革而言,这些改革都是在单一体制和官僚制基本框架下进行的改革,这表明选择替代性的结构从预期收益和预期成本的比较上可能是不合算的。尽管如此,边际的改革要有递进,改革后要能更好地解决问题。比如我国监管机构的改革经历了好多次,直到2018年的改革将其定型为“大监管”的大部制格局。这个过程事实上也是逐步摸索和评价的过程。尽管知道选择的改革方法不是一个完美的方法,有时候也是不得已而为之,改了以后也不一定能完全解决问题,但既然是改革,就意味着投入了时间、精力和资源,因此,即便获得微小的进步也是需要考虑的。以河曲县的改革而言,未来哪怕最后还是像黄龙等县那样回归原有体制,在这一过程中取得某一方面的改进和进步也是可取的。要避免的是没有任何进展的改革,从而导致资源的巨大浪费。当然,最好的结局是走出一条地方大部制改革的道路。在这个过程中,或许有这样的机会。
本文转自《广西师范大学学报:哲学社会科学版》2023年第5期
阎步克:什么是士大夫
本文摘自阎步克教授《士大夫政治演生史稿》第一章第一节,略有精简
中国古代社会的独特政治形态,自汉代以后表现为一种“士大夫政治”。这种政治-文化形态有其独特的运作机制,构成了独特的政治文化传统。
秦汉以来的国家形式是一个典型的官僚帝国,皇帝与担当国务的官僚集团,共同对社会实施统治。官僚的巨大威望、特权及其运用权力谋取财富的可能性,使我们有理由将之视为社会统治阶级的重要组成部分。但是,中国古代的帝国官僚还不仅仅是职业文官,他们来自知识文化群体,来自士人。士人拥有深厚的文化教养,从事哲学、艺术和教育等等文化性活动,特别是,他们承担着被王朝奉为正统的儒家意识形态。科举制度构成士人加入帝国政府的制度化渠道。这种特殊类型的文人官僚,有一个众所周知的称呼:“士大夫”。
当学人用“士大夫”一词指称一个特定阶层的时候,“绅士”有时是其近义语。较早从这一角度进行研究的,有吴晗等学者。
吴晗说:“照我的看法,官僚、士大夫、绅士、知识分子,这四者实在是一个东西,虽然在不同的场合,同一个人可能具有几种身份,然而,在本质上,到底还是一个。……平常,我们讲到士大夫的时候,常常就会联想到现代的‘知识分子’。这就是说,士大夫和知识分子,两者间必然有密切的关联。官僚就是士大夫在官位时的称号,绅士是士大夫的社会身份。”
相对说来,“绅士”或“乡绅”这种称谓,强调的主要是士大夫在社区之中的地位与功能。据张仲礼的估算,在19世纪、太平天国之前,取得了生员(以及监生)资格者已达到达110万人左右。这还要加上候补官员与退休官员,才大致构成了绅士阶层的主体。将绅士的家属计算在内,这个绅士阶层总人数约近550万。绅士及其家族拥有种种正式与非正式的特权,并且在社区与国家之间履行了司法、行政、治安、经济、教育与公益事业等等方面的重要功能。在历史上,这种绅士经常就直接被称为“士大夫”。
士大夫就是官僚与知识分子的结合物。《辞源》为“士大夫”这一语辞提供的解释中就包含“居官有职位的人”及“文人”两个义项:既是“居官者”,又是“文人”。如果要用现代语言对士大夫之特征做一个最简概括的话,那么,不妨暂时将之定义为官僚与知识分子这两种角色的结合。
在英语中,“士大夫”一词的译法有scholar-official(学者-官员)、scholar-bureaucrat(学者-官僚)、literati and officialdom(文人-官员)等,需要用两个词才能较好地表达中文“士大夫”这一个词的意义,仅仅“官员”或“官僚”一个词不足以传达其整体内涵。
或许,英语世界的历史上没有过一个与之相当的社会阶层,在那里学者和官僚是相当不同的社会角色,因而也就没有产生与之相近的语辞可供对译。这也提示我们,一个具有二重角色的“士大夫”阶层的存在及其在社会中的崇高地位,可能是中国古代社会非常富于特征性的现象。
美国学者赖文逊对中国的士大夫还有一个很有趣的称呼:amateur。原义兼指业余爱好者以及外行,与专业人员或“专家”意义相对。他说:
如同八股文的极端美文主义所显示的那样,中国的官员在履行官务上是amateur,这一情况到明代较此前更甚。他们受过学院式教育,(绝大多数)经过书面考试,但却没有受过直接的职业训练。……学者的人文修养,是一种与官员任务略不相及的学问,但它却赋予了学者以承担政务的资格;这种学问的重要意义,并不在于需要技术效率之官员职能的履行方面(在此它反倒颇有妨碍),而在于为这些职能提供文化粉饰方面。
随后赖文逊对中国的士大夫给出了如下评语:
在政务之中他们是amateur,因为他们所修习的是艺术;而其对艺术本身的爱好也是amateur式的,因为他们的职业是政务。
赖文逊把中国与英国加以比较,因为在英国“人文修养也经常地构成了进入行政部门的资格”。
他引述了一段对一位文官的赞辞,这篇赞辞将此文官的出色表现归结到他的人文修养;可是赖文逊随即就指出,“由于作者生活在一个amateur几乎在各种场合都要向专家让步的高度专门化社会,一个在其中amateur一词事实上已经意味着技能疏浅而非无关报酬的爱好的社会之中”,所以作者在申说古典人文修养有益于官员专业任务之时,其语气带有了一种“分辨的意味”,因为他感到他的听众会对之表示怀疑。这与明代中国“最高文化价值与最高社会权力辉煌的象征性结合”,仍然大为不同。而且赖文逊指出,在那段赞语之中,古典学识与行政职务之相关,是从“达到目的(案,指官员任务)的合乎逻辑的实用手段”意义上加以论证的;然而对于中国的士大夫,“他们的人文修养中的职业意义,就在于它不具有任何专门化的职业意义。”对于一个生活于西方世界和现代社会的学者,这显然引起了他的特别注意。
对士大夫之二重角色的这类特别敏感,具有两方面的意义。首先这涉及了中外差异:许多民族历史上没有出现过类似的阶层;同时也涉及了古今差异:众所周知,现代社会的重大特点之一,便是社会分化与专门化,由之知识分子与职业官僚之间发生了制度性的高度分离,知识界与政治建制判然两分了。
社会分化,或略微确切一点儿地说,社会的结构与功能分化,是这样一种社会过程:它的推进将导致社会的不同领域、系统以及相应的角色、群体、组织、制度、规范、价值等等的不断增殖。这些要素分化开来之后,随即就显示出各自特有的内部法则和外部联系,具有了自主性和专门性,并将要求在新的基础之上建立新的整合形态。如果整合的途径和形态产生了一个更复杂、更平衡、更具适应能力的社会系统的话,往往就被视为进化过程。知识分子和职业官僚,都是社会分化的产物,是社会的文化系统与政治系统分化到一定程度而发生的社会角色专门化的结果。
帕森斯、李普塞、希尔斯等把知识分子定义为投注于文化性事务、从事文化的创造、传播和使用的社会角色,其功能来源于人类的这一需要:与人、社会、自然和宇宙的最高或最本质的方面,建立认知、道德与审美的联系。
至于官僚,依马克斯·韦伯的定义是这样一种社会角色:他们仅仅依照专业资格受职任事,依照功绩和年资领俸迁升,并严格依照和充分利用成文的法典规章、文书簿记从事公共行政的职员。
相应地,那种以集权的科层形式分配职能、资源和权威,以经由特定铨选程序进入晋升阶梯的专业领薪文官任职、并依赖于成文的系统化法规而运转的行政组织,就可称之为官僚制。
官僚制的基本精神是所谓“工具理性”,它表现为目的明确的、可计算的、合乎逻辑的、普遍主义的和系统的达到目的的手段。
上述这些定义产生于高度分化的社会背景之中,因此其定义的作者,首先要尽力略去知识分子与官僚的社会脉络,如经济利益、社会地位和政治态度等等,以凸显其专业功能。
假如我们暂时进入这一框架来透视中国士大夫,可能会生发出这样的印象:较之现代知识分子与官僚的判然两分,中国古代士大夫之二重角色形态,显示了功能混溶性或角色弥散性;其制度化的“一身二任”,显然与现代社会的专业分工原则相左。
前述赖文森称士大夫为amateur即有此意;又如白乐日断言,“中国士大夫行使所有的中介功能与行政功能,……然而在此前他们坚决反对任何形式的专门化。”
至于官僚政治理论的奠基人韦伯对中国士大夫的论断,更是众所周知的:中国缺少专家政治,“士大夫基本上是受过古老文学教育的一个有功名的人;但他丝毫没有受过行政训练,根本不懂法律,但却是写文章的好手,懂八股,擅长古文,并能诠释讲解。在政治服务方面,他不具有任何重要性。……拥有这样官吏的一个国家和西方国家多少有些两样的。”
韦伯引述《论语·为政》“君子不器”之语来概括士大夫之非专家特质,这可以说是对孔子此语之极具匠心的发挥。在他看来,这种士大夫“君子”形态缺乏所谓“合理性”(“形式理性”)。社会分化当然不等于“合理化”(形式理性的增长),但是它将为“特定手段针对于特定情境的特定问题”的发展开辟道路。反过来说,从理论上讲,不同领域的法则、规范和角色的混淆,将降低由于要素专门化而带来的合理化性质。
这是否是在套用现代或西方的标准,用一个狭窄的标尺苛求于中国古代的士大夫政治呢?在此,我们确实应该谨慎地把论断限制于一定的范围之内,以免陷入误区。但这个参考并不是没有意义的。官僚组织在中华帝国很早就相当发达了,在西方社会则很晚才达到了相近的规模和复杂程度,然而双方各自的官僚形态却是如此的不同,毕竟显示了士大夫形态的独特性。
在我们把士大夫视为二重角色的结合之时,那么也就意味着这样一点:从功能上看,我们已足以在其中清晰地分辩出两种角色了帝国政府庞大复杂的行政事务凸显出了“官僚”的形象,浩如烟海的诗文著述凸显出了“文人”的形象。假如这一事实未曾发生,则如上引述就无大意义;然而士大夫之“二任”已明明有别,并且各自都已相当发达,但是又整合于“一身”之上,甚至发展出了相应的以美文为考试内容来录取文官的科举制度,无论如何,这应是个特别现象。
事实上,对科举文人疏于政务的指责并不仅仅来自西方学人,在中国这是“古已有之”。例如对科举制“所习非所用,所用非所习”之类的批评,很早就是选官讨论的重要论题了。这种批评表明,文人居官对行政效率的负面影响,古人已颇有认识。由于那个官僚体制所达到的发达程度,它确实已经表现出要求专门化的内在倾向了。
一般说来,在统治者和被统治者二元分层的传统社会之中,上层阶级往往兼有宗教与文化功能,这原是普遍现象。这也可以表述为社会的、政治的、经济的和文化的等级之间的更大重合程度。但是中华帝国的特殊之点在于,这里的文人角色与官僚角色分别都有了相当分化,同时二者又紧密地融合为一种“士大夫”形态,并且达到了赖文森所谓“最高文化价值与最高社会权力的辉煌的象征性结合”。这不但不同于现代社会,也不同于西方历史上政权与教权的判然两分,或古印度的宗教代表婆罗门与政权代表刹帝利划分为不同瓦尔那的情况。
官员在专门化方面呈现出来的特征,并不仅仅是行政组织发达程度的问题;它是一个更大的政治文化秩序之特质在政治角色方面的体现。如韦伯所言,“拥有这样官吏的一个国家和西方国家多少有些两样的”。
将士大夫视为文人与官僚的结合,毕竟只是一个相当简化的说法。士大夫之所谓“一身二任”,实际形成了一种新产物。尽管其间也存在着矛盾,然而从另一些方面看,“官员”和“文人”这二者又是有机地融合在一起的。
士大夫不仅涉身于纯粹行政事务和纯粹文化活动,还承担了儒家正统意识形态。意识形态是一种综合性的观念体系,以及根据这种观念体系从事政治的企图和实践。儒家思想对天、地、人之间的众多事象加之以系统的解释安排,以此来处理人生问题、家庭问题、教育问题、文化问题、治国平天下问题等等,直到宇宙问题;并力图以这种无所不包的体系支配帝国政治。帝国官僚深受儒家教育,并有义务在各种情境中奉行、贯彻和维护它。意识形态的无所不包性,与士大夫角色的功能混溶性质相为表里,并使其“文人”的一面与“官僚”一面,充分地一体化了。
从专门化的角度看,士大夫治国与专家政治颇不相合;但是专门化的行政并不一定就能促成一个平衡的、具有适应性的社会系统,这还取决于整个社会的政治文化传统和政治社会背景。社会分化也必然提出社会整合与调节问题,如果相对于其背景与传统来说某一要素是“过度”地专门化了,那反而有可能对其它要素产生负面功能,这种消极影响又将反馈到其自身。专门化当然不是评价政治文化模式优劣的唯一标准,中华帝国的士大夫政治也发展出了精致微妙的运作机制,并且尽管它确实存在着缺乏专门化的问题(以及其它种种问题),但两千年长盛不衰,毕竟表现了与中国传统社会的高度适应性。
要更为深入地理解这种以“士大夫”形态出现的社会角色,以及由之所承担的“士大夫政治”,上面所引用的那些参考当然还很不够,然而它们还是带来了不少分析上的便利。例如“知识分子-官僚”的二重角色观照,就颇有助于我们切入论题。
在中国古代,知识分子和官僚之间并不是没有发生过分化。在帝国创建之始,恰恰就是由那种颇为纯粹的职业官僚构成行政骨干的,学者文人反而颇遭排斥。这就是秦帝国的情况。在秦王朝,一种被称为“文法吏”的角色成了帝国政务的基本承担者,大异于后世的士大夫。
也就是说,士大夫政治,在中华帝国的历史上决不是自初如此,那种一身二任的士大夫,是较晚的时候才出现的。然而这种纯粹的文吏政治在中国古代社会的特定背景中却难以为继,世入汉代,文吏群体就开始逐渐让位于儒生官僚兼为学者、官僚的“士大夫”了。
浙江蓝宇股份IPO资金流水分析
2023年12月28日,浙江蓝宇数码科技股份有限公司(简称“蓝宇股份”)在深交所上市审核委员会 2023年第 91 次审议会议上顺利过会。本次IPO蓝宇股份拟发行不超过2000万股,占发行后总股本比例不低于25%,共募资50212.55万元,用于年产12000吨水溶性数码印花墨水建设项目、研发中心及总部大楼建设项目、补充流动资金。由此计算,蓝宇股份IPO估值不低于20.08亿元。
蓝宇股份主营产品为数码喷印墨水,按业务模式分为公司自主生产的分散墨水、活性墨水及受托加工分散墨水,主要应用于纺织领域。蓝宇股份的控股股东及实际控制人为郭振荣,其直接或间接控制发行人 45.1127%的股份。郭振荣1976年出生,现年48岁,中国国籍,无永久境外居留权,复旦大学高分子化学与物理专业硕士、美国威廉玛丽学院化学专业硕士、应用科学专业博士。
从招股书看,这是一个高学历海归博士归国创业的励志故事,但是从招股书及回复函细节看,蓝宇股份在很多地方的信披疑点重重,尤其是涉及到创始人及其家庭成员、企业核心人员的资金流水方面,更是一堆糊涂账。不仅实际控制人配偶带着孩子长居美国,且已得美国国籍的配偶在资金流水核查问题上态度消极,以不再持有境内银行卡为由,拒绝提供境内银行历史流水记录;而且实控人与配偶的子女疑似已经成年,但并没有提供银行流水记录;此外,实控人的同学掌控的两家公司为蓝宇股份第一大供应商,离奇的是,其中一家公司的前监事与实控人的一名前员工同名。
配偶美国籍,成年子女未提供资金流水
新经济IPO注意到,蓝宇股份的资金流水核查披露部分存在诸多疑点。
疑点之一是,回复函显示,蓝宇股份实际控制人郭振荣的2名关键家庭成员流水获取困难,其中一个是郭振荣的配偶YAN HU。回复函称,郭振荣的配偶YAN HU为美国国籍,目前在美国高校任职。中介机构曾于2022年初要求打印YAN HU资金流水,但截至第一轮审核问询函回复前,YAN HU并不配合,以长期定居美国、未参与公司经营等借口,拒绝提供银行资金流水。YAN HU仅出具了一封承诺函,表示其长期定居国外,未参与公司经营,未在发行人的供应商或客户处拥有权益,不存在直接或间接将资金划转给发行人客户、供应商或其他与发行人存在业务关系的对手方等。
但在2023年6月份出具的第二轮回复函中,郭振荣配偶YAN HU才提供了电子版银行流水,不过,回复函显示,YAN HU表示长期在美国生活,并未持有中国银行(4.490, 0.01, 0.22%)卡,仅提供了美国花旗银行和富国银行两张卡的流水情况。
实际上,回复函中的很多细节也和YAN HU所谓长期呆在美国、无法提供流水相矛盾。首先,既然银行流水可以提供电子版,为何第一轮时拒绝提供呢?其次,即便本人无法回中国,为何不能通过邮寄方式送达呢?另外,YAN HU 2023年曾回中国探亲,说明并不是完全不回来,所以拒不提供银行流水有何隐情呢?
另外,YAN HU表示自己不持有中国银行卡,所以不提供中国境内银行的相关资金流水,这个说法也很可疑。招股书及回复函没有披露YAN HU何时取得美国绿卡,但是,涉及到IPO实际控制人及其家人、董监高等关键人物的资金流水,哪怕是已经注销的银行卡,也有必要提供历史流水记录。所以,YAN HU到底是何时注销掉全部中国境内银行卡的呢?蓝宇股份的保荐人及申报会计师是否有义务就此进行更加细致的核实工作?
实际上,对注销银行账户的核查是有先例的。上交所科创板就曾要求某家IPO企业实际控制人提供全部直系亲属过往多年注销的银行账户的资金流水情况。
最后一点,也是极为重要的一点,YAN HU的资金流水显示,资金流向之一是给子女支付学费7.15万美元,所涉及学校为美国埃默里大学,由此看,这名子女应该已经成年。众所周知,IPO资金流水核查中,实际控制人的配偶、成年子女和父母是必须要核查的对象,但保荐人及申报会计师为何疏漏了郭振荣和YAN HU已经读大学的成年子女?为何没有进行相关的资金流水核查呢?
财务总监炒币、借网贷摇号买房
蓝宇股份的资金流水核查中,第二个疑点来自郭振荣的母亲杨元凤的部分流水。2021年12月,郭振荣母亲杨元凤的银行账户还向蓝宇股份董事、董事会秘书、财务总监屠宁转账80万元。回复函称,这部分资金是借给屠宁信用贷还款、买车等消费。
不过,从屠宁的资金流水记录看,他似乎不差钱。报告期内,屠宁资金流入高达1140万元,其中屠宁用于投资理财的资金400万元。屠宁用于借款给吴先国在加拿大买房、偿还京东、支付宝信用贷的资金达375万元。需要说明的是,吴先国是郭振荣的同学,加拿大国籍,他在报告期内也向郭振荣的母亲杨元凤借钱,名义也是在加拿大买房。
很奇怪的是,屠宁作为蓝宇股份的高管,为何会与郭振荣的同学相熟,并向其提供借款呢?从回复函看,屠宁与吴先国关系匪浅。屠宁曾委托他将加密货币置换成人民币76万元。众所周知,国内禁止个人交易虚拟货币,屠宁持有加密货币并不违规,但他委托郭振荣在海外出售加密货币后,这些资金又是以什么名义回到国内的呢?
第一大供应商员工与实控人前员工同名
资金流水疑点之三是,蓝宇股份实控人家族控制的企业荣升汇彩曾向与实控人同学控制的企业借款,时间为2019年-2022年2月,涉及金额120万元。
回复函显示,2019年至2022年2月,荣升汇彩与双进成之间存在资金拆借,金额共计120万元,原因为荣升汇彩在报告期除将房产对外租赁外无其他业务,由于荣升汇彩账上资金较少,而双进成实际控制人刘克与郭振荣为同学关系,故曾向双进成进行资金拆借并大多在当日或不久交付水电费及相关费用。
一家即将上市的公司,为何需要借款100多万支付水电费?是公司实际控制人口袋中没钱还是公司账上没钱呢?
招股书显示,郭振荣与其父亲郭宁、母亲杨元凤持有的无锡荣升汇彩科技有限公司向蓝宇股份提供房产租赁服务,截至招股书签署日,荣升汇彩向蓝宇股份提供租赁面积为3519平米,每平方米140元,2019年和2020年租金约46.92万元。
除了支付租金外,蓝宇股份还向荣升汇彩支付水电费,报告期内,租赁房屋水电费金额分别为27.86万元、25.74万元、29.73万元和7.37万元。
除了为蓝宇股份提供租赁服务,荣升汇彩还出租房屋给江阴常胜客食品公司和宝瑞置业有限公司。这意味着,荣升汇彩有充足的租金收入,水电费也无需出租方垫付。回复函显示,报告期内,荣升汇彩收到租金及水电费548万元,预缴电费475万元,费用足够覆盖开支。
即便从最朴素的现实商业逻辑看,荣升汇彩向儿子同学旗下公司借钱交水电费也很离奇。回复函显示,荣升汇彩的两大股东-蓝宇股份实际控制人郭振荣以及他的父亲郭宁—手中握有上亿元现金,借钱交公司水电费的说法显得格外荒诞。
蓝宇股份实际控制人郭振荣2021年股权转让获得现金3400万元,随后将1400万元用于理财,这说明他手中资金非常宽裕。回复函显示,郭振荣报告期内用于购买理财产品的资金高达8870万元,丝毫不差钱。
郭振荣的父亲也是千万富豪。回复函显示,郭宁报告期内购买银行理财资金高达4600多万元,而且他仅代收荣升汇彩租户房租及水电费就有172.64万元。此外,郭振荣的母亲报告期内购买货币基金和股票1500多万元,还代收了荣升汇彩租户江阴市常胜客食品有限公司和江阴市宝瑞塑业有限公司的房租及水电费200多万元。
整体看,报告期内,郭振荣及其父母合计购买理财接近1.5亿元,收取荣升汇彩房租及水电费约370多万元,何至于要向郭振荣的同学公司借钱缴纳水电费?
招股书及回复函显示,蓝宇股份与双进成及其实际控制人刘克有着更为隐晦的关系。
企查查显示,张家港保税区双进成化工贸易有限公司成立于2014年8月,注册资本81万元人民币,实缴资本20.25万元,公司法定代表人为刘克。公司股东为江大虎持股51%,刘克持股49%。
招股书显示,张家港保税区双进成化工贸易有限公司以及刘克控制的另一家实体上海本仓科技贸易有限公司为蓝宇股份的第一大供应商,双方自2014年开始合作。
回复函显示,2019年-2023年,双进成贸易及上海本仓科技贸易有限公司累计向蓝宇股份销售8107万元表面活性剂等助剂及色料。
双进成贸易2021年-2023年的年收入分别约8100万元、8300万元、6500万元,规模较大。但是,企查查显示,该公司2023年仅有一名缴纳社保的员工,这似乎与其庞大的收入矛盾。
不仅如此,工商变更记录还显示,刘克是2022年10月24日才成为这家公司的股东及法定代表人,之前的法定代表人及股东为袁南铨。
这个时间点非常微妙,蓝宇股份2022年9月30日向深交所提交招股书,而双进成贸易作为报告期内第一大股东,实际控制人突然换成了蓝宇股份的同学,是巧合吗?
刘克名下的另一家公司上海本仓科技贸易有限公司成立于2019年11月,注册资本100万元人民币,实缴资本50万元。这家公司和双进成贸易一样,参保人数同样只有一人。看起来,刘克能力超群,不需要雇佣太多员工就能把公司营收做到近亿元。
企查查显示,上海本仓科技贸易2021年2月8日发生了一次工商变更,监事陈云霞退出。
而在蓝宇股份的回复函中,也出现了一位叫陈云霞的人。这位陈云霞曾经担任过义乌蓝果儿贸易有限公司的法定代表人和唯一股东。回复函称,陈云霞为郭振荣的前员工,曾为其代持义乌蓝果儿贸易有限公司的股份,该公司于2021年12月注销。
那么,这两名陈云霞是不是同一个人呢?还是很巧合地,郭振荣和他的好同学刘克都曾经拥有过一位叫陈云霞的员工?
桑本谦:民法的起源:一个思想实验
一、问题和视角
先来假想一场清代的诉讼。假定原告是个地主,被告是他的佃户。原告起诉被告称:租佃期间,被告没有如约交付租谷;租期届满后,也没有如约返还田地;发生争执时,其还打伤了自己的妻子。被告反诉原告称:今年天旱歉收,原告曾答应减免租谷三石,事后反悔,且指使其妻子来家无理凶闹,租期届满前就要强行收回田地。
这是一起典型的租佃纠纷。这类纠纷在中国历朝历代都会引起大量诉讼,属于常见诉讼类型。其案情也是最普通不过,租佃纠纷差不多就是这个样子。按照那个时代的司法制度,原告起诉必先提交书面诉状,自己写不了就得请人代书。县官每月只有几天处理纠纷,其主要身份还是行政官员。
县衙大堂是临时法庭,审案暖阁靠近北面高墙,暖阁后的一把太师椅就是县官的座位。衙役们手持竹板站立两旁,大堂中间铺着青色石板两块,原告和被告就跪在石板上。他们不是相对而跪,而是共同跪向县官,一抬头就看到迎面高墙上悬挂的金字匾额,上书“明镜高悬”。稍一转眼,两根立柱上雕刻的字迹便清晰可辨,读下来是对联一副:“欺人如欺天毋自欺也,负民即负国何忍负之。”
审理案件时,县官听取原告和被告陈述案由,其间可以随时发问,也可以随意呵斥。一旦发现陈述可疑,县官可能脸色立变,用醒木敲击桌案,啪啪作响,衙役们跟着呼喊“威武”。原被告战战兢兢,有时被吓得张嘴结舌,生怕竹板随时打在自己身上。搞清楚是非曲直之后,县官可当日宣判,也可随后判决。事后,当事人双方还要提交“遵依结状”的誓约书,表示服判,至此,才算案结事了。
县官的裁判依据,首先是当事人签订的合约,所谓“民有私约如律令”,审理的原则是“任依私契,官不为理”,相当于当代的“私法自治”。纠纷通常起因于约定遗漏或约定不明,县官需要以外在的依据来填补或矫正合约。外在的依据来源很广,笼统地说却不外乎“天理、国法、人情”。但其实只有“天理”和“人情”,因为中国古代的法律并没有提供可以补充或矫正合约的默认规则。
默认规则又被称为“缺省规则”(default rule),是个从计算机领域移植的概念。其之所以听起来词不达意,是因为“default”一词自始就被翻译错了。英语中的“default”有很多含义,包括错误、违约、缺省以及默认等,而恰当的翻译应是“默认”;但计算机领域的先驱者却将其错译为“缺省”,于是就有了“缺省规则”的概念。虽然“默认”和“缺省”的含义相关——“默认”意味着原本需要声明的事项可以被“缺省”,但缺省的说法并不直观。因此,这终于让计算机领域的新人们忍无可忍,将“default”重译为“默认”。但语言的惯性却让“缺省规则”的概念沿用了下来,还扩展到了包括法律在内的其他领域。但考虑到绝大多数法律人对“缺省规则”并不熟悉,且传统法学中也没有这个概念,所以笔者才恢复“默认规则”的说法。与其因循守旧,不如正本清源。
在法律语境中,默认规则,是指在当事人没有另行约定时法律提供的广谱适用规则。它似乎只存在于合同法中,很多美国学者就是这么认为的,但笔者会在更宽泛的意义上使用这个概念。强行法是最古老的立法模式,默认规则出现得较晚,但当其数量足够多、规模足够大的时候,就自然分化成一个新的法律部门——民法。
在罗马法诞生之前,强行法是世界各国的通用立法模式。立法者意识不到法律可以表述为默认规则,即使偶尔出现有默认规则性质的条文,数量也相当稀少,几乎没法辨识为一个类型。这并不奇怪,因为在古代立法者看来,违约、侵权与后果更严重的犯罪只有程度上的区别,都是做错了事,伤害了别人。致力于控制违约、侵权和犯罪的法律也只有程度上的不同,它们在性质上是一样的,在表达上也是一样的。于是我们在古代法律中看到了“诸法合体”。
但是请注意,“诸法合体”不等于“以刑为主”。刑法和民法是相互对应的概念,没有民法就没有刑法,反之亦然。虽然中国古代有“法即是刑”的说法,但那个时候的“刑”和现在的“刑法”显然不是一个意思。倘若非要用现在的法律概念去描述古代法律,毋宁说古代法律是“以侵权法为主”,其主要内容更像现在的侵权法,很多犯罪是被当作侵权来处理的。刑法的范围很窄,大概只有中国古代的法律才更像刑法,甚至有点“泛刑法化”的特征。
但即便如此,中国古代司法者也早已发现,审理民事案件和刑事案件是性质不同的工作,因此区分了“理讼”和“断狱”,大致对应现在的民事诉讼和刑事诉讼。“断狱”基本上属于惩罚过程的组成部分,抓捕罪犯之后,官府还要进一步核实案情真相,评估罪行轻重,以便作出恰当的惩罚(通常就是刑罚);而“理讼”,其主要功能则是解决纠纷,分清是非曲直,以便恰当分配各种类型的事故责任(通常只是赔偿)。鉴于两者有很多相似点——都要搞清楚案情真相,都要依据相应的法律,并且都要对伤害行为作出惩罚,所以古人把两者合称为“狱讼”,就像现代人把各类诉讼统称为“司法”。
然而,将中国古代的“理讼”称为“司法”并不恰当,因为裁判者根本无法可依。“天理”和“人情”都不是法律,中国古代其实没有民法。笔者知道这么说会招来非议,因为关于中国古代有没有民法,支持者和反对者都能讲出一堆理由,至今尚无共识;但分歧不在于对事实的认知,而在于对事实的定义。倘若说中国古代纵有民法亦无罗马法意义上的民法,估计正反双方就都不会反对了。
虽然一句话就能化解一场争论,但想要把问题彻底搞清楚,即“没有民法的古代司法会是什么样子”,那就要结合诉讼的背景了,而上述问题也就自然转化为:同样是审理民事纠纷,古代司法的裁判依据和裁判过程有何不同?用以对比参照的可以是现代民事司法,也可以是古罗马的民事司法。只要我们搞清楚,在没有民法的条件下,官府怎样处理纠纷,由此而生的缺憾又在哪里,笔者就能发现民法起源的契机,理解民法的独特功能,知道法律为什么会分离出一个新的功能模块。因此,完成这个任务并不需要去考察罗马法的历史。不过本部分开篇假想的这起租佃纠纷,却可以拿来作为讨论的素材。
二、合约的遗漏和补充
地主和佃户,作为原告和被告,他们都有道理可讲,只是讲的道理不同。原告的道理基于双方约定,被告的道理基于当地习俗。市场原则要求合约必须遵守,但习俗却认可一种例外——若逢天旱歉收,地主就理应减免租谷。纠纷貌似起因于市场原则和道义原则的天然冲突,而许多学者就是这么认为的,他们会说民间发展出减免租谷的道义原则,就是为了对冲市场原则的冷酷无情。但其实不然,减租习俗仍在市场原则之内,其内容相当于一个保险条款。只要存在减租习俗,且被广泛认可,那么作为减租的对价,地主在丰年收取的租谷,就会比没有这个习俗时更高一些。两者的差额相当于保险费——既然佃户已在丰年多交了租谷,那么到了荒年,地主减租就是理所当然。保险条款的合理性在于地主比佃户更有能力承担歉收的风险,因而所谓“减免习俗”,其实只是合约之外的默认条款。多数地主和佃户都愿意接受的默认条款,就成了默认规则。
然而,作为默认规则的减免习俗有些过于笼统粗疏了。大家都知道有这个习俗,地主和佃户也都认可接受这个习俗,但在何种条件下减免多少租谷,却从来没有一个统一标准。对于不容易约定清楚的事项,地主和佃户都会倾向将其省略在合约之外。但这倒不至于造成多大的麻烦,地主和佃户都要顾忌自己的名声,也都想长期延续租佃关系,通常情况下双方都懂得克制和收敛,不至于向对方提出过分的要求。
但纠纷总是难免的。当合约不完备,且默认规则笼统粗疏,填补不了合约漏洞时,最容易发生纠纷。好在这类纠纷不难处理,以前述案件为例,县官很快就能搞清楚案情原委,当天即可宣判:“租谷还须即时交付,减租多少则由县官酌定;租期届满,田地如约归还;打人要受到惩处,被告当庭被处以掌责(打耳光)。”如此判决,即使在现代人看来也较为合情合理。但其中却隐含了一个“软肋”——“酌定”。由县官“酌定”减租多少,但若当事人追问其“酌定”的依据,县官就不好回答了。
在这起简单的租佃纠纷中,我们看到了权威和规则之间的相互替代。如果裁判者的权威足够强,自由裁量就可以替代预设的规则;如果裁判者的权威较弱,就只能用更多的规则来压缩裁量空间。县官酌定减租额度,仍能让当事人双方心服口服,这固然值得庆幸,但维持这种局面并不容易。如果当事人双方或一方怀疑县官的能力和品质,就很容易陷入恶性循环——怀疑会侵蚀公信力,公信力被削弱就会刺激更多的怀疑。此时,只有按预设的规则作出裁判,才能让当事人相信裁判公正,对事不对人。预设的规则有如下功能:(1)指引和约束裁判;(2)维护和拯救司法权威;(3)便于当事人预测裁判结果,从而减少未来的纠纷数量。
但是,规则从何而来?直接由最高官府出台固然是好,但就减租事项而言却显然行不通。各地自然地理条件差异很大,降雨状况也年年有别,国家很难出台全国通行的减租标准。因此,这个任务就只能落到地方官府的头上。假定地方官府打算解决这个难题,原则上,只要这类租佃纠纷频繁发生,官府就可以积累判案经验。对于天旱、歉收和减免之间的相关性,官府能逐渐总结出一套可大致量化的操作指南。如果官府将这套操作指南明文发布,则地主和佃户之间的大部分潜在纠纷就可以防患于未然。至于如何拟定明文,却是个很有技术含量的工作。
降雨量不难测量,但降雨还要分时节,且不同田地质量不等,产量不一,因而对于在何种情况下减免多少租谷,官府很难作出硬性规定,也没法用几个简单的条文概括出来。最恰当的做法,莫过于发布按年度动态调整的减免标准——分别根据当地夏秋两季的降雨情况,每年发布两次减租比率,比率的基数是地主和佃户约定的租谷数量。当然,丰年无须减租。
为了更好地回应市场需求,还应附加声明如下:官府发布的减租标准,只在地主和佃户没有约定或约定不明时适用。换言之,当事人另有约定的除外。如此发布明文,意味着官府细化了关于歉收减租的默认规则,但没有改变默认规则的性质。默认不等于强制,官府允许当事人约定排除默认规则的适用。
假定某个佃户对自己的抗风险能力颇为自信,官府的减免标准对他来说就没什么意义。为了在租佃合约中争取到较低的租谷数额,他宁可在荒年歉收时放弃要求地主减免租谷的权利,那么这么做也完全合乎市场逻辑。只要相信佃户的抗风险能力,地主也不会反对。在这个意义上,官方标准是中立性质的,并非单纯保护佃户的利益。其既没有剥夺任何一方的选择权,也没有改变租佃关系的利益格局,更没有冲撞市场原则。
但这里有个条件,倘若佃户和地主一致同意拒绝适用官府发布的减免标准,双方就必须在合约中作出明确约定。那些接受官方减免标准的地主和佃户,却无须就歉收减免事项作出任何约定,因为在没有约定的条件下,官方标准就是默认的合约条款,它们自动进入合约,成为合约的组成部分。所谓官方标准,只是以官府名义发布的主流交易模式,为绝大多数地主和佃户所采用接受,因此可以被视为默认规则。说白了,官府发布的减租标准,只相当于提供了一样免费的产品,当事人可用可不用,就像好心人在路边免费提供的大碗茶,想喝的端起来就喝,不想喝的直接走人。但和大碗茶不同的是,不想喝茶的人不需要作出声明,沉默表明他不想喝,但不愿意接受默认条款的当事人却必须作出明确约定,没有约定或约定不明的就会被推定为同意接受官方标准。也就是说,虽然默认规则没有强制性,但沉默的含义却是被官府强制规定的。当事人可以自行决定他们是否接受默认规则,但他们不能改变沉默的含义。
但官府不能随意规定沉默的含义,沉默的含义是接受还是拒绝必须合乎统计学的逻辑。如果接受者占多数,拒绝者占少数,那么沉默就表示接受,拒绝者需要另行约定或额外声明;反之,如果拒绝者占多数,接受者占少数,那么沉默就表示拒绝,接受者需要另行约定或额外声明。让多数人保持沉默,只让少数人发出声音,就可以用最少的声音、最多的沉默来区分接受和拒绝。因此,官府发布的默认规则应该是主流的交易模式,这样才能让多数当事人以沉默表达接受。这是降低市场交易成本的一种策略。
默认规则的道理很重要。法律不是个深奥的领域,默认规则的逻辑只是稍微深奥了一点点,但它是理解法律(尤其是民事法律制度)不可或缺的理论工具。不明白这个道理,就看不透民法的深层逻辑。默认规则的逻辑还涉及对法律功能以及法律和市场关系的基础性理解,其相对于当下的主流,应该是个革命性理解。不过写到这里,笔者突然意识到前面的分析中很可能有个遗漏:既然官府可以发布动态调整的减免标准,那么按理说,无须官府发布,类似的减免标准应该可以自生自发地出现在民间的租佃市场上;也就是说,租佃市场每年都会出现关于减免多少租谷的“市价”。尽管“市价”减租的比率不详,但作为租佃双方的博弈结果,其性质与任何商品的市场价格没什么两样。
笔者想知道真实的历史是否如此,于是查阅了相关文献,果不其然,历史记录和笔者的想象居然一模一样!社会学家凌鹏在清代同治年间四川巴县的案件档案材料里找到了11份租佃合约(作为案件证据留存),其中有8份明确约定了减免租谷的事项。多数合约里有一句套话——“若年岁欠丰,照市纳租”,意思就是遇到旱涝灾害,就按市价减租;市价就是个按年度调整的减租比率,比如,去年天旱歉收的减租比率是七折,今年丰收没有折扣,明年可能是八折或九折。但有1份合约拒绝参照市价,而是直接约定了“年岁欠丰”就按七折交租——“主七客三均分,不得争论”,如此约定倒也省去了认定市价的麻烦。
在这11份租佃合约中,有3份没有约定减租事项(这是合约的遗漏吗?),还有1份明确拒绝减免事项——“其有年岁欠丰,并无短少升合”,意思是无论丰年还是荒年,佃户都要如约缴纳租谷。但有趣的是,官府对这几起案件作出的裁判,都是按市价减租。怎样评价官府的裁判?
对于没有约定减租事项的几起案件,官府裁判按市价减租是合理的,因为默认规则可以自动进入合约,成为合约的组成部分,这一点无可争议。一旦有了默认规则,合约里再写上“若年岁欠丰,照市纳租”,反倒多余了。但对于那起明确约定拒绝减免事项的案件,官府的裁判就犯了个错误,把默认规则当成了强制性规则。如此,裁判会给租佃市场造成一系列负面影响:激励佃户的机会主义行为,为了在丰年缴纳较少的租谷,和地主约定荒年无须减免,但却事后毁约,导致纠纷数量增加。同时,这样的裁判会让地主不再愿意接受这种约定,导致由佃户承担歉收风险的租佃模式趋向瓦解,而当事人双方要想恢复这一租佃模式,却不得不相互防备,被迫承担更高的交易成本。
三、黑白清单与路线图
虽然关于“年岁欠丰”时的减租标准可以自生自发于租佃市场,但若官府参考市价后再以官方的名义发布,则仍然意义重大,因为这么做不仅省却了租佃双方认定市价的麻烦,避免了可能由此引发的纠纷,还让减租标准更加权威,使市价直接获得官方背书。无论是用于补充合约漏洞,还是用作审理案件的依据,如此一来都会显得更加名正言顺。如果官府真的这么做了,则将开创中国法律史上的一次伟大革命。
这么说也许有点夸张,而且中国历史上可能已有官府确实这么做过,只不过做得默默无闻,谁也不觉得这么做有多么了不起,更谈不上什么革命。也许有学者会说,《唐律》难道不是更伟大吗?但这是没法比较的,因为标准不一样。《唐律》的立法技术高超,内容和体系也高度成熟,但其立法模式却是沿袭前代,并无实质性创新。至少就保存至今的法律文本而论,中国古代的立法者从没想到使用默认规则,也从没想到默认规则的立法模式可以开创出一片亘古未有的法律天地。所以,并非社会没有这种需求,而是立法者确实没有想到。
与世界历史上绝大多数国家的法律一样,中国古代的法律采用了“负面清单”模式,简称“黑清单”,即法律罗列禁止事项,并规定相应的后果(惩罚),相当于“举黑以示白”。与负面清单对应的是“正面清单”,简称“白清单”,即法律罗列允许事项,并规定相应的后果(免罚),相当于“举白以示黑”。如果忽略法律的实施成本而只考虑法律内容的话,那么理论上,黑清单和白清单是可以相互替代的两种模式,“举黑以示白”和“举白以示黑”的结果都是黑白分明。
假如要完成一幅画,画面需要黑白分明:如果白色的面积比黑色大,那就最好用块白板,再用黑色染料把一小部分涂黑;而如果黑色的面积比白色大,那就最好用块黑板,再用白色染料把一小部分抹白。这个工作原理很简单,涂黑就不用抹白,抹白也无须涂黑,同时还要尽可能利用板面底色以节省染料和力气。
立法遵循同样的逻辑。沉默相当于板面的底色,使用黑清单就不用白清单,清单之外的事项是被默许的;使用白清单则无须黑清单,清单之外的事项是被默否的。但即使在专制的社会里,法律允许人们做的事项也会远远多于禁止事项,所以自古以来,黑清单就是主流的立法模式。世界上没有哪部法典会详尽罗列一张白清单,明确允许人们吃饭、睡觉、交友、结婚、生子……罗列完毕后,再告诉人们到此为止,清单之外的事情一律不能做。
如果确定使用白色板面和黑色染料,那么白染料就可以存而不用,除非我们还需要在黑色中涂上一点白色。立法也会少量使用白清单,但前提是白清单要以黑清单为背景。比如,法律禁止私斗,这是黑清单;但允许私斗中的正当防卫,就是黑清单中的白清单。至于正当防卫中的防卫过当,则又成了白清单中的黑清单。
总之,在某个特定的范围内,如果法律允许的事项占了多数,立法者就会用沉默表示许可(默认),而把禁止事项罗列出来,此时立法采用黑清单,以禁止性规范表达;而在另一个特定范围内,如果法律禁止的事项占了多数,立法者就会用沉默来表示禁止(默否),而把许可事项罗列出来,立法采用白清单,以授权性规范表达。禁止性规范的背景是大量的默认,授权性规范的背景是大量的默否。
这种统计学意义上的信息传递技术是通用的,核心在于如何有效利用沉默的信号。沉默是一种最低成本的信号,我们总是将沉默和最常见的现象和属性捆绑在一起,从而用最少的声音来传递最多的信息。这和我们会利用板面的底色以便在绘画时节省染料和力气是同样的逻辑。用沉默就可以传递的信息,为什么还要说出来?
当然,法律是需要明示的,而且需要公之于众。法律是由国家创设的激励机制,通过改变人的行为预期来影响他们的行为。惩罚和奖赏都是激励措施,当然奖赏的场合要远少于惩罚,只偶尔用于突出贡献和重大立功,这算是不同于白清单和黑清单的“红清单”。
奖赏和惩罚都是非常古老的激励机制,在生命世界里早已进化得十分完美。有利于基因扩散的行为会获得奖赏,不利于基因扩散的行为要受到惩罚。但奖惩机制的执行——激活快感神经回路和痛感神经回路,都是很耗能的,所以对于诸如细胞分裂、新陈代谢、血液循环以及内脏器官的正常活动等绝大多数“行为”,有机体不赏也不罚。
社会类似一个有机体,增进社会福利的行为会使人获得奖赏,减损社会福利的行为会使人受到惩罚,但奖赏和惩罚都会消耗成本,所以对于大多数行为,社会不赏也不罚。与有机体相比,社会的奖赏规模貌似小得多,但其实不然,社会的奖赏主要来自市场,而不是来自国家,大多数增进社会福利的行为都能从市场上获得回报。如果把声誉也看作一种市场要素,那么市场机制还包含了好评和差评。国家创设的奖惩机制只是从社会奖惩机制中分化出来的一小部分。
只有奖赏和惩罚才是可观察、可度量的制度要素。对于法律来说,权利、义务、责任、规则之类的概念,都是被推测出来的,看不见也摸不着,这些概念说到底只是描述了一个稳定、可预期的奖惩结构。当我们说拥有一项权利或承担一项义务,或存在一条规则的时候,稳定的奖惩结构就是唯一的结论性证据。责任的概念可以为惩罚创造借口,当我们要惩罚某个行为的时候,就会说行为人承担了某种责任。但请注意,这里的因果关系是颠倒的——不是责任引起了惩罚,而是打定主意要惩罚他,所以才说他有责任。责任只是一个借口,借口不等于原因,但以借口取代原因,可以保持思考的懒惰,这是一种节能的策略。
无论是黑清单还是白清单,都可以保护公民权利。其实保护权利的最好方式莫过于惩罚侵权行为,这意味着保护权利甚至无须借助“权利”的字眼。笔者至今不是特别能理解,为何法学界对于权利概念有种宗教般的迷恋。这个概念也许确实很重要——无论是作为语言习惯还是作为职业包装,其功能都是其他词汇难以替代的。但若将其作为法学学科的分析工具、度量尺度、研究单元或基础范畴,那就不合适了。
既然法律主要采用黑清单模式,那么立法者将“户婚”“贼盗”“职制”“捕亡”“断狱”等各领域整合进一部法典也就毫不违和了。“夏有乱政,而作《禹刑》;商有乱政,而作《汤刑》;周有乱政,而作《九刑》。”战国时期的《法经》六篇,基本上也都是“刑”。难怪那个时代的古汉语中,“法”和“刑”是同义词,因为原本就是一回事。所谓“出礼而入刑”,说的就是白清单和黑清单之间的无缝衔接,但“礼”不成文。如今法律概念的外延已经大大扩张了,但其中那个最像古代法律的部分仍然冠了个“刑”字;当然,这个字的含义变窄了。然而所谓“诸法合体”,只是现代人对古代法律的描述,古人没有“诸法合体”的概念。
初学法律时,笔者曾以为法律只用黑清单就足够了,虽然知道罗马法是那个时代的例外,也知道法律人对它推崇备至,但笔者多少还是有点不以为意。然而很多年以后,当笔者明白黑清单模式的法律不能完全满足解决纠纷和促进交易的社会需求时,才真正理解了罗马法的伟大之处,尽管不是法律人通常所说的那些伟大。简单地说,古罗马的民法,既没有采用黑清单,也没有采用白清单,而是采用了路线图模式。
所谓路线图模式,即立法者给人们画了一条路线,至于走不走,还是由当事人自己来决定。导航提供路线就是如此,真实世界里的道路也是如此。笔者从青岛开车去济南,可以走济青南线高速路,也可以走济青北线高速路,还可以走不收费的国道,甚至可以选择不开车,不走任何道路,而是翻山越岭走一条直线过去。但只要没有特殊情况,笔者还是会开车走高速,而且选择的路线就是导航默认的那一条。
四、罗马法怎样处理纠纷
想象一下,假定一个人出门在外有事耽搁了,三五天都回不了家,邻居发现他的马无人照料,就主动帮忙给马喂食,直到这个人回家。事后这个人知道邻居帮了他一个大忙,但却没有给邻居任何回报。邻居向他表达不满,认为他至少应该补偿其这些天喂马的饲料钱,而这个人却对邻居说:“谁让你多管闲事呢,反正我事先也没求你这么做。”如果邻居和这个人的纠纷闹到法院,法官就要作出裁断。但在黑清单模式的法律中,法官却找不到裁判的依据——法律不会禁止人出门,也不会禁止人帮忙照看马。
再想象另一种情形,一个人在街道上把马拴好之后,就进某个餐馆去吃饭了,等他出来之后发现有个好心人帮他喂了马。他说了声谢谢就打算离开,但这位好心人却向他索要喂马的饲料钱。这个人当然不会同意,便说:“谁让你多管闲事呢,反正我事先也没求你这么做。”如果好心人和这个人的纠纷闹到法院,黑清单模式的法律同样不能提供裁判依据——法律不会禁止人吃饭,也不会禁止人喂他人的马。
当然,即使在黑清单模式之下,法官同样能作出合理的判决,只不过判决的依据不是法律,而是所谓的“天理”和“人情”。但罗马法就不同了,它能为处理这类纠纷提供近乎完美的法律依据。罗马法区分了物权和债权,在债权之中又分出了一个小类别,叫作“无因管理之债”,这个制度沿袭至今。邻居的行为构成了无因管理,其诉求合理,被帮助的人是其债务人;但同样是帮忙喂马,好心人的行为却不构成无因管理,其诉求不合理,被帮助的人与其没有债权债务关系。
罗马帝国的商业十分发达,法官需要处理各种交易纠纷,罗马法包含了一套相当完整的交易规则,为各种类型的纠纷提供了裁判依据。如果当事人签订的合约足够完备,原则上法官只需按合约裁断纠纷,而无须交易规则。其实如果地主和佃户签订的合约足够完备,县官处理纠纷同样是“任依私契”,官府也无须发布减租标准。但合约经常是不完备的,约定不明、约定遗漏甚或没有签约的情形都很常见,而交易纠纷恰恰最容易发生在合约不完备的地方,交易规则的主要功能就是应对合约的不完备。交易规则包含了一系列被广泛默认的交易选项,只要出现当事人约定不明或约定遗漏,这些交易选项就会自动进入合约,被法官推定为合约的组成部分。一旦交易规则被规定为法律,法官裁判案件就有了备用的依据。请注意,“备用”两个字极为重要,笔者稍后再作进一步解说。
邻居帮忙喂马,被帮助的人支付相应的报酬,这就是一种交易关系。虽然事先没有签约,但事后可以被还原出来,无因管理的法律规则提供了一个现成的合约模板。法官支持邻居的诉求,就是用法定的交易规则来填补约定的空白。但好心人帮忙喂马就不一样了,这里没有交易关系,即使回到事前,被帮助的人也不可能同意这笔交易。如果法官支持好心人的诉求,则等于鼓励强迫交易,这个世界就乱套了,不知会有多少人将被迫购买其不需要的东西。
罗马法包含的交易规则差不多覆盖了交易过程中可能发生纠纷的各个环节,能有效应对当事人对标的物、价格、担保、履约条件、时间、期限、签约主体等各种事项的约定不明或约定遗漏,这是个前所未有的立法成就。但是请注意,对“交易”的概念要作广义理解。罗马法区分了物权和债权,但并非只有债权对应交易,明确界定物权也主要是为了交易。毕竟在民法被分离出来之后,阻止明抢暗偷的任务就可以交给其他法律部门了。
考虑到产权本身就是交易的产物,那么侵权和违约就没什么实质性差别。和无因管理一样,侵权赔偿的法律规则也可以被视为一个合约模板。在当事人没法事先签约或签约成本过于高昂时,侵权和无因管理并没有什么实质性区别。侵权法存在的根本理由,就是加害人和受害人事先签约的成本过于高昂。
其实继承也是一种交易,生物学家就把抚养和赡养的关系叫作“代际交换”。法律保护继承权,规定赡养义务,就是为了促进长辈和晚辈之间的代际交换,阻止其中的机会主义行为。如果长辈和晚辈事先就继承问题签订合约,那么约定的结果多半会与继承法的原则大致吻合——晚辈获得遗产,但长辈能争取到支配遗产的权利。平均说来,只有让长辈拥有遗产支配权,晚辈才能获得更多的遗产,否则社会财富就会因为死亡而被提前挥霍。
罗马法甚至规定了容易引发继承纠纷的意外情形——如果互有继承关系的几个人在同一事故中死亡,却不能确定死亡的先后时间,那么法律就会推定没有继承人的人先死亡;如果死者中既有长辈又有晚辈,就推定长辈先于后辈死亡。法律如此规定与真相或真相的概率无关,而只是为了让遗产分割更加方便,也让晚辈死者的后代能够获得更多的遗产,这客观上有利于促进代际交换。如果所有利害关系人有条件事先就上述意外事件签订一个如何分割遗产的合约,只要他们足够理性,约定的结果也会与法律规定大致吻合。当然,这么做在文明社会中是很尴尬的,以法定取代约定,可以避免这种尴尬。
法定取代约定的最大好处,笼统地说,就是降低交易成本。合约不完备时,可由法定的交易规则做补充。反之,既然有法定交易规则作补充,当事人签约就可以保留更大的缺口,合约条款可以更加简约;因为在法律明确规定的事项上,当事人不必重复约定,除非他们要作出不同于法定交易规则的约定——法律为此预留了弹性,通常会表述为“当事人另有约定的除外”。在这个意义上,法定的交易规则只是裁判的备用依据。合同法属于典型的冗余设施,对于解决纠纷来说,合约是第一道防火墙,合同法是第二道防火墙。
为了区分不同的交易类型,罗马法大量使用了权利的概念,在物权和债权之下又细分了更小的权利类别,但不同类别的权利概念只是对不同交易类型的一种编码而已。罗马法之所以能成为人类文明史上的一座丰碑,不是因为它体现了更强的权利保护观念,而是因为它首次用文字全面记录、总结、编纂了可以显著降低交易成本的大量交易规则。显然,黑清单模式的法律并不具备这种功能。如果当事人约定不明或约定遗漏,法官只能根据天理、人情以及不成文的交易习惯来应对合约的不完备。但不成文的交易习惯充满了歧义和模糊,不仅会迫使当事人提高签约成本,而且会提高法官处理纠纷的难度,更难以保证原则上的同案同判。
本文在此顺便讨论一个热点问题,即在过去十几年编纂民法典的过程中,国内法学界曾经发生了一场旷日持久的学术争论——人格权是否应独立成编?一方认为,人格权必须独立成编,目的是保护人格权;另一方认为,已有的侵权法足以保护人格权,将其独立成编显得画蛇添足。显然,双方的争点在于独立成编是否有利于保护人格权,但问题的实质却应该是,黑清单模式的立法(侵权法或刑法)在何种条件下可以取代路线图模式的立法(默认规则)。只要搞清楚了争点的实质,答案也就浮出水面了。如果人格权已经出现了主流的交易模式,那么默认规则可以降低交易成本,人格权独立成编就是有意义的;但若人格权尚未出现主流的交易模式,那么默认规则也就没有用武之地了,以侵权法和刑法保护人格权就够了。然而,尽管从目前来看,人格权确无必要独立成编,但独立成编可为未来的人格权交易提供潜在的空间。如此,立法因为有了前瞻性而显得意义重大。
五、结语:为什么民法比民法学聪明
正统解说为无因管理设定了构成要件:(1)为他人管理事务;(2)有为他人谋取利益的意思;(3)无法定或约定的义务。邻居帮忙喂马的行为具足上述所有要件,而好心人帮忙喂马则缺少了一个要件,即“有为他人谋取利益的意思”。法官可以根据事实和情势认定好心人没有这个意思。构成要件从何而来?当然是来自归纳。立法者对大量同类纠纷做了总结,发现它们有几个共有的特征,然后就把共有的特征确定为构成要件。
但辨识和比对构成要件的司法技术是很拙笨的,因为还有更加简单有效的替代方案。替代方案的思路是还原合约——假想回到当初的时点,当事人是否以及如何作出约定。倘若回到当初,出门的人应该预料到离家之后马匹无人照料,便会同意邻居帮其喂马,并支付相当的报酬,因而出门的人和邻居是可以达成一份合约的。但同样是回到当初,进餐馆的人并不需要有人帮其喂马,因此不会和好心人签订喂马并支付报酬的合约。
法律最重要的功能就是促进交易,还原合约实际上是帮当事人克服信息障碍,法律通过条文和判例向社会释放促进交易的激励信号。法官支持邻居的诉求,就会鼓励更多人在别人确实需要帮助时满足别人的需求,判决的后果对社会有益;但如果法官也支持了好心人的诉求,则后果就对社会有害无益。
对比两种解说,差距是显而易见的。古罗马法学家创造的正统解说需要3个步骤:首先要区分出一种独特的交易类型,并将其命名为“无因管理”;然后归纳出这种交易类型的几个共同特征,并命名为“构成要件”;最后再将某个具体行为与预设的构成要件做比对,以判断该行为是否构成无因管理。掌握这3个步骤需要记忆和学习,如此便会形成知识壁垒;而当知识壁垒转化为职业壁垒之后,普通人就难以掌握专门化的法学知识了。
更糟糕的是,法官要判断好心人帮忙喂马是否真的出于好心,而且最终还是要看其和被帮助的人能否达成潜在的互利交易,这是判断管理人是否“为他人谋取利益”的唯一依据。这样一来,绕了个圈子又回到了替代解说的思路。相比之下,替代解说一开始就抓住了关键。正统解说非但没能简化思考,反而回避了表达,即该说的没说,不该说的说了一大堆。不过这依然值得庆幸,因为起码不至于导致错判;而如果法官真的陷进要件比对的思路中,完全回避还原合约的思考,错判的风险就会非常大了。
为什么古罗马法学家能创造出聪明的法律却没能提供聪明的解说?答案其实很简单,法律是演化的产物,经历了漫长的试错、检验、遴选和淘汰,在生态竞争中存活下来的一系列交易选项组成了交易规则;而古罗马的法学家只是记录、总结了这些交易习惯,将其体系化,然后用法律条文的方式表达为白纸黑字。虽然他们完成了这些工作,但他们却理解不了,也揭示不出法律的深层逻辑。这个深层逻辑就是交易习惯的进化算法,也就是隐藏在法律背后的数学结构。这就是为什么法律的智慧远胜于法学家的智慧。
在“知其然而不知其所以然”的条件下,古罗马的法学家只能在表面现象上下功夫,并由此创造了一种“现象理论”:先区分不同的交易类型,然后归纳不同交易类型的构成要件。司法的方法就是识别和比对要件,如果某个具体行为恰好发生在要件难以识别的灰色地带,司法就会遭遇疑难案件。但这里的问题是,如果仅仅是“知其然而不知其所以然”,那么古罗马的法学家又如何能制定出罗马法?答案很简单,立法的工作原本就不是创造法律,因为在此之前,市场和社会早就演化出了交易规则,只不过这些交易规则还没有成文而已。理解不是做对事情的前提。
这种路径的理论解说自然会导致许多尴尬局面。就像犯罪要有一套构成要件,违约和侵权也各自有了构成要件。但我们会发现,把侵权和犯罪的构成要件放在一起,并不能区分侵权和犯罪;于是就创造词汇,如“犯罪客体”这种毫无意义的概念就是为满足这个需要而被创造出来的。类似的例子是区分物权和债权,理论家创造出了“对世权”和“对人权”的概念,却没有意识到两个概念是不能并列的,凡是“对人权”也一定是“对世权”,因为没有产权就没有交易,互不侵犯是所有交易的基础和前提。一旦明白了造词是可以替代讲道理的,那么对于“事实物权”和“名义对价”之类的概念也就可以见怪不怪了:前者是为了解说诸如借名登记之类的物权不能对抗第三人,后者是为了解说没有对价的赠与承诺偶尔也会被强制执行,这两种例外情形都不能被扔进预先设定的概念篮子里。
来源:《人大法律评论》第35辑,“部门法中的田野研究”专题。
北邮15名研究生关于导师郑凤的联名举报信
前言
北京邮电大学是全国通信的最高学府,在通信学子心中有着无比崇高的地位。寒窗十余 载,我们终于成为北京邮电大学的研究生,我们珍惜这来之不易的学习机会和提升自我的机 会,怀着无限的崇拜和憧憬进入北京邮电大学信息与通信工程学院。然而十分不幸,现实给 了我们沉重的一击。自成为信息与通信工程学院郑凤老师的学生,我们就勤勤恳恳、兢兢业 业,尊重郑凤老师对我们的安排,听从郑凤老师的指导与指挥。然而,郑凤老师完全辜负了 我们的期待和信任、磨灭了我们对学习的热情和对未来的憧憬。相处时间越久,越发现郑凤 老师对我们就像是对待奴隶一样,越来越多与科研无关的事情占据了我们的时间,还伴随着 无限的侮辱与谩骂;越发现郑凤老师的科研水平如同儿戏,指导上只知道盲目催促进度,完 全没有任何科研和技术、方向上的指导;越发现郑凤老师道德底线混乱,引导我们做一些上 不得台面的事情。在巨大的身体压力和精神折磨下,大部分郑凤老师所指导的学生出现了或 轻或重的生理、心理问题(在前往北京医院检查的学生中,均出现不同程度的焦虑状态、抑 郁状态、睡眠障碍等心理问题,医生提示抑郁倾向、轻度抑郁、中度抑郁。),我们试图向 郑凤老师提出身体、心理上的问题,却获得了更令我们心寒的答案。对于郑凤老师的品行、 师德、学术能力,我们已经忍无可忍。因此,我们不得不向学院、学校求助。
郑凤老师指导的 2022 级、2023 级硕士研究生共 15 人(以下排名不分先后):2022 级 (许胜硕、曹月文、韩松轩、贾彬、简开智、刘满山、蔡凯、李永帅、王凯旋、王信冲、徐 任、张志)2023 级(胡佳玉、冯晓义、郝志文)。15 人共同参与此次举报。
经过 15 名学生的回忆与举证,罗列出以下有证据(包括聊天记录、录音等)的内容。 由于部分证据明显指向某些学生,出于对学生的保护,没有将这部分证据列出,仅对事实加 以表述,我们 15 名学生对后文内容负责,罗列事情均为真实发生。
此外,考虑到对学院、学校造成的名誉影响,后文主要针对郑凤老师在师德、师风方面 的不当行为进行阐述,对其他严重行为没有罗列。我们希望将师德师风行为不当这一部分事 实指出,证明郑凤老师不适合作为研究生导师;希望学校、学院能够明察秋毫,为我们所有 人更换导师,并且保护我们直到毕业。
1 情绪不稳定:人格侮辱与毕业威胁
实验室同学饱受心理折磨。郑凤老师情绪极其不稳定,常常破口大骂。
1.1 人格侮辱与隐私情况
郑凤老师说脏话已经不再掩饰,“你他妈”已经是常见的口头禅。除此之外,郑凤老师 对实验室同学的蔑视已经不加掩饰。例如: “吃屎了你!” “xxx(实验室同学名字)你就是个傻逼!” “你装什么孙子!”(多次)
此外,郑凤老师多次将学生单独叫到办公室,并要求学生删除聊天记录。郑凤老师不懂 得尊重个人隐私,有时也提出查看实验室同学的私人手机,迫于压力,许多聊天证据被删除。
除了上述已录音的内容外,郑凤老师常常当众控制不住自己的脾气,对实验室同学大发 雷霆。大发雷霆的场所除实验室之外,还有一些公共场合。
某次,郑凤老师带领几位实验室同学到某场所交流,该场所为马路旁边的公共场所。在 郑凤老师的印象里,进入该场所的方式只能是通过东门;但由于之前同学们前往该地方时, 负责人告知可以从北门进入,更加便捷,因此在等待老师的过程中,打车预先打到了北门。 郑凤老师在路上得知这一情况,打电话大骂该同学“恶心”。并在改道去东门后,站在东门 口大声辱骂该同学,旁边是人流和车流,路边是被辱骂的实验室同学。类似的行为还有很多, 而且常常由于事发突然,无法留下证据,但给实验室同学的心理健康造成了极大不良影响。
而在其他人(其他老师、其他学生)面前,她一直伪装成和蔼可亲的形象,前后差异极 大,令人难以置信。
1.2 毕业威胁与联络家长
实验室同学常常因为各种事情被郑凤老师直接说以节点威胁,因此同学们对郑凤老师惟命是从,不敢对郑凤老师的安排提出异议。
例如,2023 年 11 月 14 日,某同学被威胁开题不通过,而原因却是“不如实说谁拖了 后腿”,与开题内容毫不相关。将科研以外的各种事情都和毕业节点挂钩,这是郑凤老师的 口头禅,也是实验室同学常常听到的话。某同学给郑凤老师浇水时没有拿掉底座(底座没有 用处),而遭到郑凤老师的辱骂,并且郑凤老师补充“让你浇水都这样,我在想你科研怎么 做!”(并在辱骂后两分钟内让该学生去取郑凤老师的火车票。)
郑凤老师经常与学生家长谈心,尤其是特地指出“即将开题和中期答辩的同学”,并且 “希望见到各位家长”,怀疑存有贪污索贿的暗示。实验室同学均已成年,研究内容与家长 毫无关系,为什么要见到各位家长?
郑凤老师对“叫家长”一事情有独钟,尽管硕士研究生已经是二十多岁的人了,只要出 现她觉得触犯到她“威严”的事,郑凤老师就会直接联系其家长。入学时郑凤老师就下达命 令“我需要所有人家长的联系方式和工作单位及职务”,郑凤老师也会在自己需要一些东西 的情况下向有相关学生的家里进行讨要,并且曾明示暗示寻求“合作”,“礼多人不怪”。
2 科研以外的工作内容
在实验室,除了做项目、科研以外,还需要随时随地等候郑凤老师的各种差遣。
2.1 为郑凤及其家庭干活
据实验室同学统计,郑凤老师差遣实验室同学做了许多科研以外的事情,包括但不限于 全国高等院校师德集中学习教育(一百多课时);长期代取大量快递;长期早上 7 点召集多 名同学去食堂购买包子、鸡蛋(一人限购 4 个包子,两个食堂可购买 8 个包子,每次一般为 32 个包子,20 个鸡蛋);近一个月的时间召集部分同学为其抢购 mate60(即使是上课时间); 开车接送(朋友、家人、接送火车飞机、甚至是半夜打车去给其当代驾);日常出行打车也 是叫实验室的同学代其叫车;其女儿临近体育阶段性考试时查询北京相关规定要求,陪其女 儿进行乒乓球、跑步等训练、去住处给其女儿安装仰卧起坐设备;多次搬家、去其家里打扫 卫生,而且在打扫的过程中,如果不顺其意,还会遭到过分的指责甚至是辱骂;酒店开房; 买花、养花;骑电动车去离学校较远的地方取送东西,例如去商场退换货、维修等;预定饭 店;擦车;代其网购日常用品、退货等;给其女儿打印资料,其中很多需要图片转 word 后 再打印。要求实验室同学们做的事情事无巨细,不论大小;若有同学拒绝其要求,便会遭到 其过分的指责,因此,同学们不敢拒绝其安排。
可以看出,郑凤老师对学生的态度并不像对一名研究生,而是一名做杂工的工人、一位 随叫随到的奴隶。某同学在为其多次搬运重物后出现较严重肩伤,但在告知郑凤老师自己的 伤情后,郑凤老师说:“我相信我让你做的那些工作不足以让你受伤。”在得知该同学生病 的同日晚间的会议上,毫无前因后果的情况下说让该同学等着延毕吧,威胁之意令人心寒。 在选择保守治疗期间该同学依然正常工作学习,老师却在私下里和一些同学说,“他的伤这 不是没什么事吗?看起来也没什么问题,之前还说要做手术。”不但对学生的身体状况不管 不顾,甚至觉得学生去看病是没必要的。
此外,即使为郑凤老师做了如此多的工作,郑凤老师经常告诉某同学:“你就等着延毕 吧!”给该同学的心理带来了极大伤害,常常因此而焦虑失眠。
XX 同学曾因为给郑凤老师拖办公室的地,用水冲洗墩布时时间比较长(因为害怕郑凤 老师说洗得不干净)而被形容成“浪费国家水资源,居心叵测”,但她自己在实验室用公共 财产洗澡洗衣服时,任由自来水大量外流,造成大量的水资源浪费;而且,对于 XX 同学, 中间长达半年的时间里一分钱的劳务费都没有收到过,郑凤老师还经常派遣该同学为其早起 买早餐,买回来以后打扫办公室。
2.2 为其女儿做事
为其女儿做事包括但不限于:做作业、接送上下学、在其女儿参加重要考试时为其作弊。 对于实验室同学来说,接送上下学等体力帮助已经习以为常,但仍需要特殊提起以下两件事 情。
1、2022 年 12 月,要求几位同学帮助其女儿一起进行期末考试 郑凤老师告知学生:“这次考试非常重要”“北京市海淀区统考,网上没准儿会在开考 后一个小时散布答案。但是,答案可信度不高。仅供参考。。”等言论,并且寻找了多个同 学一起做题、对答案,生怕出现错误答案。 北京市中考执行过程化考核,这次考试确实十分重要,能够影响到其女儿的中考成绩。
2.2024 年 2 月 7 日前后为其女儿做创新比赛 郑凤老师担心其女儿中考失利,派遣两位同学为其女儿的创新比赛调研方向、制作材料、 攥写报告,每日汇报,甚至大年三十、大年初一等等重要法定节假日也不例外。
北京市中考执行过程化考核,创新比赛能够对其女儿的升学提供特殊贡献。虽然其女儿 并未参与创新过程。 这次科创项目最后以失败告终,郑凤老师要求参与同学为其道歉,虽然参与同学在那段 时间一直为科创项目努力,但郑凤老师以“项目进展缓慢”为由令其道歉。此后还曾打电话 指责两位同学“连初中的事情都做不好”。
2.3 与企业导师做事
实验室原有两名企业导师,实验室研三学生及已毕业学生在其指导下有一定论文成果, 研二学生在其指导下有一年时间,也做过发表论文的工作。但郑凤老师与两位企业导师都停 止合作(不再指导 2022 级、2023 级学生)。而后,郑凤老师带来了新的企业导师。
实验室内目前仅有这一位企业导师。该企业导师没有对学生进行过任何科研工作的指导。 此外,郑凤老师与该企业导师二人长期处于“和好-吵架-郑凤老师拉黑企业导师-郑凤老师和 企业导师通过学生进行交流”的循环。
二人的关系飘忽不定使得实验室同学非常痛苦,需要同时面对两位导师的情绪。
以 2023 年 2 月为例。2023 年 1 月 31 日,要求实验室部分同学前往南京,为企业导师 的公司工作一段时间。除实验室同学外,还要求两位未正式入学的保研同学前往南京工作。 此举事实上已经是违规操作,但未入学的两位同学并不知道,出于对导师的敬畏,依言前往 南京。
然而,两位老师关系严重震荡。2023 年 2 月 6 日到南京后,2023 年 3 月,两人之间无 限拉扯,学生们身在南京,但一会要求学生买票返校,一会要求学生退票,来回反复,朝令 夕改,而学生夹在中间左右为难。详细过程如下:2023 年 3 月 17 日,郑凤老师要求学生们 准备周一返回学校;3 月 19 日,要求同学们先不要行动,等待老师指令;3 月 20 日,告诉 学生“你们按原计划进行,先踏实工作,等到暑假再说。”3 月 21 日晚,要求学生第二天返 校。3 月 22 日,学生按要求返校。在这种境况下,学生们心理上很难不煎熬。
南京一事仅仅是两位老师关系的冰山一角。事实上,长期以来,二人的联系都需要学生 从中转达,转达的学生苦不堪言。稍有不慎,便会得到两位老师的加怒。某同学因不愿帮助 企业导师打扰老师,而被企业导师发消息责怪:“你不会有担当。只想迎合老师,你混个毕 业就行。”2024 年 2 月 14 日情人节,企业导师给学生发放 666 红包,让学生转发给郑凤老 师。许多类似暧昧的事情都指示学生中转,学生们也无可奈何。但长期被拉扯于二人中间, 十分焦虑与郁闷。
3 待遇情况
3.1 工资截留问题
2022 级硕士研究生 10 人,自 2023 年 2 月开学被安排到“联合培养基地”,也就是某 几个公司去实习,包括数据通信科学技术研究所、航天网安。合同签订时某公司对实习生的 工资要求写明的是每人每月 5000 元的实习劳务,而另一公司的平均工资也在每日 210 的水 平。但自 2023 年 6 月开始,实习工资变为 1500 元,给学生的解释是剩下的 3500 元会作为 我们表现的奖励发放,然而直到此材料攥写(2024 年 4 月 6 日),没有任何人收到过所谓 的奖励。
以某同学为例,2023 年六月份,工资陡降。此后一直到 2024 年 4 月 6 日,工资一直 保持在 1500 的水平,在基地工作的同学没有收到任何所谓“表现好就会发放”的工资。
更有某同学工作四个月仅发了一个月工资。
3.2 实验室使用设备(包括手机、电脑等)全部自费
实验室平时科研、工作都使用自费的笔记本电脑,并未配备工作电脑。但郑凤老师要求 自费的电脑断网,并未提到补贴。
3.3 劳务问题
实验室各同学并未在劳务上受到宽待。
在基地的同学除国家补贴外,仅有上述被截留的工资收入;即使他们每天晚上到实验室 为项目服务、开会、奋斗,也未收到任何补贴。个别同学被严重针对,半年多时间未曾收到 一分劳务。
为避免影响学院、学校声誉,这里不多提及。但是,不代表实验室同学在劳务上受到宽 待。
4 作息安排与加班情况
4.1 作息情况
一直到 2024 年 2 月 29 日,实验室作息时间为:上午 8:30-11:30;下午 14:00-17: 30;晚上 18:30-22:30,周六日及法定节假日会要求实验室同学拍照,并有不定时查岗。 每日工作时间达到了十个小时零三十分钟。
2023 年清明假期、五一假期、国庆假期、以及不定时间要求拍照
2024 年 2 月 29 日,实验室作息时间调整为上午 8:00-12:00;下午 14:00-17:30; 晚上 18:30-22:30。每日工作时间已经达到十一个小时零三十分钟。
2024 年 2 月 29 日调整作息
实验室部分同学白天在合作基地上班,下班后也需按要求来实验室。
4.2 实验室放假情况(全年无休)
实验室全年无休,部分小假期实验室拍照,部分长假期情况如下。
1.2023 年春节
2023 年春节,疫情解封期间,学校开始催促大家返乡,宿舍已经开始清楼,辅导员也在 催促,然而其并不为所动,依旧没有任何让大家返乡的意愿,还要求没封楼的同学去实验室 学习,丝毫不顾同学们的生命安全。11 月 30 号中午部分同学因为所在楼层感染人数过多, 同学们感到生命安全受到威胁,私聊郑凤老师请求请假回家,却得到带有威胁性的许可,之 后找到实验室所有同学一一问话,意图找出领头人进行惩罚。最终在 12 月 3 日,学校下达 最后指令要求返乡才同意返乡。
私聊其回家的同学至今仍遭到各种针对。寒假期间因为一次会议没有及时到位(该会议 于 10:20 在群里通知,与正式开会时间仅距离十分钟。之前并未提到该会议),就开始联 系该同学家长,并以“你家孩子问题很大”、“这样的孩子是毕不了业的”等语言进行打击 与威胁,造成学生家长的恐慌,严重影响了该同学与其家长的身心健康。
2.2023 年五一假期
除上述拍照打卡之外,2023 年五一假期,实验室某同学因家庭原因于 4 月 26 日晚向郑 凤老师请假回家,得到郑凤老师的许可。但第二天上午该同学家长就接到其电话,其在与家 长的电话中表示“家长能帮你毕业吗?”等,暗示这次回家的话后面就会得到她的针对。家 长接完电话之后担心忧虑,立即与该同学进行联系,说尽可能不要回家。后来该同学被迫打 电话与其进行道歉,称自己不应该提该诉求。
3.2023 年国庆假期
2023 年国庆假期,两位同学一起向郑凤老师请假,但因其中一位同学曾触怒过郑凤老师,为了打压这名同学,郑凤老师坚决不允许该同学请假,陪同的另一位同学请假成功。
之后,其他同学向郑凤老师请假,均失败,理由为“不提前半个月请假,无法安排项目 进展”。同时,9 月 28 日发消息说“10 月 9-15 日,实验室放假七天”,但又于 9 月 29 日 开会,当面说“所有想要请假的同学,家长必须来北京见我。”迫于家长不便远行,以及其 中暗含的威胁与索贿行为,实验室同学国庆假无人请假。
此外,实验室假期拍照行为是对于实验室同学的一种有形压力。当郑凤老师发现我们不 在实验室时,会询问我们去做了“什么有意义的事情”。每每回答郑凤老师的质疑,我们都 觉得充满压力。在假期、在晚上、第二天就要去公司上班/上课的前一天晚上,依然不允许我 们做“没有意义的事情”。仿佛只要不在实验室,我们的存在就是毫无意义的。
并且,在郑凤老师规定的放假时间 9-15 日,组内依旧没有放假。
4、2024 年春节
2024 年春节,实验室同学的放假时间在 2 月 7 日到 2 月 17 日。但短短十天内,召开了 十余场会议。其中有同学甚至在大年三十晚上也要按她的要求参会,千家万户团聚的时间, 仍有两名同学在参与项目会议并被威胁“找一个安静的房间,不许有声音”,这可是多少年 的传统佳节,在这个晚上变成了挥之不去的噩梦。据统计,每天都有同学按照要求开会,包 括农历年二十九、年三十、大年初一,过年最重要的三天,同学们也在被迫为其女儿制作创 新比赛材料、替代郑凤老师审核研究生盲审论文、开会讨论项目。
4.3 加班情况
虽然规定离开时间是晚上十点半,但每晚的十点半也并不是我们的实际休息时间。1、七点半开会,时长不定 自 2024 年 2 月 11 日(农历正月初二)开始,郑凤老师要求项目人员(2022、2023 级 所有人员等)每天晚上七点半开会,汇报进展。每天开会的记录持续到 3 月 27 日。
即使在开工以后,实验室同学们上课的上课,上班的上班,仍然要求每晚十点开会。实 验室部分同学每天要通勤 5 小时以上到去基地实习,回到个人宿舍已经将近晚上 8 点,且还 要为 10 点的会议工作,并且汇报材料的准备,常常开会至晚上 11 点,甚至更晚,实验室同 学的休息时间被严重压缩,长期睡眠不足。
2、不定时熬夜
曾在开会时多次提到“你们在公司能加班,在实验室也能加班,我们也需要一个小脉冲。” 并且曾明确说过强制熬夜加班的话。 “昨天晚上睡觉了吗?你没测出来你为什么睡觉?” “所有人加班,至少到十二点。我们也有一个突发。核心组同学这两天,最多休息六个小 时,其他时间全都在学习,全部在弄。然后你们的课都不要再上了!” “今天晚上我不管你们弄到几点,我希望你们今天晚上给我一个阶段性的说法,明天早上 给我一个结论。明天早上八点钟把我所有想修改的东西修改完。” 以及各种“今天晚上不睡觉也要把东西弄出来!”等,并且多次暴跳如雷,认为实验室 同学没有认真熬夜做项目。
4.4 开会频率
2024 年春节,实验室放假时间为 2 月 7 日-2 月 17 日。但期间每个人都参与十次以上的 会议,可以说,春节假期仅仅是换了地方工作。
此外,春节假期以来,直到 3 月 29 日,依然每天晚上开会。并且号称“每天必须有进 展”。而且要求必须有书面文档进行汇报。
据不完全统计,自 2024 年 2 月 11 日至 2024 年 3 月 29 日之间 48 天,腾讯会议记录共 41 次,时长统计如下:
实验室相当部分同学白天需要在项目组上班,下班后到实验室继续学习,准备开会材料, 晚上十点按时参会讨论,会议多次超过晚上十一点。会议期间常常受到郑凤老师的侮辱、谩 骂。人格与尊严都被践踏,同学们都身心俱疲。
4.5 但凡说话惹郑凤老师不愉快,就需要不停道歉、写检讨
如,某同学在郑凤老师催促进度时苦笑,被郑凤老师认为是“冷笑”,是在嘲讽她,而 后在当日会议中多次因此事表达自己的不满,即使该同学不停道歉,郑凤老师依旧不依不饶。
“xx 你不要冷笑了 xx,你冷笑不就是在挖苦老师吗?你认为老师听不懂是吗?你冷笑 什么意思 xx?”
“你还在那冷笑。搞笑!你觉得你这么敷衍说几句对不起就解决问题了吗?只能说你 的人品有问题你在 PUA 老师。有意思吗!”
“你觉得老师问这些问题是闲的吗!这不也是为了项目进度吗?以后这种问题不要让 我来问,xxx 你来问,我不当这个狗了!这种问题都提前问好!如果问不好我来找你, 你和 xxx 来当这个狗!”
xxx 我告诉你吧!开题虽然比 xx 早了一个人,但是你的开题是呼噜呼噜的什么也没有, 你不要觉得自己挺牛逼的!老师如果让你中期过不了的话你照样过不了!切,你什么 态度!你对于学术!
你不要 PUA 老师知道吗?老师想 PUA 你很简单的!我希望你不要主动 PUA 老师。你 的冷笑你觉得是在给老师难堪吗?只能说你是一个不会讲话的人。
从郑凤老师的话语中不难看出,任何她不满意的事情都会以节点作为威胁。
此外,但凡出现失误,郑凤老师都要求写检讨、自我批评、反思,当众检讨自己的错误。 多数反思是郑凤老师以打电话等方式转达给其他同学,其他同学进一步转达给“郑凤老师认 为需要检讨的同学”,这一事实长期存在,常常有学生因不明原因触怒郑凤老师,而在学生 群里或当面道歉检讨。
4.6 郑凤老师的权威
可以看出,郑凤老师的权威无人敢挑战,因为开题、中期、毕业等等节点都掌握在郑凤 老师一人手里,但凡惹郑凤老师不快,就会面临延期危险。
例如,郑凤老师在毫无证据的情况下,全盘否定实验室某非全日制同学当周工作量少, 致使该同学气愤地离开会议,这也彻底惹怒了郑凤老师,之后一直以各种理由不允许该同学 开题,并且种种迹象表明,郑凤老师并未认真看过该同学的开题报告,而是转给其他同学进 行点评。直至 2024 年 4 月 6 日,该同学仍未开题。
郑凤老师也曾当众说过:“我不允许我的权威被任何人挑战。”
5 德不配位,没有指导
5.1 学术能力与教学能力
作为北京邮电大学信通院的一位理工科副教授,居然不知道均方误差、均方根误差(事 实上,在每天的开会过程中,学生经常汇报这些指标的含义与进展)的含义、概念,足见其 学术能力堪忧,且每天都在无效开会,郑凤老师并不详细听学生汇报,只会说一些假大空的 话,催促进度。
“前面那些指标,人家知道什么意思吗?比如说什么,什么均方根误差、绝对均方误差。 这些指标是大家看文献都用到的吗?业内的人都知道这些指标吗?不是你们自己瞎编的 吧?”
此外,郑凤老师多次要求实验室个别同学充分了解项目内容,以代替郑凤老师在项目答 辩时的汇报、答辩。扬言“不要指望我回答”。 “我要找一个能够在项目上给我去汇报、去总结···你们至少能应对专家的每一个回 答。别指望着我去回答。”
郑凤老师在如此频繁的项目开会的前提下,仍然无法自己前去总结汇报,已经能够看出 其对项目的指导并不在科研方面,而仅仅是进展的推进。事实上,郑凤老师在项目开展八个 月之后仍不知道项目标题,常常询问学生为什么选择某技术(甚至项目已经开展了八个多月 之后的 2024 年 4 月 7 日,郑凤老师又一次询问了这一问题),但项目就是以该技术申报的; 因此可以看出,郑凤老师不仅对项目毫不了解,也对学生没有指导。
从各位学生加入到实验室开始,郑凤老师就让大家学习 java 等编程语言,这本是对双 方都有益的事情,无可非议。但郑凤老师却常常说出“一周内把 java,python 等学会”这种 不着边际的话。(此外,据郑凤老师亲口所说:自己 python 代码一点都不会;如果真的一周 就能学会 python 代码,郑凤老师何至于一点都不会呢?)在她看来很多事情都是一天就可 以完成的,不限于学习编程语言、训练模型、分析实验结果等,且大部分同学白天还要去基 地进行实习工作,如若当日汇报没有得到她想得到的结果,便会破口大骂。此外,郑凤老师 常常质问“你写了几行代码?”,并以代码行数作为同学们工作量的衡量。
学术情况无法考究。总之,每每提到郑凤老师的学术能力,实验室各位同学思之令人发 笑。
在教学方面,郑凤老师近两年开设的研究生课程,PPT 及讲稿全部由学生完成,并且长 期由学生讲述每一节课,自己极少亲自讲课。
5.2 对于研究生的指导情况
2023 年十一月附近,2022 级同学进行开题工作,郑凤老师和这位企业导师从来没有过 创新点的建议和指导,全凭学生自己进行调研和思考。然而在开题答辩前,郑凤老师发现部 分人的开题与其 x 项目并无联系,为了完成其接手的 x 项目,强烈反对以其他方向开题,声 称这些同学的开题没有经过充分的调研,没有实际项目作为基底,她无法验证其创新点的可 行性,强制让这些学生在短短半个月内更改了题目,使实验室 12 名 2022 级学生的毕业论文 全部与项目挂钩,重新开始调研一个从未接触过的方向(甚至是一个从未踏足的全新领域)。 即使是以项目为导向进行开题,学生也从未获得过专业的指导和帮助。短短半个月内,又怎 么可能进行充分的调研和可行性的衡量?
郑凤老师给学生指导时,常常让“大家一起来听一下吧”,然后让其他同学对该学生的 汇报内容(包括项目汇报、开题汇报等)进行点评。
此外,前文已经提到过,郑凤老师的权威不允许任何人挑战。而这种“挑战”包含了任 何与郑凤老师意愿相悖的行为,包括法定节假日请假等普通事情。对那些曾经假期想请假回 家的同学,郑凤老师更是铭记在心。有位同学因为曾经挑战郑凤老师的权威,于是在研究生 开题环节,该同学修改了数十次开题报告,开题方向也换了 5-6 次,但还是迟迟不准许通过。 此外,郑凤老师在对该同学开题的审判上采取了实验室全体同学一起“拷问”的形式,在该 同学讲述完自己的开题思路和方案后,先是用自相矛盾的问题质问该同学 “你这个研究方 向有那么多人都在做,还有什么创新性可言”,“你这个研究方向都没什么人敢做你凭什么 觉得你能做出来”,“你如果认为你能做出来,请给出已有的论文成果”等毫无专业水准的 问题,该同学勉强回答后,又对着实验室所有人说“你们每个人都必须问 XX 同学两个问 题,如果 XX 同学有一个问题回答不上来,就不予通过开题”。
不得不指出,当前最后一名通过开题的同学和至今仍未开题的同学同时也是郑凤老师认 为“最挑战权威”的学生。
5.3 对于本科生的指导情况
郑凤老师对本科生的教学能力也十分堪忧。郑凤老师对本科生的教学态度有极大的问题。 例如,某次开会过程中,郑凤老师对实验室同学吐槽,某本科生向她咨询问题,而郑凤老师 在吐槽之后,竟然说出:“这学生真他妈难伺候”的话;并且指示助教同学“把那题直接答 案一发”,“如果他们每道题都不会,那就全部发,无所谓了”、“我们受不了一道题一道 题的给他们每个人讲”,而并不对学生详细解释。
6 其他情况
6.1 保密问题
1、郑凤老师身为保密人员,但行为并不遵守保密规则。郑凤老师拥有多台笔记本电脑, 其中一台专门用于存储保密材料,但这台电脑常常藏起来,不交给学校检查。
2、郑凤老师身为某保密项目负责人,但前述腾讯会议全为该项目会议,实验室同学在 实验室共用一台电脑,向远程参会的郑凤老师和企业导师汇报进展。
6.2 蔑视实验室同学的身心健康
1、前面已经讲述了实验室众人在年后的严重加班与熬夜情况。2024 年 3 月 29 日,实 验室同学们加班到 3 月 30 日凌晨五点半。在此期间,实验室某同学突然流鼻血,其他同学 也因心脏不舒服,纷纷决定周六稍微放松一下,睡觉的睡一天觉,身体不舒服的去看医生。
3 月 30 日周六当天,郑凤老师与企业导师多次要求实验室同学到实验室交流,后来因 不明原因开始给同学们打电话,但由于大家身体不堪重负、心理压抑等原因,没有人回应。 因此,郑凤老师拉黑了实验室部分同学。
3 月 31 日周末早上,各位同学依然在九点前就纷纷抵达实验室,开始工作。
3 月 31 日当天,郑凤老师依次邀请了几位同学盘问原因,并要求查看其手机。
4 月 3 日,郑凤老师将几位正在上班的同学叫回实验室,当众询问这几位同学为什么不 看手机、不回应消息。 在得知几位同学去了医院、体检结果良好后,郑凤老师得意洋洋地说:“去医院检查了 整整一天是吧,也没查出毛病来,本来想的是查出毛病来直接给老师当头一棒是吧,想说老 师你把我们整病了是吗?”
除此之外,在质询过程中,郑凤老师还说:“你们都查心脏是吧,是谁告诉你们心脏有 问题赶紧去查?”“不要拿着这个像 xx(实验室某位同学)一样成天拿着生病来吓唬人。 Xx 说成天心脏不行了心脏不行了快要不行了”“xxx 太过相信 xx 的话。我为什么把 xx 拉 黑了,因为我觉得实验室有这么一个人造成恐慌,我觉得很可怕。”言外之意,郑凤老师认 为实验室有同学检查心脏是因为有人主导、有人煽动。在没有任何证据的情况下,郑凤老师 拉黑了她认为的这位主导者。
事实上,经过长期的高压、加班熬夜、昼夜颠倒、作息紊乱的生活,实验室各位同学的 身体和心理确实均已透支,去医院检查也是视身体情况的自发行为。难道学生们只能奋战到 真正倒下的那一刻吗?郑凤老师说出的这些话,实在是令人心寒,也令实验室身体/心理不 舒服的同学感到更加恶心。
2、前文提到,实验室某同学为郑凤老师帮忙,导致肩膀受伤,需要做手术。该同学愿 意自己支付手术费用,仅仅将伤情告诉了郑凤老师,但郑凤老师说“你也没给我干多少重活” (言下之意,该同学的肩伤与其无关)并且在听到后心生不快,在当日组会上指责该同学, “就等着延毕吧”。
7 实验室同学的心理情况
2024 年 3 月 30 日,有同学因心脏难受到北医三院检查,体检结果良好,但医生认为该 同学需要考虑“身体不舒服可能是由于焦虑和抑郁引起的躯体化障碍”。一语惊醒梦中人。 实验室部分同学纷纷到北京安定医院进行检查,结果不容乐观。需要特别说明的是,其中一 位同学在医生询问情况时,如实将实验室的遭遇讲述给医生,医生不禁潸然泪下。可见实验 室众同学的遭遇闻者伤心,听者落泪。
在获取检查结果之后,部分同学认为压力确实大,无法兼顾校外基地、校内项目、毕业 论文三件事,因此选择离开项目组(前面已经提到过,郑凤老师要求 2022 级同学全部根据 项目内容开题)。第二天,郑凤老师说:“他们离开项目组自己做自己开题的东西,老师该 怎么辅导怎么辅导,但他们做歪了自己负责。”此外,郑凤老师还对 2023 级同学说:“你 们也用项目开题,最好是能覆盖他们的方向,然后让他们的东西跟你们雷同,然后让他们的 东西我全部给他们毙掉,明白我的意思了吧?”
某同学在开会时告知郑凤老师:“老师,我觉得我们这组人太少了,做起来压力特别大, 我很焦虑。”郑凤老师当时说让其先工作,后续郑凤老师自有安排;第二天,郑凤老师当众 对该同学说:“我跟你讲啊,你以后不要用什么焦虑啊这些词来吓唬我,知道吗?如果焦虑 立刻滚蛋明白了吗?”“另外就是不允许你在开会这么多人的场合下,跟我提焦虑。你要焦 虑你滚蛋,你退出项目,你自己再考虑好,如果你焦虑了,那么你就不要再做了明白吧。” “拉扯这些话没意思,每个人都焦虑,每个人都有压力,不要再跟我提这个好吧。”
以下内容为 2022 级、2023 级部分学生的心理情况。
郑凤老师的所作所为实在是令所有人心寒。在此,我们所有参与的同学恳请学院、学校 能够认真对待、严肃处理,为我们所有人分配新的导师,避免我们的研究生生涯葬送在郑凤老师的实验室。
安·兰德:人类的进步只有一个源泉
人类和文明面临的最大威胁是集权主义哲学的传播,助长这种传播的不是信徒的耿耿忠心,而是其反对者的茫然无知。因此,首先要理解它的本质。
如果人们坚信自己拥有任何人以任何理由都无法剥夺的权利,如果他们坚信自己的权利是至高无上的,那么任何独裁者都无法维持自己的统治。
个人主义者认为,人是一个独立的个体,在社会中以平等的身份进行自愿自由的交换,拥有追求个人幸福的权利,并且不可被剥夺。
美国的制度是建立在个人主义之上的。如果这个制度要生存下去,我们就必须理解个人主义的原则,并把它们作为我们处理任何公共事务的准绳。我们必须拥有积极的信条、明确而持久的信仰。
我们必须彻底摈弃侵犯个人权利的那些错误观点。普遍的幸福不可能来源于普遍的痛苦和自我牺牲。快乐的社会是由快乐的个人组成的,活跃的思想是从自由的个体来的,枯枝烂叶不可能组成一片健康翠绿的森林。
社会的力量应该永远受到个人不可剥夺的基本权利的限制,这正是我们的建国者们当初倡导的思想,他们把个人权利置于一切集体主义的主张之上。
自由权是指个人享有个人行动、个人选择、个人创制并拥有个人财产的权利。失去了拥有个人财产的权利,独立行动就无法得到保障。
追求幸福的权利是指个人有权为了自己生活,选择自己的个人幸福并为实现这样的幸福而努力。在这种选择中,每个个人都是唯一和最终的决定者,任何他人都无权决定他的幸福。这些权利是每个人无条件的私有财产,是与生俱来的,不需要任何外来的许可。
有史以来,两大敌人始终针锋相对,他们是两种截然相反的人:主动者和被动者。主动者是生产者,是创造者,是发明者,是个人主义者。他的根本需求是独立——为了思考和工作。他既不需要也不追求控制他人的权力,他也不会在任何压力下工作。
任何有益于人类的工作——从堆砌砖瓦到创作交响乐,都是由主动者来完成的。人的才能有高有低,但他们的基本原则是一致的;人的独立性和创造力发挥的程度,决定了他作为劳动者的才能,以及作为一个人的价值。
被动者在社会各阶层随处可见,不论是在贫民窟还是在豪宅别墅,这种人的标志是他对独立的恐惧。他是寄生虫,希望被别人照顾,希望别人给他指令让他服从。他喜欢集体主义,因为集体主义为他排除了任何需要自主思考或行动的机会。
如果社会以被动者的需要为根本,主动者就会毁灭,可是主动者毁灭之后,被动者也无法生存。如果社会以主动者的需要为根本,主动者就会凭借自己的能量与被动者携手同行,让他们和整个社会共同进步。这,就是所有人类进步的模式。
有些人道主义者出于对无能者或被动者的怜悯,要求建立集体主义的政权。为了这些被动者,他们希望束缚主动者。但是,被束缚的主动者无法发挥效能,一旦他被消灭,被动者也随之灭亡。
如果怜悯是人道主义考虑的第一要素,那么就算是看在怜悯的份上,为了帮助被动者,他们也应该把自由交还给主动者。除此之外,再无帮助被动者的方法。不幸的是,在集体主义社会里,主动者已经灭绝了。
人类的历史就是主动者和被动者斗争的历史,是个人和集体斗争的历史。在那些诞生过最幸福的人、最高生活水平和最伟大文化的国家里,集体的权力——政府和国家的权力都是受到限制的,人们都被赋予了独立行动的自由。
例如:罗马的兴起得益于以公民权利为本、凌驾于当时集体主义野蛮行径之上的法律;英国的兴起得益于建立在大宪章之上的政府体制,同样,这样的体制也是凌驾于集体主义野蛮行径之上的;美国的兴起达到了史无前例的高度,这完全归功于宪法赋予每个公民的与集体抗衡的自由和独立。
当人们正为文明兴衰的根源苦思冥想的时候,历史的每一页都在告诉我们,人类的进步只有一个源泉:独立行动的个人。集体主义是野蛮人的原则。野蛮人的生存是公有的,受到其部落法规的约束。文明是把人从其他人那里解放出来的过程。
我们现在正面临一个抉择:是前进还是后退?
集体主义不是“明天的新秩序”,它存在于黑暗的昨天。但是明天的新秩序确实存在着,它属于独立的个人——人类明天的唯一创造者。
刘姝威:蓝田之谜
我运用国际通用的分析方法,分析了从蓝田股份的招股说明书到2001年中期报告的全部财务报告以及其他公开资料。根据对蓝田股份会计报表的研究推理,我写了一篇600多字的研究推理短文《应立即停止对蓝田股份发放贷款》发给《金融内参》。
现在,我公开发表蓝田股份会计报表的研究推理摘要。我将非常感谢大家评论我的研究推理。
我研究推理“应立即停止对蓝田股份发放贷款”的依据
在对借款企业发放贷款前和发放贷款后,银行必须分析借款企业的财务报告。如果财务分析结果显示企业的风险度超过银行的风险承受能力,那么,银行可以立即停止向企业发放贷款。
1.蓝田股份的偿债能力分析
2000年蓝田股份的流动比率是0.77。这说明蓝田股份短期可转换成现金的流动资产不足以偿还到期流动负债,偿还短期债务能力弱。
2000年蓝田股份的速动比率是0.35。这说明,扣除存货后,蓝田股份的流动资产只能偿还35%的到期流动负债。
2000年蓝田股份的净营运资金是-1.3亿元。这说明蓝田股份将不能按时偿还1.3亿元的到期流动负债。
从1997年至2000年蓝田股份的固定资产周转率和流动比率逐年下降,到2000年二者均小于1。这说明蓝田股份的偿还短期债务能力越来越弱。
2000年蓝田股份的主营产品是农副水产品和饮料。2000年蓝田股份“货币资金”和“现金及现金等价物净增加额”,以及流动比率、速动比率、净营运资金和现金流动负债比率均位于“A07渔业”上市公司的同业最低水平,其中,流动比率和速动比率分别低于“A07渔业”上市公司的同业平均值大约5倍和11倍。这说明,在“A07渔业”上市公司中,蓝田股份的现金流量是最短缺的,短期偿债能力是最低的。
2000年蓝田股份的流动比率、速动比率和现金流动负债比率均处于“C0食品、饮料”上市公司的同业最低水平,分别低于同业平均值的2倍、5倍和3倍。这说明,在“C0食品、饮料”行业上市公司中,蓝田股份的现金流量是最短缺的,偿还短期债务能力是最低的。
2.蓝田股份的农副水产品销售收入分析
2000年蓝田股份的农副水产品收入占主营业务收入的69%,饮料收入占主营业务收入的29%,二者合计占主营业务收入的98%。
2001年8月29日蓝田股份发布公告称:由于公司基地地处洪湖市瞿家湾镇,占公司产品70%的水产品在养殖基地现场成交,上门提货的客户中个体比重大,因此“钱货两清”成为惯例,应收款占主营业务收入比重较低。
2000年蓝田股份的水产品收入位于“A07渔业”上市公司的同业最高水平,高于同业平均值3倍。
2000年蓝田股份的应收款回收期位于“A07渔业”上市公司的同业最低水平,低于同业平均值大约31倍。这说明,在“A07渔业”上市公司中,蓝田股份给予买主的赊销期是最短的、销售条件是最严格的。
作为海洋渔业生产企业,华龙集团以应收款回收期7天(相当于给予客户7天赊销期)的销售方式,只销售价值相当于蓝田股份水产品收入5%的水产品;中水渔业以应收款回收期187天(相当于给予客户187天赊销期,比蓝田股份“钱货两清”销售方式更优惠、对客户更有吸引力)的销售方式,只销售价值相当于蓝田股份水产品收入26%的水产品。
蓝田股份的农副水产品生产基地位于湖北洪湖市,公司生产区是一个几十万亩的天然水产种养场。武昌鱼公司位于湖北鄂州市,距洪湖的直线距离200公里左右,其主营业务是淡水鱼类及其它水产品养殖,其应收款回收期是577天,比蓝田股份应收款回收期长95倍;但是其水产品收入只是蓝田股份水产品收入的8%。洞庭水殖位于湖南常德市,距洪湖的直线距离200公里左右,其主营产品是淡水鱼及特种水产品,其产销量在湖南省位于前列,其应收款回收期是178天,比蓝田股份应收款回收期长30倍,这相当于给予客户178天赊销期;但是其水产品收入只是蓝田股份的4%。在方圆200公里以内,武昌鱼和洞庭水殖与蓝田股份的淡水产品收入出现了巨大的差距。
武昌鱼和洞庭水殖与蓝田股份都生产淡水产品,产品的差异性很小,人们不会只喜欢洪湖里的鱼,而不喜欢武昌鱼或洞庭湖里的鱼。蓝田股份采取“钱货两清”和客户上门提货的销售方式,这与过去渔民在湖边卖鱼的传统销售方式是相同的。蓝田股份的传统销售方式不能支持其水产品收入异常高于同业企业。除非蓝田股份大幅度降低产品价格,巨大的价格差异才能对客户产生特殊的吸引力。但是,蓝田股份与武昌鱼和洞庭水殖位于同一地区,自然地理和人文条件相同,生产成本不会存在巨大的差异,若蓝田股份大幅度降低产品价格,它将面临亏损。
根据以上分析,我研究推理:蓝田股份不可能以“钱货两清”和客户上门提货的销售方式,一年销售12.7亿元水产品。
3.蓝田股份的现金流量分析
2000年蓝田股份的“销售商品、提供劳务收到的现金”超过了“主营业务收入”,但是其短期偿债能力却位于同业最低水平。这种矛盾来源于“购建固定资产、无形资产和其它长期资产所支付的现金”是“经营活动产生的现金流量净额”的92%。2000年蓝田股份的在建工程增加投资7.1亿元,其中“生态基地”、“鱼塘升级改造”和“大湖开发项目”三个项目占75%,在建工程增加投资的资金来源是自有资金。这意味着2000年蓝田股份经营活动产生的净现金流量大部分转化成在建工程本期增加投资。
根据2001年8月29日蓝田股份发布的公告,2000年蓝田股份的农副水产品收入12.7亿元应该是现金收入。
我从事商业银行研究,了解我国的商业银行。如果蓝田股份水产品基地瞿家湾每年有12.7亿元销售水产品收到的现金,各家银行会争先恐后地在瞿家湾设立分支机构,会为争取这“12.7亿元销售水产品收到的现金”业务而展开激烈的竞争。银行会专门为方便个体户到瞿家湾购买水产品而设计银行业务和工具,促进个体户与蓝田股份的水产品交易。银行会采取各种措施,绝不会让“12.7亿元销售水产品收到的现金”游离于银行系统之外。与发达国家的银行相比,我国商业银行确实存在差距,但是,我国的商业银行还没有迟钝到“瞿家湾每年有12.7亿元销售水产品收到的现金”而无动于衷。
根据以上分析,我研究推理:2000年蓝田股份的农副水产品收入12.7亿元的数据是虚假的。
4.蓝田股份的资产结构分析
蓝田股份的流动资产逐年下降,应收款逐年下降,到2000年流动资产主要由存货和货币资金构成,到2000年在产品占存货的82%;蓝田股份的资产逐年上升主要由于固定资产逐年上升,到2000年资产主要由固定资产构成。
2000年蓝田股份的流动资产占资产百分比位于“A07渔业”上市公司的同业最低水平,低于同业平均值约3倍;而存货占流动资产百分比位于“A07渔业”上市公司的同业最高水平,高于同业平均值约3倍。
2000年蓝田股份的固定资产占资产百分比位于“A07渔业”上市公司的同业最高水平,高于同业平均值1倍多。
2000年蓝田股份的在产品占存货百分比位于“A07渔业”上市公司的同业最高水平,高于同业平均值1倍;在产品绝对值位于同业最高水平,高于同业平均值3倍。
2000年蓝田股份的存货占流动资产百分比位于“C0食品、饮料”上市公司的同业最高水平,高于同业平均值1倍。
2000年蓝田股份的在产品占存货百分比位于“C0食品、饮料”上市公司的同业最高水平,高于同业平均值约3倍。
根据以上分析,我研究推理:蓝田股份的在产品占存货百分比和固定资产占资产百分比异常高于同业平均水平,蓝田股份的在产品和固定资产的数据是虚假的。
5.我的研究推理
根据以上分析,我研究推理:蓝田股份的偿债能力越来越恶化;扣除各项成本和费用后,蓝田股份没有净收入来源;蓝田股份不能创造足够的现金流量以便维持正常经营活动和保证按时偿还银行贷款的本金和利息;银行应该立即停止对蓝田股份发放贷款。
我研究推理“蓝田股份已经成为中国蓝田总公司的提款机”的依据
1.蓝田股份的关联方关系
根据蓝田股份2000年会计报表附注“(八)关联方关系及交易”,蓝田股份的母公司是洪湖蓝田经济技术开发有限公司,注册地址是洪湖市瞿家湾镇。蓝田股份合并会计报表的子公司有两家:沈阳蓝田房屋开发有限公司(注册地址是沈阳市)和湖北洪湖蓝田水产品开发有限公司(注册地址是洪湖市瞿家弯镇)。2000年沈阳蓝田房屋开发有限公司亏损。2000年蓝田股份的利润主要来自于湖北洪湖蓝田水产品开发有限公司。
根据蓝田股份2000年会计报表附注“(八)关联方关系及交易”,中国蓝田总公司与蓝田股份不存在控制关系,二者之间的关系是公司高级管理人员兼职。蓝田股份委托中国蓝田总公司为代销商,2000年中国蓝田总公司代销额占当期蓝田股份销售额的1.9%。中国蓝田总公司长期为蓝田股份的产品进行广告宣传。
中国蓝田总公司所属的金农网(产品)《中国蓝田总公司简介》称:“1996年5月,其核心企业沈阳蓝田股份有限公司由中国农业部推荐为首家A股股票上市公司。”
金农网(简介)《中国蓝田(集团)总公司简介》称:“湖北蓝田股份有限公司是总公司的核心企业,1996年5月由国家批准A股上市,被誉为‘中国农业第一股’。上市以来,业绩连年高速增长,2000年,主营业务收入18.41亿元,利润总额5.02亿元。”
蓝田股份称:中国蓝田总公司与蓝田股份不存在控制关系,二者之间的关系是公司高级管理人员兼职。中国蓝田总公司和中国蓝田(集团)总公司称:蓝田股份是其核心企业。哪个是真的?
2.中国蓝田(集团)总公司的收入来源分析
金农网(简介)《中国蓝田(集团)总公司简介》称:中国蓝田总公司在全国建立了六大生产基地,即湖北洪湖30万亩水产品种植、养殖和绿色食品加工基地,湖北随州10万亩银杏和200吨黄酮、500公斤萜内酯生产加工基地,湖南临湘10万亩黄姜及500吨皂素生产基地,湖南常德奶牛、乳制品生产加工基地,广东珠海优化农业试验基地,北京昌平国际高科技农业基地。
(1)北京昌平国际高科技农业基地
2001年10月26日湖北蓝田股份有限公司董事会发布关联交易公告称:“本公司以2320万元的价格将所持蓝田园(即北京昌平国际高科技农业基地)80%的股权出售给中国蓝田总公司。……蓝田园公司成立时间较短,到目前为止未有盈利。”
(2)广东珠海优化农业试验基地
金农网(简介)《中国蓝田(集团)总公司简介》称:中国蓝田集团广东公司在广东省计划委员会立项,投资1.9亿元,于广东省珠海市建设“广东蓝田优化农业试验基地”。
广东省发展计划委员会网站(建设项目计划表)列示:珠三角十大农业示范基地项目,建设起止年限:2000~2005年,总投资40亿元,到2000年完成投资15亿元,2001年计划投资2亿元。假设“广东蓝田优化农业试验基地”是“珠三角十大农业示范基地”之一,那么,该基地最早是2000年开始投资建设的。
(3)湖北随州10万亩银杏和200吨黄酮、500公斤萜内酯生产加工基地
金农网(简介)《中国蓝田(集团)总公司简介》称:中国蓝田集团随州公司开发管理的10万亩银杏基地坐落在湖北省随州市。基地以洛阳镇为重点,以该镇珠宝山第七个村为中心,辐射洛阳镇230平方公里的32个行政村。
《随州信息港》网站:湖北省随州市曾都区洛阳镇位于大洪山东麓,全镇辖32个村(居)委会,34500人,总面积230平方公里,其中耕地3.3万亩,山场25万亩,水面2.2万亩。全镇有果用型银杏树570多万株,其中百年以上1.7万株,千年以上308株;叶用型银杏园5300余亩,银杏苗圃100多亩,每年产银杏500余吨、银杏叶1500余吨,可出圃各规格银杏苗500万株。
三九健康网2001年9月24日报道,6月26日,我国最大的银杏深加工基地正式落户随州。省委常委、中国工程院院士周济与中国蓝田集团总裁瞿兆玉共同为这座占地500亩的“湖北蓝田银杏高科技产业园”奠基。
(4)湖南临湘10万亩黄姜及500吨皂素生产基地
蓝田金农网没有介绍湖南临湘10万亩黄姜及500吨皂素生产基地。
在湖南省临湘市政府网站有关湖南临湘10万亩黄姜及500吨皂素生产基地的任何信息。
(5)湖南常德奶牛、乳制品生产加工基地
蓝田金农网没有介绍湖南常德奶牛、乳制品生产加工基地。在湖南省常德市政府网站有关湖南常德奶牛、乳制品生产加工基地的任何信息。
(6)洪湖30万亩水产品种植、养殖和绿色食品加工基地
金农网(简介)《中国蓝田(集团)总公司简介》介绍了中国蓝田(集团)总公司的洪湖生态养殖基地(位于洪湖)、果蔬种植基地、畜禽养殖基地(位于洪湖市)和绿色食品加工中心(位于洪湖瞿家湾镇)。
从1997年至2000年蓝田股份累计投资3亿元的洪湖菜篮子工程与中国蓝田(集团)总公司的果蔬种植基地、畜禽养殖基地和绿色食品加工中心位于同一地点。
从1997年至2000年蓝田股份累计投资约16亿元的生态基地、大湖开发项目和渔塘升级项目与中国蓝田(集团)总公司的洪湖生态养殖基地位于同一地点。
3.我的研究推理
根据以上分析,我研究推理:中国蓝田(集团)总公司的湖北洪湖30万亩水产品种植、养殖和绿色食品加工基地就是蓝田股份的生产基地;中国蓝田(集团)总公司的其他五个生产基地不能为其提供净收入和现金流量;中国蓝田总公司没有净收入来源,不能创造充足的现金流量以便维持正常的经营活动和保证按时偿还银行贷款的本金和利息;蓝田股份的现金流量流向中国蓝田(集团)总公司;蓝田股份已经成为中国蓝田总公司的提款机。
-我研究推理“蓝田股份依靠银行贷款维持运转”的依据
根据以上分析,我没有发现蓝田股份足以维持其正常经营和按时偿还银行贷款本息的现金流量来源。所以,我研究推理:蓝田股份依靠银行的贷款维持运转,而且用拆西墙补东墙的办法,支付银行利息。
从《金融内参》2001年10月26日发表《应立即停止对蓝田股份发放贷款》到2001年11月20日瞿兆玉找我,间隔25天。瞿兆玉博士说:“所有银行停发贷款,资金链断了,业务无法进行了,快死了。”一家健康的企业不会出现如此强烈的反应,在银行停发贷款的短时间内,业务已经无法进行了。
结束语
任何一家银行不可能单凭一篇短文和不进行调查研究而立即停发一家企业的贷款。
在《应立即停止对蓝田股份发放贷款》中,我提示银行检查“蓝田股份和中国蓝田总公司及其各地子公司的银行户现金流动情况”。
如果银行对蓝田进行调查研究后,根据银行的调查研究结果,停发蓝田贷款,那么,银行停发蓝田贷款一定有其理由。