您的购物车目前是空的!
分类: 专业学校考试
戴鑫:纸草档案与托勒密埃及的社会经济史研究
纸草学诞生于19世纪末20世纪初的欧洲,是一门主要研究希腊罗马时代埃及(约公元前4世纪至公元7世纪中叶)纸草及纸草文本的学科。19世纪80年代,埃及考古学之父弗林德斯·皮特里在埃及法雍地区的考古活动,以及英国牛津大学古典系伯纳德·格伦菲尔和阿瑟·洪特在奥克西林库斯的发掘,使得包含希腊罗马时代埃及行政文本在内的大量纸草在千年之后重见天日。埃及源源不断的出土文献令欧洲学术界大为震撼,德国的罗马史家特奥多尔·蒙森曾预言“20世纪将是纸草学的世纪”。他的学生乌尔里希·威尔肯投身纸草研究,于1900年创建第一个纸草学期刊《纸草档案研究》,成为纸草学诞生的标志之一。
纸草学家将同一个人、家庭、社区保存的一系列纸草整理为档案,便于开展史学研究。纸草档案兼指官方文书和私人书信,因保存者来自社会各阶层,可能将官方通信、行政文书和私人家书混杂存放。芝诺档案是现存托勒密埃及时期(公元前305至公元前30年)数量最大的档案(总计2063份纸草文本,其中1800余件为希腊语文本),所有者为考诺斯的芝诺,他曾担任托勒密二世时期财政大臣阿波罗尼奥斯的秘书,还受命为后者管理地产,负责组织灌溉近2750公顷土地。芝诺收藏了工作与生活相关的各种官方文件和私人通信,时间跨度为公元前263年至公元前229年,在近代学者重现和探讨托勒密埃及经济制度中扮演至关重要的角色。1911年,芝诺档案中的部分文本首次出现在伦敦和斯特拉斯堡。1914年冬,大量芝诺档案文本分批次流入古物市场,先后为埃及开罗博物馆、大英博物馆以及其他欧美博物馆、科研机构或私人等收藏。
20世纪20年代,俄裔美国纸草学家迈克尔·罗斯托夫采夫利用新整理的部分芝诺档案撰写《公元前3世纪的埃及大地产》,是为托勒密埃及社会经济史研究的发端。早期研究即以希腊语纸草档案为核心史料,重点关注托勒密家族的王室经济。1939年,比利时纸草学家克莱尔·普雷欧出版专著《拉吉德王室经济》,详尽而细致地描述了托勒密王室对经济的高度控制或“垄断”。不久,罗斯托夫采夫在《希腊化世界社会经济史》(1941年)中,进一步强调埃及的“国家垄断”和“计划经济”色彩。他指出托勒密二世实施经济和社会改革,从而在埃及确立了希腊化经济体系。某种意义上来说,罗斯托夫采夫和普雷欧依靠纸草档案,共同奠定了欧美学术界关于托勒密埃及社会经济史研究的基础。
20世纪70年代以来,纸草学家们将工作重心转向早期研究中忽视的地方经济。除了希腊语纸草档案之外,他们还着手收集、整理不同时期个别村庄或地产的相关埃及语纸草文本,按专题重新分类汇编。门西斯档案在格伦菲尔和洪特发掘的纸草文献中最为著名,保存者为公元前2世纪法雍地区科尔克奥西里斯的书吏门西斯,他详细记录了当地农业经济和行政管理情况。由于这些纸草文书出土时混杂在鳄鱼木乃伊中,门西斯档案的重建工作颇为不易。1971年,英国剑桥大学的多萝茜·克劳福德利用该档案重点分析科尔克奥西里斯的行政、土地、人口和农业状况,揭示古埃及政府试图对该地区的人口、税收、土地和农业生产进行精准测算、记录和管控,建立了一套复杂而严密的土地登记系统。
随着纸草档案编辑重心的偏移与研究视野的拓宽,埃及社会经济史的研究被赋予新的生命力。学者们的关注点不再仅限于地方行政与经济层面,还广泛涉及个体社会生活的方方面面。比利时纸草学家威利·克拉瑞斯搜索和整理一些分散于世界各地的皮特里纸草(由英国考古学家皮特里发掘于法雍附近的古罗布,也称为古罗布纸草),出版了其中53份遗嘱类文本,展现了托勒密埃及法雍地区封地军人的家庭关系、身份、财产以及当地的农业和地产信息。美国纸草学家纳夫塔利·路易斯以特定群体为研究对象,整理汇编了兼具官方与私人性质的个人文本,以个案研究的形式再现不同职业和社会身份的希腊移民在埃及的社会生活。1998年,荷兰纸草学家阿瑟·维胡格特也以门西斯档案为研究对象,描述了更为微观的社会生活场景,关注门西斯本人的社会身份认同、工作、生活,通过信件的格式规范推测门西斯和通信人的等级关系。
纸草学数据库建设则引领了计量分析和利用计算机进行研究的潮流,也加快了跨学科进行社会经济史专题研究的进程,增加了对人口统计、社会结构、城市化、社会关系等领域的关注。耶鲁大学和密歇根大学最先开始对收藏的纸草进行电子编目。杜克大学于1982年开始建立杜克纸草文本数据库,收录已经出版的纸草文本。20世纪90年代中期开始,欧美一些高校和科研机构开始大规模扫描纸草文本,通过互联网建立起世界范围的纸草档案库,纸草文献得以通过数字化信息的形式在网络上被查阅和检索。比利时鲁汶大学的纸草学家重视结合数据分析,探究希腊罗马时代埃及个人与社会的关系。截至2019年,鲁汶的特里斯迈吉斯托斯数据库(Trismegistos,缩写为TM)已收录680123份纸草数据,其中370086份文本记录了496702个人的信息。
进入新世纪,托勒密埃及的社会经济史研究迎来一个新的高峰。2006年,克拉瑞斯和剑桥大学纸草学家多萝茜·汤普森历时十五年的合作,共同出版了《计算希腊化埃及的人口》。该书重点收集、编辑了从法雍至中部埃及吕克波利斯州(诺姆)一百年间(公元前250年至公元前150年)的税收类纸草文本,按照区域和税收类型划分为54组,对上述地区的人口、家庭、婚姻、职业、族群以及财产等情况进行量化分析,展现出王朝中期社会经济发展的动态图景。基于这一研究成果,鲁汶大学研究员卡嘉·穆勒尝试用社会网络分析以及地理学理论研究托勒密埃及国内外新定居点的分布情况,认为它们构成了支撑国家权力的网络,对托勒密埃及国家经济稳定发挥了重要作用。鲁汶数据库TM也于2012年建立网络分析系统,极大地推动了托勒密埃及人物志研究,可以用于分析个人、家庭、地点、人名甚至埃及语书信的关联。目前,帕许里斯档案、法雍档案、上埃及档案等多个项目仍持续进行。
欧美学术界关于托勒密埃及的社会经济史研究在很大程度上依托于纸草文本的收集整理、档案编辑方式、技术方法的革新等,伴随着纸草学研究的开拓而延展。数量庞大且不断新增的纸草文书使这一研究领域具有独特的优势。鲁汶大学TM收录公元前6世纪至公元7世纪的档案超过500份,共计近2万件文本。据美国纸草学家范·明宁估算,到2030年时,出版的纸草文本将不少于10万件。尽管纸草文献的编辑、整理工作漫长而艰苦,但纸草学经过一百余年的沉淀、累积和更新,逐渐克服技术困难(如文献残损、勘误、确定年代和地点等)和文献内容庞杂且零碎等缺陷,档案的整理也已取得长足进展。在跨学科合作和计算机网络技术的助推下,无论是综合研究还是微观考察,都将进一步完善研究者们对托勒密埃及的社会经济和文化图景的绘制。
本文转自《光明日报》( 2025年02月24日 14版)
何芊:游戏还是工具——生成式人工智能与历史模拟
一
“历史模拟”并不是一个新奇的概念。在教学中鼓励学生依照历史记录,重演历史角色或主要行为体的决策与行动,培养共情与同理心,体会历史中的能动性与复杂性,已是较为常见的模拟设计。不少以历史为素材的游戏同样作为历史模拟被引入课堂。历史游戏学者亚当·查普曼区分了两类历史游戏的模拟方式。其一是以《刺客信条》和《荒野大镖客》为代表的现实主义模拟。它们以精良的视觉效果还原了历史事件的节选片段与历史场景的局部空间,通过细节的仿真与过往的重现为玩家营造身临其境的参与式体验。其二是以《文明》系列为代表的概念化模拟。这种策略类游戏通过将历史对象、概念、进程以及历史观念写入游戏规则来模拟历史,比如《文明》系列的设计逻辑就出自保罗·肯尼迪的《大国的兴衰》。这种模拟允许玩家在规则之内自由发挥,组合出架空的历史,演绎开放式的走向。
无论是让学生扮演历史中的行为体,还是在游戏中“亲历”虚拟的历史场景,抑或是通过玩法与规则理解历史阐释的逻辑,教学中的模拟设计都无可避免地存在着简化和泛化历史的倾向。虽然游戏化的历史与历史本身之间的关系存有较大争议,但这并未妨碍游戏化的历史模拟进入到课程教学之中。游戏与模拟的边界模糊,或者说是历史模拟的游戏化,默认了事实与假设、历史与仿历史之间不可逾越的鸿沟,这恰恰是历史课堂中接纳模拟的前提。
将模拟视为研究工具的历史学家更多集中在计量史学及其他交叉领域,这些研究方向往往拥有丰厚的理论与数据资源。20世纪60年代,伴随着计量史学的诞生,模拟方法进入到史学研究当中。第一代计量史家罗伯特·福格尔和约翰·迈耶等人奠定了反事实推演的基础方法。这一时期模拟与历史的结合还有两种形式:一是利用文献记录为模型设计变量、提供参数设定的佐证。二是通过模拟结果与真实历史的比对来验证模型。从20世纪90年代开始,新一代计量史家进一步将反事实推演与蒙特卡罗模拟相结合,通过模拟实验,发现关键的因果关系,检验既有研究结论。历史模拟在计量史学中自证了其工具价值。历史事件没有简单重复,史学研究只能从已知过去的观察中抽丝剥茧、考镜源流,研究成果往往自成一说,高下难辨。如果真能对历史学的研究对象,比如经济发展的变化趋势、重大事件的爆发过程以及复杂系统的演化发展进行多次模拟观测,应当能帮助我们更客观地理解前人结论,更精准地揭示人类历史中复杂交错的因果关系。
二
即便集成了大量历史信息,结合了既有理论与统计学方法,传统模拟依然只能构造对现实世界的简化近似。传统模拟依赖于计算机随机过程的重复实现,以此生成特定条件下针对同一对象的多种可能结果。传统模拟的特点表现为系统内的信息交互以抽象数字为表征,模型的诸多参数由研究者结合前人成果自行决定。简言之,以数理逻辑为运行基础的模拟系统仍比较简单。而牵引历史变化发展的,不仅有数据指标所揭示的机械规律,还有弥散分布的大量非理性因素。历史情境内人的情感、好恶、偏见、道德、迷信,以及这些因素以语言为载体在群体与个体之间反复的交糅共振,都在左右着人的行动与选择。非理性因素错综晦暗,难以融入相对简化的数学模型。
生成式人工智能为传统模拟的不足带来了新的改进工具。首先,大模型具有繁复的计算结构,庞大的参数规模与海量的训练语料,足以支撑更复杂的仿真模拟设计。其次,大模型的行为选择由预训练和微调所决定,相较于原本由研究人员对参数赋值并结合随机过程而产生的模拟结果,更贴合现实。再次,大模型的模拟系统内部,信息交流可以用自然语言代替数字表征,与人类社会的语言交互模式更为接近。此外,大模型还通过对齐技术进一步向人类价值取向靠近。大模型在完成预训练之后,通过基于人类反馈的强化学习,实现与人类偏好、道德准则和价值观念的对齐。如果说传统模拟尚且是简化后的仿真,那么当下大模型对人类的模仿已几近“乱真”。比如由大模型合成的模拟受访者复现了人类被试在行为经济学和社会心理学等领域的部分经典实验结果。大模型的类人化智能在交互环境中也得到了印证。以外交谈判为核心的策略类语言桌游《外交》,讲求多人博弈之中的意图识别、谎言洞察、信任获取以及协商合作等综合能力,经过特别训练的大模型已能在网络对战中达到优秀的人类玩家水平。
不仅如此,大模型还可以驱动多智能体的仿真模拟系统(Multi-Agent Modeling, MAS),这也是近来历史模拟所采用的方法。智能体仿真模拟原本是社会学家用来探索个体与系统、微观与宏观之间互动关联的路径:通过创建多个自主智能代理,在计算机的模拟环境中观察智能体之间、智能体与环境之间基于给定规则的相互作用,从而解释微观个体行动如何导致复杂系统演变的“涌现”现象。大模型的能力跃升,对人类智能的趋近,同人类价值观念的对齐,都进一步提升了智能体模拟对人类社会的仿真度。在此基础上,原本因化约而备受批评的历史模拟也展现出新的可能性。新一代的历史模拟将重大事件的主要参与方构建为多个智能体,利用真实的历史情境设定智能体的参数,制定智能体之间的行动规则,并通过大模型的运行环境来模拟多智能体之间的交互过程,从而分析历史事件爆发的因果机制。
新的历史模拟在外交史和战争史领域已有初步展现。罗格斯大学与密歇根大学的联合团队以一战前夕的英、法、德、奥匈、塞、俄、美、奥斯曼等国为原型创建了多智能体系统,其中,代表各国的多智能体在结盟、备战与宣战的行为中较为准确地复现了历史中的国际关系。类似的方法还被用来模拟第一次英法百年战争期间的重要战役,以证明由智能体所演绎的将军与军士可还原战役的主要结果。从这些尝试看,历史模拟与侧重理论探索的试验性模拟不同:其一,模拟系统的有效性需比对真实历史来验证;其二,模拟对象应当采取匿名化处理,以避免大模型调用历史知识,干扰模拟系统。不过,所谓复现历史,标准尚无定论,仍由研究者自行设定。比如在战役模拟中,研究人员利用英法最终伤亡率的高低比值,与史载对照,以此判断仿真是否成功。史实与模拟之间的拟合误差,也缺乏公认的基准。在一战模拟中,国家间结盟、宣战与备战的复现,最高准确度分别为77.78%、54.6%以及92.09%。这些数值能否证明模拟成功,可能还需更多讨论。
三
当然,依托于大模型的历史模拟仍然存在不少局限。首先,模拟依旧是对历史情境的抽象和简化。智能体的行动范围局限于研究者指定的有限选项,而选项设计往往紧扣论题,容易出现简化后的偏移。比如围绕战争爆发设计模拟,国家智能体的行动选项中,导向冲突的选项更多,而和平类行为不足,若是设计逻辑缺乏其他依据,那么由模拟结果得出战争不可避免的推论难以令人信服。其次,语言对模拟结果的诱导作用无法被排除。模拟的主要环节,包括智能体的参数设定,智能体之间的互动方式,以及触发行动的事件本身,都要通过自然语言的描述来实现。模拟中的智能体行为究竟是复现了决策,还是停留在语言关系推断,实难分辨。再次,通用大模型的预训练语料主要来自移动互联网时代,本就存在“近因偏见”,如果不在微调环节令模型接受历史语义训练,模拟可能难向近代以前延展。除此之外,大模型的幻觉文本、价值偏见,以及模型不定期更新导致的实验结果无法重复,这些固有疑难同样也在挑战着历史模拟作为研究方法的可靠性。
尽管有种种不足,但新一代的历史模拟依然具有不容忽视的发展潜力。作为一种研究工具,大模型驱动的历史模拟需要更多的检视与讨论。有一部分问题可以改进:比如通过消融实验,或结合史学研究成果,能衡量或优化模拟系统中的组件设计;采用开源模型,进行本地部署,并介入微调环节,能提升大模型生成内容的稳定性,也能令模拟更贴合历史语境。即便新的模拟方法仍远不足以还原复杂历史情境,但简化的历史模拟设计已足够在教学场景中迭代传统的课堂模拟。大模型不仅可以实现原本由学生扮演的模拟,还能翻转学生的参与方式,让他们从角色扮演者变成模拟设计者。学生利用提示词,描述具体场景,拟定大模型的“人设”,并同其他同学驱动的大模型角色展开对话,完成一场基于历史的语言游戏,这无疑能激发学生主动求知的热情。总之,无论作为游戏还是工具,生成式人工智能都带来了全新的增量。
本文转自《光明日报》( 2025年02月10日)
薛其坤:探究微观量子世界
本文系讲演稿整理而得
欧姆定律是接近200年前,由德国物理学家欧姆提出的一个非常经典的电学规律,它说的是通过一个导体,导体的电阻与加在导体两端的电压差成正比,与流过这个导体的电流成反比。大家都非常熟悉。换一句话来说,流过这个导体的电流正比于加在这个导体两端的电压,反比于这个材料的电阻。这个材料的电阻越大,它越绝缘;在额定的电压下,它的电流就越小。
欧姆定律讲的是沿着电流流动方向关于电压、电阻、电流基本关系的科学规律。我们很好奇,自然就想问“在垂直于电流流动的方向上,是不是也会有类似欧姆定律关于电流、电压、电阻关系的东西呢?”答案:“是!”
这就是欧姆定律提出50多年以后,在1879年由美国物理学家埃德温霍尔发现的霍尔效应。霍尔效应实验是一个非常精妙的实验,他把这个导线变成了这样一个平板,当时用的材料是金。在垂直于这个金的平板方向上,再加一个磁场,当然沿着电流流动的方向仍然有欧姆定律的存在。但是由于这个磁场下,流动的电子受到洛伦兹力的作用,它会在垂直于电流的方向也发生偏转。
在这样一个磁场下,电流除了欧姆定律方向的电流在流动以外,电子还在横向发生偏转,形成电荷的积累,形成电压。这个电压就叫霍尔电压,这个现象就是霍尔效应。加一个磁场就可以产生霍尔效应,那么我们自然想问,是不是不需要磁场也能实现这样一个非常伟大的霍尔效应呢?答案也是“是”!
他发现霍尔效应一年以后,就做了这样一个试验,把材料金换成铁,靠铁本身的磁性产生的磁场,也发现了类似的霍尔效应。因为科学机理完全不一样,命名为反常霍尔效应。
不管怎么样,霍尔效应、反常霍尔效应是非常经典的电磁现象之一。为什么呢?它用一个非常简单的科学实验、科学装置就把电和磁这两个非常不一样的现象在一个装置上完成了。
当然了,霍尔效应非常有用。今天我给大家列举了一些大家非常熟悉的例子。比如测量电流的电流钳,我们读取信用卡的磁卡阅读器,汽车的速度计,这都是霍尔效应的应用。它已经遍布在我们生活的每一个方面,是一个极其伟大的科学发现,同时对我们社会技术进步带来了极大的便利。
这不是这个故事的结束。100年以后,德国物理学家冯·克利青把研究的材料从金属变成半导体硅,结果他就发现了量子霍尔效应,或者说霍尔效应的量子版本。他用了一个具体材料,就是我们熟知的每一个计算机、每一个芯片都有的场效应晶体管。这个场效应晶体管中有硅和二氧化硅的分界面,在这个界面上有二维电子气。就是在这样一个体系中,在半导体材料中,他发现了量子霍尔效应。
在强磁场下,冯·克利青先生发现了霍尔电阻,右边这个公式,=h/ne2,h是以普朗克科学家命名的一个常数,是一个自然界的物理学常数。n是自然数——1、2、3、4、5。e就是一个电子带的电量,这是一个非常伟大的发现。为什么呢?我一说就明白,因为测到的霍尔电阻和研究的材料没有任何的关系。硅,可能任何材料都会有这个,它只和物理学常数,和自然界的一些基本性能相关,和具体材料没有任何关系。因此它就打开了我们认识微观世界、认识自然界的大门。
同时,量子霍尔效应给我们材料中运动的电子建造了一个高速公路,就像左边大家看到的动画一样,电子的高速公路上,它的欧姆电阻,平行于电流方向的电阻变成0,像超导一样。因此,用量子霍尔效应这样的材料做一个器件的话,它的能耗会非常低。
大家今天看到的是两条道的情况,是n=2。如果n=3,这个高速公路的一边就有3条道;如果n=4,电子的高速公路就变成4条道,所以这样一种理解就把自然数n,1、2、3、4、5、6、7、8和微观世界的电子高速公路密切结合起来。大家可以看到,我们对自然界的理解,对量子世界的理解又大大前进了一步。
冯·克利青在1980年发现量子霍尔效应以后,由于这个巨大的科学发现,五年以后他被授予诺贝尔物理学奖。
硅有量子霍尔效应,是不是其他半导体材料也会有量子霍尔效应呢?有三位物理学家在第二年,1982年就把研究的材料从硅变成了可以发光的砷化镓,结果,他们发现了分数化的,不是一二三四了,三分之一、五分之一,分数化的量子霍尔效应,1998年这三位物理学家获得诺贝尔物理学奖。
在我们这个世纪,大家都知道石墨烯,有两位物理学家利用石墨烯这个量子材料继续做一百年前的霍尔效应实验,结果发现了半整数的量子霍尔效应。随着量子霍尔效应的不断发现,我们对自然界,对材料,对量子材料,对未来材料的理解在电子层次上、在量子层次上逐渐加深,所以推动了科学,特别是物理学的巨大进步。
量子霍尔效应有很多应用,今天我讲一个大家比较熟悉的应用,那就是重量的测量。我们每天都希望测测体重,重量的测量无处不存在。1889年国际度量衡大会定义了公斤千克的标准,是9:1的铂铱合金做成的圆柱体,以后的一百多年,全世界都用这个做为标准称重量。
但是在118年以后的2007年,我们发现这个标准变化了:减轻了50微克。一个标准减少50微克是一个巨大的变化,全世界的标准就不再标准了,而且随着时间的推移也会进一步变化。因此我们需要更精确,可以用得更久的重量标准。
在2018年的时候,国际度量衡大会重新定义了公斤的标准,那就是基于刚才我提到的量子霍尔效应,和另一个诺奖工作、约瑟夫森效应提出了一个全新的称,叫量子称或者叫基布尔称,它对重量的测量精度可以达到10的负8次方克,而且是由物理学的自然界常数所定义的,1万年、10万年、1亿年也不会发生变化。这是我举的一个大家能理解的例子。
刚才我提到了三个不同版本的量子霍尔效应。它们需要一个磁场,就像霍尔效应一样,而且一般情况下需要的磁场都特别强,一般是10个特斯拉,10万个高斯,这是非常强大的磁场,我们庞大地球产生的磁场只有0.5高斯,我们要用的磁场是地球磁场强度的20万倍。能不能把它去掉磁场也能观察到量子霍尔效应呢?我带领的团队与合作者一起,在2013年的时候完成了这个实验,在世界上首次发现了不需要任何磁场、只需要材料本身的磁性而导致的量子霍尔效应,或者叫量子反常霍尔效应。
这样一个发现是不是也是材料驱动的呢?是的。我在这里给大家复习一下我们所熟悉的材料。在我们一般人的概念中,我们自然界的材料只有3类,导电的金属,不导电的绝缘体,还有一个是半导体,介于两者之间。
第一代半导体有硅、锗,第二代半导体有砷化镓、锑化汞,第三代、第四代还有氮化镓、碳化硅、金刚石等等。在研究材料和材料的相变基础上,包括量子霍尔效应上,有两个物理学家,一个是大家可能比较熟悉的华人物理学家张首晟,和宾夕法尼亚大学的Charles Kane,在这基础上他们提出了一个全新的材料:拓扑绝缘体,也就是大家在屏幕的最右边所能看到的。
什么是拓扑绝缘体?我给大家简单解释一下。这个图大家可能比较熟悉,最左边是一个陶瓷的碗,是绝缘的、不导电的。再朝右是一个金做成的碗,是导电的,叫导体。拓扑绝缘体就是一个陶瓷碗镀了一层导电的膜。如果把这个镀了膜的碗进一步进行磁性掺杂,使它有磁性的话,它就会变成一个只有边上镀金的碗。这个边上镀金碗就叫磁性拓扑绝缘体材料。
按照张首晟等的理论,它就可以让我们能观察到量子反常霍尔效应。但是,这个材料是一个三不像的矛盾体:它有磁性,它要拓扑,它还要绝缘,我们还要把它做成薄膜,这就要求一个运动员篮球打得像姚明那么好,跑步像博尔特那么快,跳水要全红蝉那么伶俐,这样的材料非常难以制备。为什么呢?因为大部分磁性材料都是导电的,铁、钴、镍都是导电的;另外,磁性和拓扑在物理上是很难共存的;还有一点,在两维薄膜的情况下,很难实现铁磁性,使这个才有真正的磁性。因此真正观测到量子反常霍尔效应,在实验室看到它,这是一个极其具有挑战性的实验。
我带领的团队和另外三个团队紧密合作,我们动员了20多位研究生,奋斗了4年,尝试了一千多个样品,最后在2012年10月份,全部完成了量子反常霍尔效应发现,完成了实验。我们证明了确实在边上镀金的碗(磁性拓扑绝缘体)中,存在量子反常霍尔效应这样一个新的规律。
今天,我特别把当时发现量子反常霍尔效应的样品带到了现场。大家可以看到,看到很多电级,电级之间有方块,每个方块上就是首先观察到的量子反常霍尔效应的样品。
这里我再给大家讲一下制备这个材料,对原子磁场的控制,对科学发现非常重要。这是其中一个例子,我们学生制备的,采集的一些照片。中间大家会看到,拓扑绝缘体碲化铋薄膜的扫描隧道显微镜照片,上头每一个亮点代表一个原子,更重要的是,在这个范围内你找不到一个缺陷。说明我们材料的纯度非常高,我们在其他材料中也能做到这个水平。
这是另一个拓扑绝缘体材料:硒化铋。大家可以看到,这么大的范围内,你只看到你想要的原子,没有任何缺陷,而且薄膜是原子级的平整,这为我们最后发现量子反常霍尔效应奠定了非常好的基础。
最近,我们继续在朝这个方向努力,我们正在攻克的一个问题就是高温超导机理这个重大科学问题。我再次放了博士后制备的研究高温超导机理异质结样品的电镜照片,大家从上可以看到有5个样品,不同的颜色代表这个异质结的结合部。大家可以看到,每个亮点几乎是接近一个原子,我们制备的异质结,两个材料的结合部几乎达到了原子尺度的完美,只有这样,我们才能在这样一个非常难以攻克的高温超导机理上有所作为,我们会沿着这个方向继续努力下去。
最优学习的85%规则
文章原题目:The Eighty Five Percent Rule for Optimal Learning
论文地址:https://www.biorxiv.org/content/10.1101/255182v1
1. “恰到好处”——学习的迷思
人们在学 习新技能时,例如语言或乐器,通常会觉得在能力边界附近进行挑战时感觉最好——不会太难以至于气馁,也不会太容易以至于感到厌烦。
历史传统中有所谓的中庸原则,我们也会有一种简单直觉经验,即做事要“恰到好处”。反映在学习中,即存在一个困难程度的“甜蜜点”,一个“金发姑娘区”。在现代教育研究中,在这个区域的不仅教学最有效果[1],甚至能解释婴儿在更多更少可学习刺激之间的注意力差异[2]。
在动物学习研究文献中,这个区域是“兴奋”[3]和“失落”[4]背后的原因,通过逐步增加训练任务的难度,动物才得以学习越来越复杂的任务。
在电子游戏中几乎普遍存在的难度等级设置中,也可以观察到这一点,即玩家一旦达到某种游戏水平,就会被鼓励、甚至被迫进行更高难度水平的游戏。
类似地,在机器学习中,对于各种任务进行大规模神经网络训练,不断增加训练的难度已被证明是有用的 [5,6],这被称为“课程学习”(Curriculum Learning)[7] 和“自步学习”(Self-Paced Learning)[8]。
尽管这些历史经验有很长的历史,但是人们一直不清楚为什么一个特定的难度水平就对学习有益,也不清楚最佳难度水平究竟是多少。
在这篇论文中,作者就讨论了在二分类任务的背景下,一大类学习算法的最佳训练难度问题。更具体而言,论文聚焦于基于梯度下降的学习算法。在这些算法中,模型的参数(例如神经网络的权重)基于反馈进行调整,以便随时间推移降低平均错误率[9],即降低了作为模型参数函数误差率的梯度。
这种基于梯度下降的学习构成了人工智能中许多算法的基础,从单层感知器到深层神经网络[10],并且提供了从感知[11],到运动控制[12]到强化学习[13]等各种情况下人类和动物学习的定量描述。对于这些算法,论文就训练的目标错误率提供了最佳难度的一般结果:在相当温和的假设下,这一最佳错误率约为15.87%,这个数字会根据学习过程中的噪音略有不同。
论文从理论上表明,在这个最佳难度下训练可以导致学习速度的指数级增长,并证明了“85%规则”在两种情况下的适用性:一个简单的人工神经网络:单层感知机,以及一个更复杂、用来描述人类和动物的感知学习[11]的类生物神经网络(biologically plausible network)。
2. 计算最优学习率
在标准的 二分类任务中,人、动物或机器学习者需要输入的简单刺激做出二元标签分类判断。
例如,在心理学和神经科学[15,16]的随机点动实验(Random Dot Motion)范例中,刺激由一片移动的点组成 – 其中大多数点随机移动,但有一小部分连贯一致地向左或向右移动。受试者必须判断相应一致点的移动方向。
决定任务感知判断难度的一个主要因素是一致移动点所占的比例。如下图所示,一致点占0%时显然最难,100 %时最容易,在 50%时难度居中。
实验人员可以在训练过程中使用被称为“阶梯化”(staircasing)的程序[17]控制这些一致移动点的比例以获得固定的错误率。
论文假设学习者做出的主观决策为变量 h,由刺激向量 x(如所有点的运动方向) 的经函数 Φ 计算而来,即:h = Φ(x, φ) ——(1),其中φ是可变参数。并假设变换过程中,会产生一个带噪声表示的真实决策变量Δ(例如,向左移动点的百分比),即又有 h = ∆ + n ——(2)。
噪声 n 由决策变量的不完全描述而产生的,假设 n 是随机的,并从标准偏差σ的零均值正态分布中采样。设 Δ = 16,则主观决策变量 p(h) 的概率分布如图1A所示。
红色曲线是学习之后新的曲线,可以看到其分布标准差σ比原来有所降低,使更多变量分布在了Δ=16 附近。这就说明学习者在学习之后决策准确度有所提高。曲线下方的阴影区域面积(积分)对应于错误率,即在每个难度下做出错误响应的概率。
如果把决策界面(decision boundary)设置为 0,当 h > 0 时模型选择选项 A,当 h < 0 时选择 B, h = 0 时随机选择。那么由带噪声表示的决策变量导致的错误概率分布为:
其中 F(x) 是噪声标准正态分布的累积分布函数,概率密度函数 p(x)= p(x|0,1)。由等式(3)可以得到β = 1/σ。即若 σ 为正态分布的标准差,则 β 精确表示了在任务难度Δ下学习者的技能水平。σ越小,β越大,技能水平越高。
如图1B所示,无论学习前还是学习后,随着决策变得更容易(Δ增加),两条曲线皆趋于下降,从而使错误率变得更低。
但两条曲线的下降速度是不一样的:当β增加(σ变小)后,曲线更集中和陡峭,因此学习之后的红色曲线下降速度也更快,这表示学习者对任务挑战的技能水平越趋于完善。
由最初的公式(1) 可知,学习的目标是调整参数φ,使得主观决策变量 h 更好地反映真实决策变量Δ。即构建模型的目标应该是尽量去调整参数φ以便减小噪声 σ 的幅度,或者等效地去增加技能水平精度 β。
实现这种调节的一种方法是使用误差率函数的梯度下降来调整参数。例如,根据时间 t 来改变参数。论文在将梯度转换为精度β的表示后,发现影响因子只在于最大化学习率 ∂ER/∂β 的值,如图1C所示。显然,最佳难度Δ随着技能水平精度β的函数 dER/dβ 而变化,这意味着必须根据学习者的技能水平实时调整学习难度。不过,通过Δ和ER之间的单调关系(图1B),能够对此以误差率ER来表达最佳难度,于是可以得到图1D。
在变换后,以误差率表达的最佳难度是一个精度函数的常量。这意味着可以通过在学习期间将误差率钳制在固定值上实现最佳学习。论文通过计算得出,对于高斯分布的噪声这个固定值是:
——即最佳学习率下误差率约为 15.87 %。
3. 模拟验证:感知机模型
为了验证“85%规则”的适用性,论文模拟了两种情况下训练准确性对学习的影响:在人工智能领域验证了经典的感知机模型,一种最简单的人工神经网络,已经被应用于从手写识别到自然语言处理等的各种领域。
感知机是一种经典的单层神经网络模型,它通过线性阈值学习过程将多元刺激 x 映射到二分类标签 y 上。为了实现这种映射,感知机通过神经网络权重进行线性变换,并且权重会基于真实标签 t 的反馈进行更新。也就是说,感知机只有在出错时才进行学习。自然的,人们会期望最佳学习与最大错误率相关。然而,因为感知机学习规则实际上是基于梯度下降的,所以前面的分析对这里也适用,即训练的最佳错误率应该是15.87%。
为了验证这个预测,论文模拟了感知机学习情况。以测量范围为0.01到0.5之间的训练误差率,步长为0.01(每个误差率1000次模拟)训练。学习的程度由精确度β确定。正如理论预测的那样,当以最佳错误率学习时,网络学习效率最高。如图2A所示,不同颜色梯度表示了以相对精度β/βmax 作为训练误差率和持续时间的函数,在 β=βmax 时学习下降最快;在不同错误率比例因子下的动态学习过程,图2B也显示,理论对模拟进行了良好的描述。
图2:“85%规则”下的感知机
4. 模拟验证:类生物神经网络
为了证明“85%规则”如何适用于生物系统学习,论文模拟了计算神经科学中感知学习的“Law和Gold模型”[11]。在训练猴子学会执行随机点运动的任务中,该模型已被证明可以解释包括捕捉行为、神经放电和突触权重等长期变化情况。在这些情况下,论文得出相同结果,即当训练以85%的准确率进行时,学习效率达到最大化。
具体来说,该模型假设猴子基于MT脑区的神经活动做出有关左右感知的决策。MT区在视觉系统的背侧视觉通路(Dorsal visual stream),是已知在大脑视觉中表征空间和运动信息的区域[15],也被称为“空间通路”(where),相对的,视觉系统另一条腹侧视觉通路(Ventral visual stream)则表征知觉形状,也被称为“辨识通路”(what)。
在随机点动任务中,已经发现MT神经元对点运动刺激方向和一致相关性 COH 都有响应,使得每个神经元对特定的偏好方向响应最强,且响应的幅度随着相关性而增加。这种激发模式可通过一组简单的方程进行描述,从而对任意方向与相关刺激响应的噪声规模进行模拟。
根据大脑神经集群响应情况,Law 和 Gold 提出,动物有一个单独脑区(侧面顶侧区域,LIP)用来构建决策变量,作为MT中活动的加权和。不过它与感知机的关键差异在于,存在一个无法通过学习来消除的随机神经元噪声。这意味着无论多么大量的学习都不可能带来完美的性能。不过,由论文计算结果所示,不可约噪声的存在不会改变学习的最佳精度,该精度仍为85%。
Law and Gold 模型和感知机的另一个区别是学习规则的形式。具体来说就是有基于预测误差正确的奖励,会根据强化学习规则进行更新权重。尽管与感知器学习规则有很大的不同,但Law和Gold模型仍然在误差率[13]上实现梯度下降,在 85%左右实现学习最优。
为了测试这一预测,论文以各种不同的目标训练误差率进行了模拟,每个目标用MT神经元的不同参数模拟100次。其中训练网络的精度β,则通过在1%到100%之间以对数变化的一组一致性测试上,拟合网络的模拟行为来进行估计。
如图3A所示,在训练网络精确度β作为训练错误率的函数下,蓝色的理论曲线很好描述了训练后的精度。其中灰点表示单次模拟的结果。红点对应于每个目标误差率的平均精度和实际误差率。
此外,在图3B中,以三条不同颜色测量曲线显示了三种不同训练错误率下行为的预期差异 。可以看到,在误差率为 0.16 (接近 15.87%)的黄色曲线上,结果精确度高于过低或过高误差率的两条曲线,即取得了最优的训练效果。
5. 心流的数学理论
沿着相同的思路,论文的工作指向了“心流”状态的数学理论[17]。这种心理状态,即“个体完全沉浸在没有自我意识但具有深度知觉的控制”的活动,最常发生在任务的难度与参与者的技能完全匹配时。
这种技能与挑战之间平衡的思想,如图4A所示,最初通过包括另外两种状态的简单概念图进行描述:挑战高于技能时的“焦虑”和技能超过挑战时的“无聊”,在二者中间即为“心流”。
而以上这三种不同性质的区域:心流,焦虑和无聊,可以本篇论文的模型中自然推演出来。
设技能水平为精度 β,以真实决策变量的反函数 1 /Δ 为技能挑战水平。论文发现当挑战等于技能时,心流与高学习率和高准确性相关,焦虑与低学习率和低准确性相关,厌倦与高准确性和低学习率相关(图4B和图C)。
也就是说,在技能与挑战水平相等时以“心流”状态进行的学习,具有最高的学习率和最高的准确性。
此外论文引述了 Vuorre 和 Metcalfe 最近的研究[18]发现,心流的主观感受达到巅峰时的任务是往往主观评定为中等难度的任务。而在另一项关脑机接口控制学习方面的研究工作发现,主观自我报告的最佳难度测量值,在最大学习任务相关难度处达到峰值,而不是在与神经活动的最佳解码相关难度处达到峰值[19]。
那么一个重要的问题来了,在使用最佳学习错误率,达到主观最佳任务难度即心流状态进行学习时,其学习速度究竟有多快?
论文通过比较最佳错误率与固定但可能次优的错误率、固定难度进行学习来解决了这个问题。通过对训练误差率函数计算,最终得到,在固定错误率下:学习技能β精度随着时间 t 的平方根而增长。
而相对的,在没有使用最佳固定错误率学习,即决策变量固定下一般学习,其结果会强烈地依赖于噪声的分布。不过论文计算出了噪声为正态分布的情况下的近似解,对β的提升,学习技能以更慢的对数速度增长。即若最佳训练率下,可以相当于对后者实现指数级增长的改进。二者学习增速趋势对比图如下:
从论文对感知机和Law and Gold 模型测试,心流理论的数学化可以看出,未来研究者们去测试各种学习类型活动参与度的主观测量值,验证是否在最大学习梯度点达到峰值,“85%规则”是否有效将会是有非常有趣的。
然而这篇论文的作用还远不仅于此,下面就本文意义做进一步深入探讨。
6. 学习的定量时代? 讨论、延伸与启示
学习对个体生物个体的重要性不言而喻,甚至比大多数人想得更重要。在2013年1月,《心理学通报与评论》上发表了一篇 论文①的就认为,学习不仅一个是认知过程,在更本质的功能层面是一种个体自适应过程,包括生物体在有机环境规律作用下的行为改变,并认为就如演化论是生物学核心一样,学习研究应该是心理学的核心。
然而,自心理学诞生后的诸多理论,对学习的研究往往止于简单行为操作或概念描述层面。比如行为主义研究者巴普洛夫和和斯金纳经典条件反射、操控条件反射,苏联心理学家维果斯基(Lev Vygotsky)有关儿童教育的“最近发展区”理论,有关动机和表现之间的关系的耶基斯–多德森定律(Yerkes–Dodson law)、基于舒适-学习-恐慌区的“舒适圈理论”,还包括米哈里·契克森米哈赖的“心流理论”,安德斯·艾利克森的“刻意练习”等等。
这些学习理论,要么强调学习需要外部刺激相关性、或正向奖励负向惩罚的某些强化,要么强调学习在大周期的效果,或较小周期的最小行动,要么寻求某种任务难度与技能水平、或动机水平与表现水平之间的一个折中区域。但是却从来没有给出如何到能达这种状态的条件,往往只能凭借有教育经验的工作者在实际教学中自行慢慢摸索。
而在这篇论文中,研究者考虑了在二分类任务和基于梯度下降的学习规则情况下训练准确性对学习的影响。准确计算出,当调整训练难度以使训练准确率保持在85%左右时,学习效率达到最大化,要比其他难度训练的速度快得多,会使学习效果指数级快于后者。
这个结果理论在人工神经和类生物学神经网络具有同样的效果。即“85%规则”既适用于包括多层前馈神经网络、递归神经网络、基于反向传播的各种深度学习算法、玻尔兹曼机、甚至水库计算网络(reservoir computing networks)[21, 22])等广泛的机器学习算法。通过对∂ER/∂β梯度最大化的分析,也证明其适用于类生物神经网络的学习,甚至任何影响神经表征精确度的过程,比如注意、投入或更一般的认知控制[23,24]。例如在后者中,当∂ER/∂β最大化时,参与认知控制的好处会最大化。通过关联预期价值控制理论(Expected Value of Control theory)[23,24,25]的研究,可以知道学习梯度 ∂ER/∂β 由大脑中与控制相关的区域 ( 如前扣带回皮层 ) 来进行监控。
因此可以说,本篇论文无论对计算机科学和机器学习领域研究,还是对心理学和神经科学研究,都具有重要的意义。
在前者,通过“课程学习”和“自步学习”诉诸广泛的机器学习算法,本文基于梯度下降学习规则思路下包括神经网络的各种广泛学习算法,都急需后续研究者进行探索和验证。在最佳学习率上,论文的工作仅仅是对机器学习学习效率数学精确化实例的第一步。并且同时也促使研究者思考:如何将这种最优化思路推广到在更广泛的环境和任务的不同算法中?例如贝叶斯学习,很明显和基于梯度下降的学习不同,贝叶斯学习很难受益于精心构建的训练集,无论先出简单或困难的例子,贝叶斯学习者会学得同样好,无法使用 ∂ER/∂β 获得“甜蜜点”。但跳开论文研究我们依然可以思考:有没有其它方法,例如对概念学习,通过更典型或具有代表性的样本、以某种设计的学习策略来加快学习速度和加深学习效果?
另一方面,这篇论文的工作同样对心理学、神经科学和认知科学领域有重大启示。
前面已经提到,有关学习理论大多止步于概念模型和定性描述。除了少数诸如心理物理学中的韦伯-费希纳定律(Weber-Fechner Law)这样,有关心理感受强度与物理刺激强度之间的精确关系,以及数学心理学(Mathematical psychology)的研究取向和一些结论,缺乏数学定量化也一直是心理学研究的不足之处。
而这篇论文不仅结论精确,其结论适用于包括注意、投入或更一般的认知控制下任何影响神经表征精确度的过程。如前所述,如果我们采取“学习不仅一个是认知过程,在更本质的功能层面是一种个体自适应改变过程”有关学习本质的观点,会发现它带来的启示甚至具有更大的适用性,远远超出了一般的认知和学习之外。
例如,在知觉和审美方面的研究中,俄勒冈大学(University of Oregon)的物理学 Richard Taylor 通过对视觉分形图案的研究发现,如设白纸的维度D为1,一张完全涂黑的纸的维度D为2,即画出来的图形维度在 1~2 之间,那么人类的眼睛更偏好于看维度 D=1.3 的图形[26]。事实上许多大自然物体具有的分形维度就是 1.3,在这个复杂度上人们会感到最舒适。一些著名的艺术家,比如抽象表现主义代表人物 ( Jackson Pollock ),他所画的具有分形的抽象画(下图中间一列,左边是自然图,右边为计算机模拟图)分布在 D=1.1 和 1.9 之间,具有更高分形维度的画面会给人带来更大的压迫感[27]。
心理学家 Rolf Reber 在审美愉悦加工的流畅度理论(Processing fluency theory of aesthetic pleasure)中[28]提出,我们有上述这种偏好是因为大脑可以快速加工这些内容。当我们能迅速加工某些内容的时候,就会获得一个正性反应。例如加工 D = 1.3的分形图案时速度很快,所以就会获得愉悦的情绪反应。此外,在设计和艺术领域心理学家域唐纳德·诺曼(Donald Arthur Norman)和艺术史学家贡布里希(Ernst Gombrich)也分别提出过类似思想。
对比下 D = 1.3 和 15.87% 的出错率,如果进行下统一比例,会发现前者多出原有分形维复杂性和整体的配比,未知:已知(或熟悉:意外,秩序与复杂)约为 0.3/1.3 ≈ 23.07%,这个结果比15.87%要大。这种计算方法最早由数学家 George David Birkhoff 在1928 年于《Aesthetic Measure》一书中提出,他认为若 O 为秩序,C 为复杂度,则一个事物的审美度量 M = O/C。
因此,在最简化估计下,可以类似得出 23.07% 额外信息的“最佳审美比”,会让欣赏者感到最舒适。
当然,因为信息复杂度的计算方法不一,上面只是一个非常粗略的估计。审美过程涉及感觉、知觉、认知、注意等多个方面,并且先于狭义的认知和学习过程,因此最佳审美比应该会15.87%要大。但至于具体数值,很可能因为不同环境和文化对不同的主体,以及不同的计算方法有较大差别,例如有学者从香农熵和柯尔莫哥洛夫复杂性方面进行度量的研究[29]。
但不管怎样,从这篇文章的方法和结论中,我们已可以得到巨大启示和信心,无论是在人工智能还是心理学或神经科学,无论学习还是审美、知觉或注意,在涉及各种智能主体对各种信息的处理行为中,我们都可能寻求到一个精确的比例,使得通过恰当选取已知和未知,让智能主体在体验、控制或认知上达到某种最优。而这种选取的结果,会使积累的效果远超自然过程得到改进。从这个意义上讲,这篇论文影响得很可能不只是某些科学研究方向,而是未来人类探索和改进自身的根本认知和实践方法。
参考资料
- Celeste Kidd, Steven T Piantadosi, and Richard N Aslin. The goldilocks effect: Human infants allocate attention to visual sequences that are neither too simple nor too complex. PloS one, 7(5):e36399, 2012.
- Janet Metcalfe. Metacognitive judgments and control of study. Current Directions in Psychological Science, 18(3):159–163, 2009.
- BF Skinner. The behavior of organisms: An experimental analysis. new york: D.appleton-century company, 1938.
- Douglas H Lawrence. The transfer of a discrimination along a continuum. Journal of Comparative and Physiological Psychology, 45(6):511, 1952.
- J L Elman. Learning and development in neural networks: the importance of starting small. Cognition, 48(1):71–99, Jul 1993.
- Kai A Krueger and Peter Dayan. Flexible shaping: How learning in small steps helps.Cognition, 110(3):380–394, 2009.
- Yoshua Bengio, Jérˆ ome Louradour, Ronan Collobert, and Jason Weston. Curricu- lum learning. In Proceedings of the 26th annual international conference on machine learning, pages 41–48. ACM, 2009.
- M Pawan Kumar, Benjamin Packer, and Daphne Koller. Self-paced learning for latent variable models. In Advances in Neural Information Processing Systems, pages 1189–1197, 2010.
- David E Rumelhart, Geoffrey E Hinton, Ronald J Williams, et al. Learning represen- tations by back-propagating errors. Cognitive modeling, 5(3):1, 1988.
- Yann LeCun, Yoshua Bengio, and Geoffrey Hinton.Deep learning.Nature, 521(7553):436–444, 2015.
- Chi-Tat Law and Joshua I Gold. Reinforcement learning can account for associative and perceptual learning on a visual-decision task. Nat Neurosci, 12(5):655–63, May 2009.
- WI Schöllhorn, G Mayer-Kress, KM Newell, and M Michelbrink.Time scales of adaptive behavior and motor learning in the presence of stochastic perturbations.Human movement science, 28(3):319–333, 2009.
- Ronald J Williams. Simple statistical gradient-following algorithms for connectionist reinforcement learning. Machine learning, 8(3-4):229–256, 1992.
- Frank Rosenblatt. The perceptron: A probabilistic model for information storage and organization in the brain. Psychological review, 65(6):386, 1958.
- William T Newsome and Edmond B Pare. A selective impairment of motion perception following lesions of the middle temporal visual area (mt). Journal of Neuroscience, 8(6):2201–2211, 1988.
- Kenneth H Britten, Michael N Shadlen, William T Newsome, and J Anthony Movshon.The analysis of visual motion: a comparison of neuronal and psychophysical perfor- mance. Journal of Neuroscience, 12(12):4745–4765, 1992.
- Mihaly Csikszentmihalyi. Beyond boredom and anxiety. Jossey-Bass, 2000.
- Matti Vuorre and Janet Metcalfe. The relation between the sense of agency and the experience of flow. Consciousness and cognition, 43:133–142, 2016.
- Robert Bauer, Meike Fels, Vladislav Royter, Valerio Raco, and Alireza Gharabaghi.Closed-loop adaptation of neurofeedback based on mental effort facilitates reinforce- ment learning of brain self-regulation. Clinical Neurophysiology, 127(9):3156–3164, 2016.
- De Houwer J1, Barnes-Holmes D, Moors A..What is learning? On the nature and merits of a functional definition of learning.https://www.ncbi.nlm.nih.gov/pubmed/23359420
- Herbert Jaeger. The “echo state” approach to analysing and training recurrent neural networks-with an erratum note. Bonn, Germany: German National Research Center for Information Technology GMD Technical Report, 148(34):13, 2001.
- Wolfgang Maass, Thomas Natschläger, and Henry Markram. Real-time computing without stable states: A new framework for neural computation based on perturba- tions. Neural computation, 14(11):2531–2560, 2002.
- Amitai Shenhav, Matthew M Botvinick, and Jonathan D Cohen. The expected value of control: an integrative theory of anterior cingulate cortex function. Neuron, 79(2):217–240, 2013.
- Amitai Shenhav, Sebastian Musslick, Falk Lieder, Wouter Kool, Thomas L Griffiths, Jonathan D Cohen, and Matthew M Botvinick. Toward a rational and mechanistic account of mental effort. Annual Review of Neuroscience, (0), 2017.
- Joshua W Brown and Todd S Braver. Learned predictions of error likelihood in the anterior cingulate cortex. Science, 307(5712):1118–1121, 2005.
- Hagerhall, C., Purcell, T., and Taylor, R.P. (2004). Fractal dimension of landscape silhouette as a predictor for landscape preference. Journal of Environmental Psychology 24: 247–55.
- A Di Ieva.The Fractal Geometry of the Brain.
- Rolf Reber, Norbert Schwarz, Piotr Winkielman.Processing Fluency and Aesthetic Pleasure:Is Beauty in the Perceiver’s Processing Experience.http://dx.doi.org/10.1207/s15327957pspr0804_3
- Rigau,Jaume Feixas,Miquel Sbert,Mateu.Conceptualizing Birkhoff’s Aesthetic Measure Using Shannon Entropy and Kolmogorov Complexity. https://doi.org/10.2312/COMPAESTH/COMPAESTH07/105-112
马亮:政策实验室、政府创新与新文科建设
文章略有节编。
新文科实验室建设对于服务公共管理的教学、研究和实践,实现官产学研用的打通和融合意义重大。在公共管理实践中涌现出的政策实验室,与新文科实验室在很多方面有异曲同工之妙,二者有进一步融合的潜在空间。本文将从比较政策创新中政策与政策试点的差异切入,进而回顾政策实验室兴起和发展的历程,探讨新文科实验室建设对于政策实验和政府创新的价值,并提出进一步建设新文科实验室的对策建议。
一、政府创新中的政策实验与政策试点
(一)实验何以重要
实验(experiment)往往被视为现代科学研究的黄金标准,不少人认为它是进行因果推断的不二法门。比如,2019年和2021年两届诺贝尔经济学奖都颁发给了在实地实验和因果推断方面作出贡献的经济学家。在实验中,随机对照实验(RCTs)被认为是进行政策评估的金科玉律,因为它满足了一些基本条件,使因果推断更为可靠。实验背后的思想反映在“反事实”逻辑,即我们可以通过实验来回答“假如……怎样”的问题。
实验的主要特征包括随机化(randomization)、干预或处理(treatments)、实验环境的可控性(controllability)、“双盲”(double blind)、实验组与对照组的匹配与比较。为什么要这样设计?原因就在于要确保实验组与对照组的可比性,确保实验效应的一致性,排除环境和条件因素的干扰,避免实验人员的偏见,并确保结果归因的唯一性。
首先,在控制组(即反事实)与实验组的分组方面要确保随机分组,即每个政策干预对象都有同等机会被选入实验或作为对照。其次,对实验组的各个政策干预对象都施加同样的干预或采取同样的处理,这样可以更好地比较其影响。再次,为了避免其他因素干扰,通常在完全受控的实验室中进行实验,而这在现实政策实验中往往难以达到,但是人们要尽可能地模拟实验室环境。复次,为了避免心理作用等带来的影响,需要确保实验对象之间独立且互不干扰,避免信息沟通带来的实验对象污染。最后,通过将实验组和对照组的前测与后测进行比较,就可以获得政策干预带来的净效应。
不少发达国家开展的政策实验(policy experiment),就是基于行为科学与循证决策思想,通过随机对照实验和因果推断来进行政策实验,为政策决策提供有效支撑。在政策评估中,实验设计或准实验设计有助于排除其他干扰因素,评估某项政策的净效应。同时,循证实践的崛起,推动政府决策更加科学,特别是基于科学证据进行决策更加依赖实地实验提供的严谨证据。比如,行为公共管理学的发展使越来越多的公共管理研究使用实验设计,包括实验室实验、调查实验、实地实验等。
(二)政策试点与政策实验的差异
在政策创新中,一直存在政策试点、示范与政策实验的路径选择问题。实验主义更多强调大胆探索,而不限于科学严谨的实验法,包括实验性治理(experimentalist governance)、分级制实验(experimentation under hierarchy)、引导创变(directed improvisation)等概念。从中国改革开放来看,国家治理的优秀经验集中表现在公共政策的试点、试验与示范。
政策试点(policy pilot)是对某项政策方案进行测试和评估,确定其是否可行有效和可以推广。政策试点既可以是试对(预设政策方案是合适的,通过试点来为其提供证据支持),也可以是试错(政策方案的可行性是不确定的,通过排除错误方案来确保正确方案脱颖而出),但其预期结果应是开放的。政策示范(policy model/demonstration)是通过树典型、立榜样、设标杆和遴选最佳实践,通过示范项目来引领其他地区和部门。一些地区被列为“先行先试区”,更多是带有探索色彩的试验;一些地区则被冠以“先行示范区”,意味着其在引领改革方面扮演重要角色。
政策试点、示范和实验之间有何不同?不少学者对此进行了探讨,明确了试点、示范与实验的异同。从方法论角度分析,差别在于分组与抽样、干预、环境三个方面,这使政策试点和示范都是准实验,缺失严格实验的某些关键要素,进而导致对其效果进行评估时面临的方法论挑战(如表1所示)。
1.分组与抽样
实验设计需要设立实验组和控制组,一般采取随机分组方式,确保二者是可比的,避免选择偏差带来的实验结果偏误。实验分组需要遵循随机抽样原则,确保分组的随机性,但在代表性和典型性方面未必合理。相对来说,政策试点强调能够代表各类地区,使试点在未来推广时有更强的普适性。为了使政策试点达到预期效果,往往会采取试点地区差异最大化的原则,有目的地选择基础条件不同的若干个地方或部门,而地域多样性可以尽可能保证试点在环境不同的地区都能够同步检验。
实验是实验人员确定谁进入何组,“被试”是被动接受实验、处理或干预的。但在选择试点单位方面,则是双向选择而非单方面分组。试点单位的选择往往是多轮次开展而非一次性进行的,一般先是上级政府部门公开征集,然后是地方政府部门自愿申报,经过上级评审遴选后公示试点单位名单。这样一来,谁参与试点都是公开的,也就难以避免试点地区之间的相互影响,以及非试点地区的学习和模仿,进而使试点效应评估面临难题。同时,选择试点的地区数量多少、是竞争性还是非竞争性的遴选、是限额还是不限额等,都存在较大差异,也使政策试点有较强的多样性。比如,2019年中央政法委启动的“全国市域社会治理现代化试点合格城市”就属于不限额且非竞争的,只要达标即可入围。
政策示范是由点到面或以点带面地树立典型,选取的都是成功的榜样,因此没有代表性,也无随机性可言。从中央政府部门设立各种示范城市项目的初衷来看,也有较大差异,使政策示范同实验的差异各不相同。值得注意的是,在政策实验中面临的问题是,试点地区为了得到好评,导致试点很少不成功的,示范没有不成功的。在预定结果确定的情况下,地方政府可能为了实现试点成功而使试点偏离初衷,导致试点结果不可信。
2.干预
在实验中,实验人员对同组被试做出相同的干预(实验、操控或处理),确保实验效应是可以精准度量和比较的。但在政策试点中,政策干预的主体和方式都有所不同,因此同实验相去甚远。试点单位不是被动接受政策干预,而是主动开展有创造性的政策创设和检验。试点地区可能同时开展多种不同政策试点,有时候是加挂多块政策试点牌子。试点一个政策选项还是同时试点多个政策选项,显然会影响每项政策试点的效果。
试点的目的是解决不知道怎么做才对的问题,带有探索性和不确定性,所以需要“摸着石头过河”。试点单位不是作为“被试”被动接受实验,而是要强调自主性和主动性。试点单位作为实验的策划者、组织者和参与者,要积极主动地争取、组织和开展实验,而这是有别于实验逻辑的。
试点的核心是为了试验尽可能多的不同政策方案,而不是验证一种政策方案。所以,各地都是“八仙过海各显神通”,试点的方式各不相同,并尽可能突出地方的鲜明特色。实验的干预方式是预先设定的,而试点的政策方案是即兴发挥的,各地在试点过程中也会不断调整和改变。从政策试点来看,政策目标是清晰的,但政策手段是模糊的,无论是中央还是地方都不清楚,所以政策方案往往是在试点启动后才逐渐清晰和确定的。这往往是中央指导,地方创设,互学互鉴,地方成功后即全国复制推广。比如,2013年在上海试点自由贸易试验区,很快在全国其他地区设立,进而推动一大批制度改革成果复制推广。
3.环境
实验要求在同样的环境条件下进行,这样可以确保实验组和控制组的差异归因为实验本身。但是,各地在资源禀赋、领导重视程度、试点单位的自主性和能力等方面都有很大不同,导致政策试点效果的归因困难,一些地区甚至出现刻意栽培的“政策盆景”。因此,试点成败不仅同试点本身有关,也同试点环境有关。比如,上海浦东试点法院员额制改革,其本身效果较好,但在全国推广时却在不少地区出现“水土不服”情况。
实验要求“双盲”,即实验人员不知道谁进入实验组,被试也不知道自己是否属于实验组。这有助于排除传染效应,而设立安慰剂组则可以进一步排除人们接受干预的心理作用。政策试点往往是地方竞争、中央遴选和完全公开,所有地区和部门都知道谁是试点单位,试点单位相互之间也心知肚明。试点单位之间相互竞争,都希望成为中央中意的政策方案,所以往往暗中较劲,甚至“只做不说”。
同时,政策试点可能会在多层级政府中同时或序贯进行,导致政策试点的嵌套性较强。比如,政策试点不仅有国家级试点,还有省级试点和市级试点,而这种地方试点往往是在未入选国家级试点的地区进行。地方政府也会率先培育政策试点,并为申报国家级试点打好基础,由此导致试点先行带来的评估难题。
(三)政策试点还是政策实验?
政策创制可以使用试点、示范或实验等模式,因此,需要关注不同政策创制方式有何异同,以及为什么不同国家采取不同路径。政策创制究竟采取政策试点或示范,还是推行政策实验,取决于政治体制与行政文化,也同决策者的观念和意识有关。当然,也不应刻意将试点与实验视为二元对立的模式,它们可能从属于一个更大的连续统一体或共同谱系,只不过采取了不同的逻辑与评判标准。基于方法论的比较显示,实验可谓演绎法指导的定量研究,而试点是归纳法指导的定性研究。实验是对一个理论假设进行检验,而试点是对多个理论假设进行比较。实验生产普遍知识,而试点生产实用知识。
西方政治体制中,不同政策方案的选择与论证需要强有力的支持,才能避免被政党利益和意识形态干扰。比如,吸烟有害健康在今天来看是确凿无疑的,人类活动毫无疑问是造成气候变化的重要原因,但要想让人接受这些观点,却需要大量坚实的科学证据基础。因此,通过政策实验获得选民支持,对于西方民主体制尤为重要。当然,严格意义上的真实验往往可遇不可求,在很多情况下也无法在实际情形中推行。相对来说,大量政策实验都是准实验(quasi-experiment),在某些方面不满足基本条件,但是可以通过一些补救措施来对实验效应进行评估。
近年来,我国特别强调“顶层设计”,但政策试点依然有很强的生命力。如果是需要突破既有法律法规框架的创新,就需要中央授权;如果是在既定制度框架内的创新,则可以由地方自主开展。政策试点的多样性较强,不能一概而论或“一刀切”。因此,有必要建立政策试点的分类体系,并解释中央政府部门为何设立各种试点和示范项目。比如,在为什么试点方面,试点的目标不同;在谁来试点方面,发起试点的部门不同;在谁被试点方面,选取的点不同;在试点什么方面,试的方案不同;在哪里试点方面,试点的环境不同;在何时试点方面,试点的轮次和批次不同;在如何试点方面,试点的含金量不同。
政策过程复杂而微妙,涉及许多行动者、资源和解决方案,很难通过简单的实验加以评估。政策试点的重点不在于政策试点项目本身成功与否,或者说为了产生规模效应,而是要通过政策试点结果来了解不同行动者对政策的反应。对于中国这样的大国而言,政策创制与推广之间存在很强的张力。为了避免某项政策出台后带来的大规模失败风险,往往需要采取分级制的政策试点。政策试点推广的不同阶段也遵循不同逻辑,导致试点的推广带来不同的影响。比如,中国公立医院改革试点从2010年开始分四批进行,遴选了103个试点城市。通过和106个非试点城市比较,可以识别五种不同试点组态:再接再厉型的挑战“破冰者”、取长补短型的短板“主攻手”、一马当先型的创新“排头兵”、背水一战型的逆势“突围者”、以身作则型的区域“领头羊”。
上述讨论表明,政策试点和标准的实验设计有很多区别,而之所以不少国家和地区的政府选择政策试点而不是开展政策实验,同许多现实考虑有关。但是,鉴于实验设计在科学研究与政策创制方面的双重价值,有必要探讨如何使其融合式发展,从而既产生科学知识也提供政策知识。在某种意义上来说,政策实验室的诞生与发展部分回应了这一诉求。
二、政策实验室的兴起与发展
(一)政策实验室因何而起
近年来,越来越多的国家和城市建设政策实验室(policy lab)、城市实验室、政策创新实验室或公共部门创新实验室,对政策创新进行设计、实验、评估和推广。政策实验室日益兴起,既同行为科学(behavioral science)的崛起有关,也同循证决策(evidencebased policymaking)的流行离不开。同时,政策实验室也推动智库转型,使其从思想库走向证据库,除了促进思想创新和传播,也在开发和积累科学证据。当然,以ChatGPT为代表的新一代生成式人工智能(AIGC)技术也有利于推动循证治理,通过科学证据的加速扩散和利用来提升政府决策科学化。
政策实验室是一种对政策进行实验的组织,主要开展政策实验与政策评估,帮助决策者回答“什么奏效”(what works)和为什么。一方面,政策实验室突出创新思维,聚焦存在突出问题与严峻挑战的政策领域,通过头脑风暴、集思广益来征集政策创意和创造性解决方案。另一方面,政策实验室遵循行为科学,采用严谨的实验设计与政策评估方法,对已有政策和政策方案进行检验、评估和完善,为政府部门修改、使用和推广政策提供专家咨询与决策辅助。
政策实验室的先锋当属英国的行为洞察力团队(Behavioral Insights Team, BIT)。BIT在2010年由英国政府成立,后发展成为社会企业,2021年完全并入创新慈善机构Nesta。BIT最早为英国首相办公室和内阁部门服务,总结了让政策奏效的四大法宝,即EAST法则——通过让公共政策简单易懂(easy)、富有吸引力(attractive)、与己相关(social)和及时速效(timely),为很多政府部门提供了政策决策支持。此外,BIT还总结了MINDSPACE法则,提出一套通过政策干预来改变人们行为的组合拳,包括信使(Messenger)、激励(Incentives)、规范(Norms)、默认(Defaults)、显著(Salience)、启动(Priming)、情感(Affect)、承诺(Commitments)、自我(Ego),每个方面都可以形成富有价值的政策工具。BIT推动的政策创新典型案例是电子烟政策。不少国家将电子烟视为百害而无一利的“毒品”或需要严加监管的新型烟草产品,英国政府却率先将电子烟作为禁烟办法,消费者可以在药店通过医疗保险来购买电子烟。虽然电子烟可能诱导未成年人吸烟,但在前期政策实验的基础上,英国政府审慎地推动了这项政策,使人口吸烟率明显下降。
从政策实验室的崛起与扩散来看,全球迄今已有上百个政策实验室,其中大约有65个在欧盟成员国。就澳大利亚和新西兰的调查来看,也有52家之多。政策实验室是政策创新的未来吗?从政策扩散的驱动机制来看,府际竞争与学习造就的“民主实验室”孵化政策创意并检验政策效果。政策实验室将这些政策扩散机制制度化,使其能够更加有效地推动政策创新的实验和推广,毫无疑问有利于增强政府部门的创新能力。
(二)政策实验室的不同模式
虽然各国政策实验室有不同名称,如创新实验室、政策创新实验室、政策实验室等,但都可以归类概括为几种主要模式。有学者从研究方法和路径的角度划分为设计实验室、开放政府数据实验室、循证实验室、混合实验室。本文从实验方法(行为科学、设计思维)以及与政府的关系(部门民营化、政府主导、政府完全控制)两个方面,对政策实验室进行分类。政策实验室的核心使命是影响政府决策,其与政府的关系会影响政策方案是否得到政府认可、重视和推广。但是,如果政策实验室缺乏独立性,也会影响其对政府的影响力。政策实验室既可以注重设计思维,聚焦政策如何设计;也可以关注行为科学,注重如何对政策进行实验与推广。
对丹麦心智实验室(Danish MindLab)、英国行为洞察力团队(BIT)、新加坡人类体验实验室(THE Lab)这三个政策实验室的比较案例研究显示,政策实验室在实验方法(行为科学、设计思维)及其与政府的关系(部门民营化、政府主导、政府完全控制)方面有明显不同,可以采取不同模式与策略(如表2所示)。
丹麦心智实验室是政府主导,采取设计思维对政策进行创新。设计思维在建筑设计、艺术设计等领域应用广泛,意味着要从设计的角度来重新审视政策过程,并通过设计来不断优化政策。BIT一开始是政府完全控制,但是随着迅速的发展,独立成为咨询公司,主要采取行为科学指导下的政策实验模式。新加坡人类体验实验室是完全由政府控制的机构,基于设计思维来对政策进行实验。
政策实验室的核心职能是知识转移,而知识转移能否成功则取决于许多因素,比如政策实验室同政府部门的相互信任与合作动机,政策实验室的开放性、专家资源与制度建设等。从这些政策实验室的运作来看,它们采取了不同模式与策略。这使政策实验室在如何发现和发明政策以及如何验证和推广政策方面有显著差异,进而可能影响政策实验室的运营和绩效。
值得注意的是,政策实验多种多样,政策实验室的运作模式也各不相同。在设计与管理政策实验室方面,需要结合各地实际情况与资源禀赋,采取符合本地实际的运作模式。比如,中国不少地方政府依托政策研究室、大数据管理局、科技产业园等载体,建立类似于政策实验室的政策研发、创新与推广平台,也是顺应和合乎全球政策实验室发展趋势的。
三、如何建设新文科实验室
(一)新文科实验室的定位与方向
新文科建设需要新文科实验室的支撑,而如何建设新文科实验室就成为值得关注的问题。从新文科实验室的建设定位来看,需要明确其同传统实验室和大学智库的不同,以及其在支持政策实验方面的潜力。传统实验室往往是服务单一学科的,且主要是以科学研究为服务对象,在多学科交叉融合和服务政策创新实践方面的作用较弱。智库也称思想库,更多发挥的是决策支撑,而在科学研究和知识创新方面的能力较弱。新文科实验室建设毫无疑问要有别于传统实验室和智库,并需要探索新的发展道路。新文科实验室与政策实验室服务目的不同,却有很强的融合式发展潜力。新文科实验室建设要加强同政策实验室的对话,借鉴政策实验室的创新模式,推动二者融合式发展。
实验主义的内涵丰富,科学严谨的政策实验不是唯一路径。政策实验室有不同模式,科学实验也同样需要因地制宜。中国政策试点的多样性与特征意味着要坚持实用主义的政策实验理念,坚持“验以致用”,通过打通官产学研用来使政策实验发挥效果。
从政策实验室与政府创新的关系来看,政策实验室可以扮演不同角色。它们既可以服务于科学研究与学术发表,也可以服务于政府决策与政策评估。一个重要问题就是,如何实现二者兼容。从具体分工来看,实验室开展原创性实验研究、证据库汇总和编译科学证据,而试验田则复制推广政策创新。这意味着要打造政策实验平台,通过科普和服务输出政策经验,推动研究证据向政策实践转化。因此,新文科实验室可以借鉴政策实验室的经验做法,更多关注如何对政策实践进行评估,如何开展政策实验,如何创造性设计新政策等。
近年来,行为公共管理学发展迅猛,通过共同设计与合作开展实验研究,揭示公共管理行为的内在逻辑。从新文科实验室建设的需求来看,这意味着要打通试点与实验,加强政策试点与政策实验对话,使决策者和研究人员可以谋求共同语言。因此,加快新文科实验室建设,推动实验知识的翻译与转化,加快实验得到认同与推广,将有助于实现这些目标。
同时,新文科实验室建设也需要朝着数字化与智能化方向发展。在数字时代,借助大数据分析和人工智能技术,政策实验将会加快发展。比如,互联网企业流行AB测试,可以在大规模用户中快速进行不同方案的实验。类似地,敏捷监管强调要建立“监管沙箱”,在金融科技等前沿领域进行政策实验。诸如此类的发展都意味着,要推动新文科实验室与政策实验室的融合式发展,既为发展和检验社会科学理论提供平台,也为推动政策实验和创新实践提供支撑。
(二)研究启示与未来展望
政策实验室和新文科实验室有深化合作乃至合二为一的潜力,因此需要关注二者如何进一步加强合作并推动实验室服务科学、研究和实践。展望未来,可以重点研究如下问题。
首先,当前各地建设的新文科实验室都有很强的本地特色,往往同本地政府、大学和学科等有较强的联系,也在很大程度上塑造了不同实验室的独有特征。有必要对这些新文科实验室进行类型学研究,将其进行分类和比较,推动新文科实验室发展方向规划。从试点、完善到推广,新文科实验室建设也遵循我国一般政策试点的逻辑,有必要对试点实验室进行跟踪监测、考核评估和优化完善,为其他高校和机构建设新文科实验室提供启示。
其次,新文科实验室的发展进行到了一定阶段,但是如何对其评估还缺乏较好的指标和方法。各个新文科实验室都有不同的历史条件、前期基础、学科渊源等,并非在同一起跑线上,也难以用一把尺子“一刀切”。这类似于对政策试点的评估,需要避免试点必成功的陷阱,也要避免偏颇的考核“指挥棒”导致的行为扭曲和弄虚作假。因此,既要明确少数共性和通用指标,又要允许各个新文科实验室特色化发展。
最后,需要对其他国家哲学社会科学实验室的建设与运行进行分析和比较,探讨其对中国新文科实验室建设的启示。与此同时,也要进一步提炼我国新文科实验室的特征,凸显其在自主知识体系建构方面的作用,加强同其他国家哲学社会科学实验室的交流合作,并为其他国家提供可资借鉴的经验,比如推动跨国实验室数据开放、算法共享等。
本文转自《中国社会科学评价》2024年第2期
徐义华:甲骨学研究的基本领域及主要成就
甲骨文发现已有120多年,经过数代学者的努力,甲骨学已成为一门成熟的国际性学科。甲骨学研究可以分为四大领域:第一个是基础性领域,主要是资料整理;第二个是研究性领域,主要包括文字考释、甲骨自身规律研究、商周史研究、商周汉语研究四个部分,另外,甲骨的考古学考察、西周甲骨、甲骨学术史、甲骨文书法艺术等领域也值得关注;第三个领域是工具书的编纂;第四个领域是近年来兴起的新领域——甲骨文研究的电子化和智能化。本文主要介绍甲骨学研究性领域和新领域。
甲骨学研究性领域
甲骨文的研究性领域,情况大致如下。
一、文字考释
文字考释是甲骨研究的第一步。1904年孙诒让写成《契文举例》,这是第一部甲骨文字考释书。此后最有影响力的学者是罗振玉和王国维,尤其是罗振玉,释读常用甲骨文字数百多个,使甲骨刻辞基本得以通读。继罗、王之后,贡献最大的是唐兰和于省吾,不仅考释甲骨文字众多,还发展了文字考释理论。
70年代以后,以裘锡圭在文字考释方面的成就最高,其著作《古文字论集》影响很大。此后,大批文字学著作也涌现出来,如刘钊《古文字考释丛稿》、陈剑《甲骨金文考释论集》、蒋玉斌《殷墟子卜辞的整理与研究》等。经过学者努力,已有一千多个甲骨文字得到释读,甲骨刻辞已可通读。
二、甲骨自身规律
甲骨自身规律主要是指甲骨的整治、卜辞的刻写、刻辞的种类等知识。
1.甲骨文例
甲骨文例主要是指刻辞在甲骨上的格式、行款、布局等。1928年胡光炜《甲骨文例》首先对卜辞行款进行研究,此后董作宾《骨文例》、胡厚宣《卜辞同文例》、张秉权《论成套卜辞》等文发表,对卜辞的分布、行款等作了更深入的探讨。80年代以后,学者的研究更为细致,如李旼姈《甲骨文例研究》、孙亚冰《殷墟花园庄东地甲骨文例研究》等对文例进行了综合性研究。
2.分期断代研究
分期断代是确定卜辞时代,将其转化为史料的前提。1930年,董作宾发表《甲骨文断代研究例》,提出了世系、称谓、贞人等十项标准,并把甲骨卜辞划分为五期。从此,甲骨文的大致时代得以确定。
董作宾的五期分法还存在一些不足,为此,有学者提出了分组分类的方法。陈梦家在《殷虚卜辞综述》中提出“组”的概念,影响巨大。后来,李学勤、彭裕商、林沄等学者撰文讨论,黄天树《殷墟王卜辞的分类与断代》和彭裕商《殷墟甲骨断代》等书出版,新的甲骨分期理论逐渐完善。
3.甲骨整治与卜法制度
在利用甲骨占卜之前,商人会对甲骨进行剖解、钻凿等一系列整治,这是重要的研究内容。
罗振玉就将钻凿作为重要内容,到20世纪60年代,贝冢茂树最先用钻凿形态论证卜辞的时代,后来许进雄撰成《甲骨上钻凿形态的研究》等论著,全面地分析钻凿形态及其与分期断代的关系。80年代后,钻凿的价值被进一步认识,周忠兵《甲骨钻凿形态研究》、赵鹏《殷墟有字甲骨钻凿布局与占卜形式探研》等书出版。
卜法很早就被学者关注,1929年,董作宾写成《商代龟卜之推测》,该文介绍了商人从取龟到契刻再到收藏的整个过程,后来宋镇豪《殷墟甲骨占卜程序的追索》、朴载福《先秦卜法研究》等也做了研究。近来,李雪山《嬗变与重构:商代甲骨占卜流程与卜法制度研究》出版,对卜法研究起到推动作用。
4.甲骨缀合
甲骨容易破碎,把破碎的甲骨拼合起来即缀合。1917年,王国维缀合了一版甲骨,首开先河。第一部专门的甲骨缀合著作是曾毅公于1939年出版的《甲骨叕存》,此后郭若愚、张秉权、严一萍等都出版了缀合著作。2000年以后,甲骨缀合获得更大进展,蔡哲茂《甲骨缀合集》《甲骨缀合续集》、林宏明《醉古集》、黄天树《甲骨拼合集》第一至五集等先后出版。
缀合方法不断改进,蔡哲茂提出关注同文例,黄天树提出甲骨形态学,都极大促进了甲骨缀合工作的进展。
三、甲骨文与殷商史
甲骨文研究的一个重要方面是认识商周史。最早利用甲骨文解读历史的是王国维,他于1917年发表的《殷卜辞中所见商先公先王考》及《续考》,标志着甲骨文研究进入“史料时期”。
此后,甲骨文的史料价值被发掘,胡厚宣《甲骨文商史论丛》、丁山《商周史料考证》、李学勤《殷代地理简论》等著作都产生了很大影响。20世纪80年代以后,利用甲骨文研究商史的著作大量涌现,彭邦炯《商史探微》、朱凤瀚《商周家庭形态研究》、杨升南《商代经济史》、宋镇豪《夏商社会生活史》、刘源《商周祭祖礼研究》等著作问世。最值得关注的是宋镇豪主编的《商代史》,该书从政治、军事、经济等多个方面对商代历史做了综合研究。
四、甲骨文与汉语史
甲骨文用于商代汉语研究,主要包括两个方面,一方面是语法研究,另一方面是语音研究。
1953年管夑初出版的《殷虚甲骨刻辞的语法研究》,是第一部甲骨文语法著作。西方学者探讨甲骨文语法较多,如吉德伟、倪德卫、高岛谦一等都发表了论文。20世纪80年代以后,甲骨文语法研究蓬勃发展,沈培、张玉金、喻遂生、杨逢彬等都出版了相关著作。用甲骨文研究语音出现较晚,1984年赵诚发表《商代音系探索》,初步拟出商代音系。此后,陈振寰、管夑初、郭锡良、邹晓丽等也都做了这方面的研究,取得了一定成果。
除了上述几个方面,甲骨学的考古学考察、西周甲骨、通论性和学术史研究、甲骨文艺术化转化等方面也是值得关注的。
甲骨文研究的信息化
甲骨文研究的电子化表现在三个方面:一是成果发布的网络化,二是甲骨资料库的建立,三是甲骨文研究的智能化。
许多甲骨文研究成果选择快捷的网络发布,例如,中国社会科学院先秦史网站成为甲骨缀合成果集中发布的网站。
甲骨文资料库不断建立,多地学者都参与其中。在港台地区,香港中文大学建立了“汉达文库”,成功大学建立了“甲骨文全文影像数据库”,“中研院”史语所建立了“甲骨文数位典藏数据库”等,都提供甲骨图片和释文,并有检索服务。在大陆地区,有中国国家图书馆的“甲骨世界数据库”、中华书局的“殷墟甲骨文数据库”、安阳师范学院的“殷契文渊”,其中“殷契文渊”不仅将甲骨原始资料上网,而且建立了字形库和文献库。
早在20世纪60年代,美国学者周鸿祥即试验计算机缀合甲骨,并取得一定成果。随着人工智能的发展,计算机在甲骨缀合、文字识别和校对重片方面取得很大进展,有学者开始尝试用计算机考释文字。莫伯峰《人工智能在古文字研究中的应用及展望》、李春桃《基于人工智能技术的古文字研究》等成果,揭示了新技术在甲骨文研究中的前景。
本文转自中国社会科学报
劳东燕:法学是一门可寄予个人抱负的专业
当年我参加高考的时候,报考志愿是在分数出来之前,也就是根据自己预估的分数填报的志愿。本来我那时的理想是成为一名企业家,想报企业管理方向的专业,结果被一句“哪个企业等着你去管理?”的质疑所打击,临时改弦更张而报了法学专业。
90年代,法学不是热门专业,从学科发展来说基本上还处于幼年状态,彼时被称为“幼稚的法学”也不算很离谱。
回看这三十年,法学一跃成为文科专业中为数不多的热门,细想起来倒也在意料之中,符合社会发展的基本规律。不难发现,但凡是趋于复杂化的社会,都不可避免地要选择通过法律的社会治理。纵观中外历史,这一点具有客观规律性,不以人的意志为转移。
社会变得越复杂,法律也会越复杂,专业门槛自然也水涨船高。这在法学理论中被称为双重复杂性的挑战。
由此可见,专业的热门与冷门,个人职业选择的明智与否,说到底还是取决于社会的发展趋势。毕竟,个人的职业生命有几十年,而专业的选择经常会产生路径依赖的效果,看长远而非短期,得出的判断往往更为明智。
法律与新闻之类的行业,虽说也可能在特定时期遭遇低谷,但只要社会想发展,人们对社会发展抱有起码的信心,这样的行业就不可能长期地处于低谷状态。
当然,彼时选择法学,于我而言完全是一种偶然,并没有考虑得那么长远,也谈不上是深思熟虑的结果。人生的很多关键时刻,往往是由偶然的因素决定,尽管事后看来似乎偶然中存在一定的必然。
走进法学这么多年,我从未后悔过选择这个专业。
因为后来读硕又读博,整个学法的过程比较漫长,之后的职业也一直没出法学领域,所以我应该算得上是资深的法律从业者。作为法律行业的过来人,在此报考志愿之际,想谈几点个人的切身感受。
1. 法学是一门可寄予个人抱负的专业,从中很容易找到所从事职业的社会意义。
当然,并不是每个从业者都必须如此,你也可以只把它当成一种谋生的工作,这完全是个人的自由选择。之所以要强调这一点,是因为到一定年龄阶段后,当解决了基本的生存问题,人就不可避免地想要满足更高层次的心理需求,对人生意义的追寻不可避免。
2. 对法学的兴趣可以在学习的过程中进行培养。
在中学乃至大学时期,大多数人其实并不确定自己是否适合学某个专业。
就我来说,一直到大学,都没觉得自己适合学法学,当时只是公法领域的课程学得不错,但民商法之类的就学得一般。一直到读研时,由于思维与写作能力受到较多的肯定,才确定自己适合学法学,兴趣与自信也是在过程中慢慢培养起来的。
对个人的职业选择来说,倘若能将热爱与擅长相结合,自然是上佳;如果没有这种幸运,将自身的擅长与至少不讨厌的专业结合起来,也是不错的选择。
3. 如果选择法学专业,那么在专业课程以外,一定要努力拓展自己的知识视野,对其他人文社会科学的知识都有所涉猎。
在法学之外,我对社会学、政治学、制度经济学、人类学与社会心理学等,都有比较强烈的兴趣,甚至一度对社会学的兴趣还超过法学,因为觉得法学匠气太重,过于技术化,思想性不够。
尽管早期我对其他学科知识的涉猎,完全只是业余爱好,并没发现对学法有什么帮助,但在从业多年后,有一天突然就有豁然开朗的感觉。底层的理由其实很简单,法律是用来调控人的行为,并且是在社会中运行的,不了解社会,不了解人性,也就不可能真正地理解法律。
4. 如果选择法学专业,务必努力提升自己的写作能力与口头表达能力。
对学好法学来说,写作能力是第一位的,即便口头表达能力稍逊也关系不大,法律行业更为看重书面写作能力。这种写作能力,不只是指文字表述准确流畅,还有论证能力,包括提出依据进行反驳与立论的能力,以及逻辑能力,即能够条分缕析逻辑严谨地展开论理。
在提升自身写作能力的同时,训练口头表达能力也比较重要,这种口头表达能力不是指口齿伶俐,而是能够清晰有力地组织语言进行表达。学生时代,我也曾经怯于在公众场合发言,后来是通过在听讲座时每次都要求自己在问答环节进行提问,来逐渐克服对发言的内心胆怯的。
愿每一位同学,或早或晚都能遇到适合自己的专业。
张天祁:高考志愿选大学还是选专业?他们的研究给出了答案
高考结束后,又到了为报志愿争论不休的时节。每年总有一些问题被反复提及,但从来没有答案,比如,选大学还是选专业?
理想答案当然是,名校的热门专业,但是实际情况是,多数人只能二选一。
强势专业和好大学都会给人未来的发展,尤其是职业发展带来助益。但到底哪一方能带来更大的助益,一直是个报志愿方面的难题。这个问题当然没有标准答案,即使是指导报考的老师,往往也建议综合考虑学生的兴趣、能力特质等方面。这样的说法当然中肯,但没有给出一个明确的参考标准,等于把难题又丢回给了考生。
今年一项美国的研究中,作者们尝试回答学校和专业哪个对收入影响更大这个问题[1]。他们发现,专业学科对毕业生的未来收入有着更为显著的影响,超过了大学本身的品牌效应。收入差异中由大学造成的比例约为21%-22%,而由学科造成的比例约为60%。
也就是说,不考虑个人兴趣、城市发展等更复杂的选择条件,单从工作收入来看,专业比大学更重要。
尤其是STEM(科学、技术、工程和数学)专业,带来的经济回报尤为突出。在毕业后偿还学生贷款的第一年,STEM专业的毕业生比非STEM专业的同学平均多挣31%,相当于年薪多了大约1万美元;到了第二年,这个差距进一步扩大到32%,STEM毕业生的中位数薪资达到4万3千多美元,而非STEM专业的同学只有3万多一点。
另外,在偿还贷款的第一年,加州理工学院(Caltech)位列大学中预期薪资榜首,其毕业生的中位数薪资为64,123美元。然而,如果将视角转向具体专业,电气、电子和通信工程专业的毕业生薪资表现更为亮眼,他们的第一年平均中位数薪资已经超越了加州理工学院的水平,达到64,546美元,而它只是期望薪资第三高的专业。足见专业选择对于起薪的重要性。
当然,专业比学校更影响未来的收入这个说法还是太过于笼统了。这项研究还表明,读STEM专业带来的收益是因学校而异的,在收入中位数偏低的学校,STEM专业和其他专业的起薪差距能达到60%。在收入中位数偏高的学校,比如佛罗里达州迈阿密大学,STEM专业的起薪和其他专业的差距没有那么夸张,在18%左右。
而对非STEM专业来说,大学的水平可能对未来的发展更重要。大学录取率如果提高10%(入学标准放宽),就读非STEM专业的学生起薪将会有0.5%的下降,而STEM专业学生则只有0.1%的下降。
根据这篇论文的结论,选择专业和大学应依据不同情况来定。如果主要考虑收入,选择一个收入潜力高的专业可能比进入一所顶尖大学更为关键。对于STEM领域的专业来说,由于名校所带来的额外收入溢价相对较小,所以在分数有限的情况下,不必过分追求名牌大学。
对于其他专业的学生而言,大学的品牌和水平可能对收入有更大的影响。
不过,西北大学普利兹克法学院的黛博拉·韦斯(Deborah M. Weiss)觉得,一端是高收入、数学含量高、对职业有用的 STEM 领域,另一端是低收入的人文学科领域,这种分类过于简化,数学训练并不是拉开专业之间收入的唯一因素。她与合作者们的一项研究提供了更为详细的分类[2]。例如,在整体收入溢价比较高的商科中,会计学的收入溢价是所有专业中最高的,可以单列一档。金融/营销提供的溢价相对高,工商管理、人力资源管理、旅游管理之类的专业,和社会科学大类中的公关管理专业差不多,可以说会计拉高了整个商科的溢价水平。而在整体溢价比较低的社会科学中,经济学仍然能带来高收入。
在STEM领域里,也能分出理科与工科的区别。作者把STEM进一步区分为工程(计算机工程、电气和电子工程、机械工程等),物理科学(物理、化学),数学和计算机科学,以及平均收入相对低的其他STEM专业。其中,工程类专业的溢价最为突出,仅次于会计专业。也就是说,工科比理科溢价更多。其中的差距,一方面来自技能。作者团队使用了超过2200万份简历数据,从中创建了精细的专业分组,并基于这些分组计算出不同专业在数学推理和书面表达这两项技能上的重要性得分,进而分析了这些技能与专业收益的关系。他们发现,书面表达和数学推理是大学培养的两种主要职业技能,与需要书面技能的工作的专业相比,需要数学技能的工作的专业从选择性中获益更大。
影响专业和收入的另一方面,则是专业的职业特异程度,简单来说就是“专业对口”的程度。职业特异程度高,意味着这个专业专注于某一特定职业领域,提供高度专业化培训,直接与特定行业或职位相匹配。溢价最高的专业,比如会计、工程、护理都属于对口程度高的一类。这些专业不仅需要在课堂上学习,也需要实习经验或者考取相关证书获得资质。
作者们发现,对于收入潜力相对低的专业(人文类、艺术类、商科中的管理类、经济学/国际关系以外的社科类、社会服务类),学校名气对收入的影响一直比专业更重要。对于数学和计算机、物理、经济学、金融/营销、生物等收入溢价比较高的专业,如果就读的学校能从中等提升到名校,那还是选大学对收入的帮助更大。至于学会计、护理和工程类专业的学生,对大学的要求最低,哪怕学校提升两档,也是专业对收入的帮助更大。
当然,这两个研究都是基于美国数据的研究,不可能直接套用在国内的情形上,但是一些原则还是可以借鉴。
即使同是STEM领域,选择工科专业时相比理科可以更看重专业。如果选择人文或者社科专业,那就需要更看重学校。作为211大学的两财一贸(中央财经大学、上海财经大学、对外经济贸易大学)部分专业录取分数线连续多年超过多所985大学,也说明在财会领域,学生和家长心中选专业要重于选大学。
高薪的代价会40岁之后显现
学科差异之所以能对工资有如此大的影响,是因为不同专业直接关联到特定行业和职业路径,这些行业和职业的薪酬结构差异很大。在某种程度上,选择专业也就是在选择职业。起薪高或低的职业差距不仅在钱上,而是整个职业生涯的轨迹和形态都会有不同。了解到两条职业道路的区别 ,应该比单纯考虑行业薪资要更有参考价值。
哈佛大学的两位学者利用2007年至2019年间来自在线招聘信息的详细职位描述,开发了一个模型,探讨了工作经验回报与技能过时的关系。他们发现计算机、工程和商业等应用专业的大学毕业生,虽然起薪更高,但是收入溢价相比其他专业也下降的更快。
计算机和其他工程类专业能带来更高的起薪,主要是因为在本科四年的学习中学到能用在工作中的知识,进入相关领域的工作后可以快速获得回报。比如58%的计算机毕业生从事与计算机相关的工作,相比之下,生命科学和社会科学专业就业很分散,没有一个方向超过10%。
然而,程序员、工程师、技术员之类的工作,本身就是技能更新比较频繁的工作。于是随着时间推移和技能过时,毕业生收入溢价会迅速下降,这是这类工作本身的特点。
作者发现,即使并非相关专业的毕业生,从事计算机相关工作或者工程类起薪溢价达到40%左右,但在十年内下降至 20%。比如计算机专业58%的人从事与计算机相关的工作,相比之下,从事其他行业的计算机或者工程专业毕业生,收入溢价会随着时间提升,因为他们的行业 经验能够积累下来。
不止是STEM专业,偏于应用的商科专业往往也有这个趋势。相反,那些学习基础学科比如生物学、文学的学生,收入溢价会随着年龄的上升而上升。计算机科学、工程和商科专业的学生在 20 多岁时的收入远高于生命/物理科学和社会科学专业的学生,但这种优势在 40 岁时就大大减弱了。
根据2009年至2017年美国社区调查(Integrated Public Use Microdata Series,IPUMS)的人口加权平均年薪数据,23岁时工程和计算机科学毕业生起薪超过4万美元,而社科毕业生只有不到3万美元。但到40岁,双方的年薪都来到了10万美元上下,其后也没有再拉开差距,尽管工程和计算机科学类的工资一直要高一些。
起薪高的代价是总要学习新技能,哪怕是人到中年也不能避免。在计算机以及工程领域的工作中,需要新技能的技术密集型工作所占比例基本稳定在41%左右,无论是最初级的岗位还是需要12年经验以上的岗位。这意味着,有四成STEM方向的工作者在求职时,很可能面对已经工作了几年甚至十几年还要从零学起的情况。相比之下,其他工作只有20%多的岗位需要更新技能。
这导致了更高的退出率。26岁时有58%的计算机和工程专业的毕业生从事相关工作,但50岁的时候有18%左右的人已经转向了非STEM的管理工作。社科专业的毕业生则没有经历这样的波动。
高薪但有更多挑战,更早赚到大钱,中年时更可能面对转型的问题,这是读热门应用专业的毕业生更可能出现的职业轨迹。其他专业的职业道路则更平稳,一步一步逐渐积累经验提高薪资。在国内,那些所谓弱势专业的毕业生还有自己的特殊优势。
俄亥俄州立大学社会学系和香港中文大学社会学系的两位学者,利用中国综合社会调查(CGSS)2003到2018年三次调查的数据,考察了哪些大学专业的毕业生更倾向于进入体制内。
研究发现,那些职业特异性较低且盈利性较弱(人文、社科,数学、物理、生物等基础学科)的专业毕业生,更容易端起铁饭碗,进入政府机关、事业单位和国有企业工作。而且随着市场化的深入,这些专业毕业生进入体制内的比例更大。作者认为这和毕业生的意愿有关,因为在市场上缺乏竞争力,所以这些毕业生更愿意追求体制内的工作。
不过,这也可能和体制内的招考要求有关。2023年的国考中,法学、计算机、统计学、经济学、审计学、数学、新闻传播学、会计学、金融学和财政学占到了招录最多职位的专业前十,其中七个都是社科或者文科专业[5]。
对于选择了名校,没有选择热门专业的学生,选调进入体制内也是一条可能的路。选调生不限专业,基本都是面对“双一流”中的世界一流大学建设高校,这无疑利好名校学生。
另外,各地有时会进行限定专业的定向选调,有时会选中一些相对冷门的专业。比如海南曾经定向选调文化旅游类专业毕业生,包括社会体育指导、文物与博物馆、数字人文、艺术与设计学、艺术学、文化产业、民族学、中国少数民族艺术等等[6]。
追求高薪还是追求稳定,也可以看作是另一种形式的选专业还是选大学。热门专业往往能够带来较高的薪酬,特别是诱人的起薪。而对于有意向进入体制内工作的学生来说,如果能进入名校,可能还是选学校更加重要一些。
1.Muse, W. B., & Muse, I. (2024). College Selectivity, Choice of Major, and Post-College Earnings. Journal of Economic Analysis, 3(2), 33-51.
2.Weiss, D. M., Spitzer, M. L., Cronin, C., & Chin, N. (2024). Why college majors and selectivity matter: Major groupings, occupation specificity, and job skills. Contemporary Economic Policy, 42(2), 278-304.
3.Deming, D. J., & Noray, K. (2020). Earnings dynamics, changing job skills, and STEM careers. The Quarterly Journal of Economics, 135(4), 1965-2005.
4.Yao, M., & Han, S. (2024). Who earns the iron rice bowl? Major marketability and state sector jobs among college-educated workers in urban China. Chinese Journal of Sociology, 10(2), 167-191.
5.何书瑶,连俊翔,熊程心子(2023).不同专业考公“上岸”难度数据揭秘,这些专业机会为何较多. 上观新闻
6.海南省2024年度定向选调应届优秀大学毕业生公告. (2024, April 22).刘云杉:自由选择与制度选拔:大众高等教育时代的精英培养——基于北京大学的个案研究
01 引论
1979年,英国70岁的高等教育协会主席John Fulton爵士访问北大,当北大领导介绍历年录取新生的分数均高于其他院校时,客人插嘴说:“我很理解。你们北大,就如英国牛津、剑桥一样 。全国家长,都渴望把他们的子女,送来读书。全国顶尖学生,也无不以能进入北大为最高理想。因此,你们招来的学生,都是拔尖人才。我感兴趣的是,这些拔尖学生,在你校的四年或更长时间毕业出去,他们在各行各业中,是否仍是拔尖人才呢?”[1]
在这严峻的提问下,北京大学的本科教育一直在变革之中。
北京大学的本科人才培养定位在变化,从“专业人才”到“文理基础学科的人才培养”[2],再到宽口径、厚基础的本科人才培养,以及“领导型创新型人才培养”(2013年),继而是“培养能够引领未来的人”(参见《北京大学本科教育综合改革指导意见》,2016年4月5日北京大学校长办公会审议通过)。在这四十年间的话语变更之中,交织着若干不同传统、不同旨趣的教育理念,其后是北京大学建校120年以来所形成的独特的教育传统:民国时期的“专业教育为主,通识教育为辅”办学模式与博雅教育理念,1950年代仿照苏联的工程技术为主的专业化模式,1990年代引入美国大学商科、法科主导的职业化模式,还有近十年通识教育的强力推进。
改革集中体现在新旧两套教改十六字方针上。1988年提出“加强基础、淡化专业、因材施教、分流培养”。这是对移植苏联的专才培养模式的纠正,具体措施包括:拓宽专业面,淡化专业界限,真正贯彻学分制,执行灵活的教学计划。低年级(一、二年级)按相近专业或系进行宽口径的基础教育,保证基础素质训练,造就后劲;高年级(三、四年级)按个人志趣、学习状态和工作去向,分流选学不同课程,以适应社会不同的需要。北京大学要培养研究与应用两类人才:前者要少而精、高层次;后者量较大,也要宽口径、厚基础。基础学科也要联系实际,培养应用人才。(《北京大学本科教育改革研究与实践》,见王义遒主编:《文理基础学科的人才培养》,北京大学出版社2005年版,第42页。)1994年制订的《北京大学改革和发展纲要》提出的人才培养的目标与规格是:
北大要着重培养两种规格的人才:一是能够从事教学、科研等学术性工作的基础学科人才,将来成为专家、教授、学者,其中少数人能够成为国际学术前沿的带头人、著名科学家,达到诸如诺贝尔获得者的学术水平;二是培养一批社会主义建设迫切需要的高层次应用型和复合型人才,成为政府各级公务员、企事业单位的专业人员或管理人员,其中少数人经过长期实践能够成为领导骨干,进入国家党政领导人的行列。(参见《北京大学改革与发展纲要》,1994年7月,收入王义遒主编:《文理基础学科的人才培养》,北京大学出版社2005年版,附件1—8,第48页。)
2014年提出新的教改十六字方针:“加强基础,促进交叉、尊重选择,卓越教学。”其中,“加强基础”一以贯之。淡化专业体现为以下几步:其一,从以“专门化”(“专门化”设置是学习苏联的结果,把学科分为三级,学系、专业、专门化。专门面很窄,例如,大学物理专门化的目的,按照物理学的不同部门,为科研机关、工厂实验室和高等学校培养高级物理干部。见杜勤等:《北京大学学制沿革[1949—1998]》,北京大学出版社2000年版,第24页)为单位招生,到以学院/系为单位招生(2002年开始按学科大类招生与培养),再到学部内自由转专业、全校自由选课(2016);其二,压缩必修学分,尤其专业必修学分。淡化专业背后是本科教育培养目标重新定位,本科任务并非培养专家,而重在打基础,练就素质。“尊重选择”替换了“分流培养”:“要通过多样化与个性化的培养方案和模块化的课程结构,以及荣誉学位、本硕连读与联合培养项目等为学生的学习与发展提供更多的选择。要注意加强院系的合作,通过提供丰富的辅修和双学位培养方案、转系转专业、学科大类平台课等为学生的跨学科学习提供更多的选择和更为广阔的发展空间。(”北京大学教务部汇编:《北京大学本科生教学手册》,2014年9月。)
2016年1月,某理科院系负责教学的院长(D03)陷入困惑中:一门8学分的基础课,他读本科时课堂教学时间为144课时,教学时间18周;2003年,教学时间降至16周,这门课教学时间降为128课时。现在,教务部要求学分减半,这门基础课将用80课时完成。学时减少,教学要求不降低,只能浓缩教学内容,要求学生自主学习其它内容。这一改革措施实施一段时间后却发现,学生课后没时间读书!只要看一下大幅度增加的双学位人数,就知道原因了。
曾在美国大学任教的教务部领导(D01)是改革坚定的推动者,他主张:
毫无疑问,北大应立足精英人才的培养。人才一般有两类:青蛙型与老鹰型。我们长于培养青蛙型人才,专注于具体问题,研究面较窄;但如何培养老鹰型人才——既是某一领域的研究专家,又有很高的眼光,能领导学科和引领社会的发展,这就需要我们大力发展通识教育。某人文学院院长(D05)指出:我们的问题是在一套苏联的专业教育的组织架构上移植美国文理学院的本科教育模式,这其间有北京大学已经形成的教育传统,譬如以人文教育为核心的博雅教育(liberal arts),围绕自主科研的专业教育(Professional education)与研究生教育(graduate education),还有以通识为基础、基于广泛严格学术训练的现代职业精英教育(learned professions)。在一所研究型大学的本科教育中,这些传统与力量如何平衡?
本文的研究对象正是置身这一场变革之中的本科学生,通过他们所体受的制度、他们所作出的选择来考察研究型大学中本科教育的本质与功能,准确地说,在高等教育大众化时代,精英究竟如何培养?本文将仔细讨论:这些“拔尖”的学生究竟是谁?他们是如何被选拔到北京大学的?在本科教学改革中,他们究竟如何学习?培养方案、教学计划、考评制度的调整对他们产生什么样的影响?他们是如何做出选择的?在专业、课程、导师、社团、实习、交流、考研等既按部就班又环环相扣的培养与教学制度中,他们究竟受到什么样的教育?制度如何塑造他们的心性与惯习?
从这些具体问题出发,自2015年11月至2017年9月,笔者做了大量的访谈、座谈,访谈对象包括6个院系负责本科生教学的院长(D01-06)、5名学校招生与教学部门的领导(M01-05)、6位教授(P01-06);还组织了18场次涵盖6个学部63名2016、2017届本科毕业生(FG01-18)的焦点团体座谈,学生分组讨论拔尖计划、竞赛保送、贫困专项、转专业等问题以及成绩后30%的学生面临的问题,并在此基础上做了24个深度个案,这些案例来自元培(YP01-04)、理科(S01-05)、人文(L01-08)、社科(SS01-04)、经管(E01-03)等学院和学部。
支撑这一研究的还有以下工作:其一,与北大教务部合作进行的2016届、2017届本科毕业生质量调查研究,包括大规模的问卷调查,以及大量的、深度的访谈、座谈。其二,参与李猛主持的本科教学改革方案的课题研讨中,无论是文献的阅读、对院系领导的深度访谈,还是与渠敬东、强世功等数次讨论,都为经验层面的研究奠定了理论基础。
02 精英选拔的多重逻辑
赵状元(FG07-2)沮丧地承认:他真的学不懂专业,他就是那个被“分流者”,不过是以自由选择的形式完成的。赵状元有辉煌的学习成绩,他是省高考理科前10名,他“莫名其妙”地来到了这所以严酷著称的理科院系,身边80%的同学都有竞赛背景。高考中优异的理科成绩,在这里,却完全不行。
赵状元所在的学院,一半学生来自保送(竞赛优胜者),有二成多学生来自自主招生(多有竞赛背景),剩下二成来自高考。教师们强调:理学院拔尖人才中不乏高考生的案例,只要努力,竞赛生的领跑优势并非不可超越。(据教务部珠峰计划的数据显示,在该学院2013—2016届毕业生中,“拔尖计划”占全体毕业生人数的13.1%,其中,保送生占拔尖计划68.4%;自主招生占23.7%,普通高考生占7.9%。)赵状元认为:“我们学院科研在全球名列前茅,它适合且只适合竞赛生,它不应对高考生开放。高考生与竞赛生在一起,完全是一场龟兔赛跑!科学是高淘汰的精英教育,一将功成万骨枯,金字塔耀眼的尖顶下是不同层级、众多的‘炮灰’,高考生不过是面目模糊、仅有统计意义且被做大的‘分母’!”
赵状元的故事后涉及招生中的两种主要选拔模式:一种是开放、自由的竞争模式即高考模式,另一种为体现学术精英选材标准的举荐模式即竞赛与自主招生等模式。这也涉及在招生中对“什么是一流人才”的不同认识。借用布鲁贝克的二分法,一种是基于认识论基础的判断,一种是基于政治论基础的判断。[3]基于学术场域内在逻辑的认识论标准所选拔并培养的是智力的德性——好奇心、虚心,求知虽难毕竟可行的信念、耐心、勤勉、专心以及精确性。[4]换句话说,找到那些“眼睛发亮”“灵魂有光”的人。另一种是政治论的逻辑,大学从来就不是高居社会之外的“象牙塔”,北京大学要培养“社会公认”的优秀人才:不仅要培养杰出的学术精英,还要培养职业等级与社会地位中的高位者,即未来的职业精英与权力精英。政治逻辑要求精英的开放性,它体现为高考招生录取上的公开性、透明性以及分数面前人人平等。实践中却被扭曲为“唯分数论”,招生没有理由不招“分数最高的人”。高考及分数成为不同社会阶层、利益团体重新洗牌的核心机制,它体现为优质教育机会上的高竞争,教育过程中的高筛选以及核心利益中的高垄断。
关于招生对象,《北京大学改革与发展纲要》中这样阐述:“必须招收一流的学生,给予一流的培养,出一流的人才。”(参见《北京大学改革与发展纲要》,1994年7月,收入王义遒:《文理基础学科的人才培养》,北京大学出版社2005年版,附件1—8,第48页。)“一流的学生”首先是各地高考的状元们,这些万里挑一的幸运儿正是严酷的高考竞争的优胜者。置身于差异悬殊的社会等级结构中,自由竞争的高考在开放与封闭、在权利与资格之间陷入困境:“高考分数膨胀,成绩区分度下降,成绩呈现高分段偏态分布,甚至出现一个分值竟然有三位数考生的现象!”(M01)
高考的高利害性与成绩的低区分度构成冲突,膨胀的分数的之下,才智平庸者与才华出众者之间良莠难分。招办主任(M01)苦恼于考试的科学性不够:“高考成绩主要建立在长时间、大规模的重复训练上,它甚至连智商都不足以说明,它更多代表学生对知识的熟练程度、细致与严谨。”
严酷的竞争带来了第三重逻辑:市场逻辑。高校招生变成一场依据分数高低进行的拍卖,状元及其分数成为招生市场竞拍中的标的物,手持高分者待价而沽,交易的条件为高额的奖学金和所谓的热门专业;分数成为他们讨价还价的资本,通过精巧的计算换取自己需要的东西,甚至随时根据出价的多少任意变换自己的承诺(M01)。市场的旨趣是“得与失”,他们生怕分数的购买力没有用“足”用“够”。在招生场域,分数不仅成为流通货币,甚至成为新宗教,分数拥有了超越分数的价值。
自由选择的第一环是入学之前的专业选择上,据招生部门的观察:
考生在选专业时,首先是用足分数,根据分数选专业,完全或基本不考虑兴趣,或许不知道自己喜欢什么,甚至不知道自己不喜欢什么;二是盲目跟风;三是不愿意选择基础专业,喜欢选择看得见摸得着,能够直接与就业挂钩的具体专业,特别是哲学、历史、地质、考古等一些所谓“冷门”专业面临无人问津的危险。[5]正是出于对政治逻辑与市场逻辑的纠正,自主招生希望打破高考录取分数的唯一性,为一部分综合素质优秀、学有特长但不一定能在高考中发挥出色的学生提供机会。自主招生原本应基于认识论的学术逻辑,实践中却逐渐异化为各高校提前圈定、争夺生源的工具,甚至演化为“二次高考”。[6]
根据多位理科拔尖学生的个案与访谈合成,我们来看一个典型的理科拔尖学生的成长史。首先,严格选拔,特长突出。他们多出身于名牌中学的理科竞赛班或实验班,在中考甚至提前至初二、初三,他们已崭露头角,表现出优异的竞赛成绩与突出的学科特长。这就出现了一个奇怪的现象:一方面,基础教育被要求减负,学习越来越宽松;另一方面,拔尖人才的选拔与培养越来越提前。普遍的宽松学习与严酷的竞赛选材构成离奇的张力,在对理科人才的遴选中,天分好、智商高、对学科有特别的兴趣,这是标准。“特别的兴趣与突出的表现”体现着有对智商与天赋近乎神秘主义的推崇。在这神秘面纱之下,因材施教与拔苗助长合谋,中国年轻一代以自由选择为名,体受越来越严苛的选拔。竞赛要有突出的特长,高考不能有明显的短板,在巨大的不确定性下,多数考生都是两条腿走路,在“扬长”与“避短”之间、在“特长”与“均衡”之间小心地维持平衡,身心承受巨大的压力。人的均衡发展意指“心—手—脑”的和谐发展,孩子大脑承载着超常的数理能力,“心”与“手”的发展能否跟上“脑”的发展?还是“心—手—脑”的协调将面临巨大的困难?
其次,高强度、目标明确的任务性学习。在多数名牌中学,竞赛班是特殊的群体,高一将高中理科全部学完,高二开始专攻竞赛;有的中学,成绩前50名的学生拼竞赛,这意味着他们的目标锁定北大、清华等“985”高校;排名50~100名的学生瞄准“211”高校,100名之后的学生就进入一本、二本等地方高校了。不同的班级,学习目标不同、师资配备不同、同伴群体不同。学习是在高竞争、高压力下进行,他们不能、也不愿意放弃竞赛,这既是一个高荣誉的学习项目,也是集中优质资源的教育项目,还是一次额外的机会:竞赛优胜者进国家队,这意味着或者提前拿到录取通知书,或者获得自主招生的减分承诺。他们开始习惯这种集训队般严筛选、强竞争、高挑战与高功利的任务性学习。
布迪厄以“总体制度”剖析法国名牌高校入学考试中的预科班,这些制度被设计来彻底转变学生们的心智、身体与自我,以适应精英学校和通过这些学校所要达到的权力位置的要求。精英学校用苛刻的工作时间表训练学生,以频繁的考试及残酷的竞争压力将学生和他们的家庭隔离开,更为重要的是将这些学生同其他学生隔离开,用一种“选择性禁闭”挑选并培养精英,既给予他们严酷的苦行,又赋予他们某种卡里斯玛的特征,使他们成为学生中的贵族,具有某种尊严感、荣誉感乃至义务感。[7]
在大多数同学仍在填鸭式地被动学习时,他们被要求主动进行探究性学习。早在中小学,他们就开始了专业学习,他们像强悍的狼一样,有明确的方向感与兴趣,有多年训练所植入的主动、活跃的心智惯习,在强挑战面前,他们中的优秀者拥有了智力活动的“强度”,这是教育性教学的一个关键特征。智力的强度首先表现为专心致志,他应当明晰地把握每一件事,全心全意地献身于每一件事,以便正确地、透彻地把握它、领会它,这体现了教学的彻底性原则。[8]竞赛生所表现出来的“浓厚的学科兴趣”实指他已经摸索到学科的规律,掌握了学科的风格,风格是一种专业学习的馈赠,不仅有对学科知识的审美感,还有一种发自内心的热爱与赞美。[9]一位数学竞赛获奖者回忆:
小学六年级第一次看一本数学史,虽然不能都看懂,但很入迷;中学期间反复阅读这本书。在我看来,数学是一个神奇的世界,一个充满简洁的力量与旋律的美的世界。在这个独立的王国,我既能感受到立法的力量,又在其中深感安足。(S03)这些提早进入专业的学习者,如今来到推进通识教育改革的大学。他们需要什么样的教育?自主探究与竞赛选拔使他们与学科、与大学建立了或强或弱的联系;他们如鱼得水,进实验室,参加专题讨论课,做本科研究。大二、大三,他们多出国交流,在世界一流大学的实验室做研究,发表SCI论文。他们既是学徒,更是潜力无限的科研新人,他们的目标是全球最顶尖的研究机构。他们需要平台、资源与支持;他们需要导师对问题的判断、见识与智慧——深度专业化所带来的审美感与常识感;他们在读书会上的相互启发、相互督促。他们阅读科学史、阅读名人传记,他们拥有一个自足的科研世界。
他们以消费心态选修通选课,专业之外的知识,多是杂乱的开胃甜点,或是社交中的谈资、点缀生活的趣味,但这些知识能否进入心智结构,化为积极的养料,又面临不确定。一束强光之下,四周景物黯然。他们选择性地忽略了自己特别倾心的狭小范围之外的东西。加塞特在论及野蛮的专业化时,不无忧虑地指出:
他是一个科学家,一个专家,他通晓自己方寸天地中的一切,但对自己专业之外的知识又知之甚少;文明使他变成一个专门人才,结果把他禁锢在自己的局限之中,他从未意识到自己的边界。[10]专业知识与技能如果不能化为见识、判断与智慧,如果不能转化为智力上的虚心与开放,同样会导致心灵的封闭,而且是一种更严重的智识上的冥顽不化:他们既失去了倾听的愿望,也失去倾听的能力,他们以孤绝卓然的姿态,走向离群索居。知识之于其心智,是异化的工具;他之于群体,是既骄傲又脆弱的存在。
他们的优越感或许是不自觉的,他们眼睛总是注视那些能给予他们启示、灵感,能给他们激励与挑战的更强的人。他们或许相信,很多人被召唤,但很少人被拣选。他们拥有这个资格,在他们的禀赋、才能与努力面前,世界没有给予否定性的限制,而是激励他们更快地成长。在科研表现的赛场上,他们是百米冲刺的短跑选手;在科学探究的马拉松中,在人生的马拉松中,他们能跑多远?他们将面临什么样的选择?他们被这样期望:世界展现了无限的可能,他们辛苦获得的禀赋与才能成为他们征服世界的工具,知识就是力量,是塑造人生奇迹的力量。这是现代版的“鲤鱼跳龙门”——龙门之后是神秘的科学世界。他们心无旁骛,快速且强悍地成长着,这禀赋与才能甚至还成为一种特权,“碾压”众人,他们被称为“大牛”“大神”“学霸”由来于此。
在他们的成长中,求真与逐利交织在一起。在他们的热情之中,有献身的热诚也有索取的欲望,有内在的热情也有外在的利益。他们面临专业探究与人格养成之间深刻的冲突,为了在专业领域里快速地崭露头角,他们不得不缩小工作领域,在一个日趋分歧的路径中越走越远,越走越细,他们将如何获得完整性——人格的养成?舍此,他们将在封闭的训练中走向枯竭。所谓专业的特长如果是以苦役、贱役的形式来养成,如果特长的获得是以牺牲均衡发展为代价,在全球科研市场中,他们可能也只是跨国学术市场中的科研技工,不过是童子操刀——柔弱的精神、偏执的意志挥舞着一把锋利的刀。
当然,真实成长比这个简洁版更模糊含混,充满着分岔,等待他们选择:以竞赛生身份进入,却对学科没有兴趣,过强的竞赛败坏了他的胃口;或以竞赛为捷径,竞赛资格仅为博取新机会。习惯竞赛的表现型短跑选手,如何面对真实科学研究的非功利与不确定、风险与失败?神秘的天赋论究竟能支撑他们走多久?
“龟兔赛跑”中的赵状元,把中学时代大获成功的学习方法小心地用在大学学习中:
从不翘课,多做往年的考题,平时多找老师答疑。用尽洪荒之力,专业成绩达到70多分。再用大类平台课的成绩拉高绩点;用通选课、政治课让自己绩点更高。策略是精心选课,尽量扬长避短,打听好哪一门课给分好……最后GPA还可以。(FG07-2)“尊重选择”解放了赵状元,他领悟到:
“清华的规则是:学不好,你还有心思学别的?!北大的规则是:学不好,还不赶紧学点别的!努力很重要,但选择比努力更重要。”他大三选修了经济双学位,毕业后去商学院读研究生。他由衷地感慨:“改革的方向很好,学部内自由转专业很好,未来全校自由转专业更好!目前的多种培养套餐不错!老师的时间与精力都有限,不应该平均分给每个人,应该确保做科研的人。”(FG07-2)
赵状元的专业学习困难在其院长的解释框架中是这样的:
学生总体学习能力下降,会背着书包上课,课下读书却不会;减了学时后,他不是说这部分没讲,我自己去研究学习;而是闲着也是闲着,我去读个双学位,经济这么热,就读个经济双学位吧。一届160个学生,修经双的有50多个,占三分之一。最有可能的是,学不下去的人,没有目标的人会分流。(D03)他们学院提出的培养方案分为四种套餐:第一种,修习了必修课外加大量的数学物理课程,这是科研型的培养方案;第二种,按部就班学完学院所有课程的中间的学生,这是原来的培养方案;第三种,因为学科交叉很厉害,还有一些学生可以去学工学院、环境科学的课程,这是应用型的人才培养方案;第四种,修了三门核心课程外,剩下的任意选,将来可能做的事情和专业完全没关系。(该理学院近四届的学生中,83.2%选择继续深造,其中有46.7%选择出国深造;国内读研的比例为36.5%;拔尖学生出国读研的比例是87%。)
赵状元自主选择了套餐四。
03 广泛涉猎与学有专攻
另一位理科院系的院长(D02)很疑惑:专业课要从80多学分压缩到60学分以下,只能精炼出最核心的部分,这是专业教育的最低要求。学院目前大概有四分之一的学生会继续做科研,他们会多选择学一些本专业课程——并不是要把他们都培养成科学家,培养专家的思维已经变了。挤出来的学分在理学部内部任选其他学科课程,组成不同套餐。但有学生喜动脑不喜欢动手,强硬要求他们上实验课,就很难适应——不能为交叉而交叉,为跨学科而跨学科。强调尊重学生选择,但所有学科都有门槛,进入都有困难,如果怕过不了门槛就转专业,这将是一个大问题。总之,大学四年,掐头去尾,在不到三年的时间里,如何又搞通识又搞专业……
事与愿违,教学计划中学分压缩后,学生却更忙了。
钱博雅(YP01)7个学期修了232个学分。她选了中文系应用语言学方向,大二开始修了历史的双学位;大三又从语言学转文学。她主修学位170学分,双学位53学分。她的课程套餐包括:数学、经管、新闻、史双、中文还横跨语言和文学,其间还到台湾交换了一个学期。毕业时,她评价自己抗压力超强:“学这么多还活了下来!经管是被迫学的,财务会计很无聊,混了个及格;社科也是混个学分。历史中国部分认真学,世界史部分就混学分……”(YP01)
在钱博雅庞杂的课程套餐背后,是专业教育与通识教育结合的艰难。通识教育是与专业教育并列的另一套知识体系吗?是靠跨专业、跨学科学习去实现的吗?院系与专业的壁垒可以靠学生对课程的自主选择去突破吗?
学生普遍的忙碌与教学计划的变化有什么关系?教学计划包括学分与课程结构,即学分的数量与分布、课程的类型与选课的要求,它是落实人才培养规格的基本制度。在教学计划的调整中,有以下四个变化(参见附录1):
其一,缩减毕业总学分要求。1990年的教学计划四年制各专业总分数是155~180学分,1995年调整总学分降至150左右。到2003年本科培养计划,要求学分减少到130~140之间。2014年的教学计划中,总学分在140分左右。另外,学分对应的教学时间也在变化,自2002年9月起,教学时间由20周减少到18周,1学分对应的17学时减少为15学时。
其二,教学组织原则的变化。教学计划调整的基本原则是从按专业组织教学向按院系(或学科大类)组织教学的转变,以实现在院系(或学科大类)内进行低年级的通识教育、基础教育和高年级的宽口径专业教育。大类平台课与素质教育通选课要求不低于28学分。2016年的教学改革方案中已经取消大类平台课,修订后的培养方案中,通识课程与公共课程、专业核心课程、专业基础课程和专业限选课程、专业选修课程与其他学科的必修或限选课程之间的比例原则上为3:2:3:2。(参见《北京大学2016年本科教育改革实施方案要点[试行]》,载《北京大学本科教育综合改革指导意见》,2016年4月5日北京大学校长办公会审议通过。)
以历史系中国史专业教学计划为例(参见附录2),可以发现压缩学分,学时数减少。如“中国古代史”,1990年教学计划中为12学分、204课时,2014修订为8学分、120课时,课堂教学时间只占1990年代的62.7%。又如“中国现代史”,1990年6学分、102课时,2014的教学计划为4学分、60课时;再如“中国历史文选”,1990为8学分、136课时,2014仍为8学分、120课时。课堂教学的精简要求学生课下有更多的投入。
降低专业必修课学分和学时之后,低年级的通识教育与基础教育凸显“广泛性”与“选择性”。专业教育与通识教育表现出时间上的相互挤压,学生被迫修习内容庞杂的课程,他们究竟能从课程中学到什么?(哈佛大学在检讨课程改革所标榜的“广泛性”与“选择性”时指出,学生需要在跨度很大的领域之间进行选择,课程目录跨度大,知识体系缺乏内在统一性,不同学科之间就只能进行勉强的协调,最后课程演变成哈佛学生所谓的“煞有介事的各种学术动机盘根错节的网络”,大学四年的课程周旋于不同教授的学术领域之间,到头来却学无所成。参见刘易斯:《失去灵魂的卓越》,华东师范大学出版社2007年版,第20页。)高年级宽口径的专业教育,设置灵活的课程模块,为不同发展取向的学生提供选择。譬如,物理学院的课程设计为深度和广度不同的三类课程模块,分别适应三种人才培养目标,即培养专门从事物理科学研究的人才、具有宽基础的物理知识背景的人才和具有物理知识的应用型人才。[11]
其三,近半数学生修习辅修/双学位。1987年开始增设辅修/双学位制度,旨在培养培养复合型人才。2016年全校设有26组辅修/双学位专业,全校有1169人获双学士学位,154人获辅修证书(其中,双学位学分为40~50学分,辅修学分为30学分),全校近50%的学生同时完成双学位/辅修课程。其中,获得经济双学位的学生占所有双学位的比例为56.59%。(《北京大学2016届辅修双学位毕业情况统计》显示,获得国家发展研究院经济学双学位/辅修的人数为730人,加上经济学院与光华管理学院,所有修习经管类双学位/辅修的人数为747人,占到全部双学位/辅修毕业人数[1323人]的56%,而文史哲三系双学位/辅修人数合计占比仅为7%。校园流传,“课业闲暇修经双”俨然成为与“图书馆上自习”“康博斯啃鸡腿”相并列的北京大学“三俗”之一。)这意味着近半数的学生实际修习的学分是在180~190之间。
其四,教育经历日渐丰富与多元,学生更忙碌了。本科科研与出国交流、实习,以及第七学期的保研、推免与申请出国,重要课程与成绩主要集中在前三年。(参见附录3)减学分并未减课程门类,本科生前三年每学期选课门数高达8~10门左右(修双学位的学生达到10~20门/学期)。所有的这些措施直接导致课程数量膨胀:课程门类多、单门课程学分小、总学分要求高。因此导致课程量大,课程内容庞杂,课程之间的系统性、连续性受到挑战,知识与时间均易碎片化。
我们的学分实在是太多了,基本每个学期都要修20多个学分,平均每天都有3—4节课。文科课程文献阅读量相当大,老师要求一节课,课后要配三个小时的研读,如果要认真做,一个学期跟下两门课就不容易了。(FG12-2)
我跟过一个老师的课,每周一次课阅读一百页上下的英文文本,阅读时间要占六七个小时。如果要写作业,还要反复读,需要更多的时间。一周三四门这样的课,每门课五六小时,课下研读就需要20多个小时;可是,这样一门课学分也就2学分!因此,我们还要再选修7—8门课,才能凑够学分。理工科院系的实验课程学分减半,从前期准备到后期报告撰写,有的实验课要求每周投入5小时以上,可是,它只值“0.5学分”!(FG02)
北京大学毕业所需的140学分分布在60门课程上,每门课程平均2.33学分,这就意味着一门课程课堂教学时间平均不足35学时。一位哈佛回来的教师说,他在哈佛念本科时,一个学期修完4门课程已经累得不行(P01)。哈佛大学毕业要求的128学分分布约32门课程,每门课程均4学分;斯坦福要求180学分分布约在30~40门课程,每门课程学分在4.5~6之间。(参见北京大学教务部:《2014版北京大学本科生教学手册》;Harvard University: Handbook for Students 2016—2017;Stanford University: Major Requirements 2016—2017。)教学管理者(M02)介绍:学分制是移植美国的经验,在美国学分对应的学时数有严格的规定,一学分要求每周投入3小时,其中1小时课堂学习,2小时课后工作。
“一个上午如果只有2小时的课,这个上午就只干了一门课的事,时间全都打散了。”(FG08)课下投入时间更不足,据北京大学本科毕业生质量调查(2016)显示,本科学生上课时间平均为每周20小时,课外相关学习时间14.8小时,课上与课下学习时间投入比例为4:3。2017年的调查显示1小时的课堂教学时间所对应的课余投入仅为0.67小时。
多数同学的策略是:在精力允许的前提下选择几门确有所获的“虐课”,再搭配一些投入时间少、给分高的“水课”,这就是“水课”为什么受欢迎的原因。在焦点团体讨论中,学生们说:
我为什么要选水课?一个学期那么多门课,有水课,我们才能活下来。(FG18)我们要有刷绩点的课,这就是“水课”,上课讲讲ppt,考试考考ppt……ppt就是骗骗他,跟看电影似的,看时高兴,看完就忘,能记住多少?有的课,前两周去听听怎么考核,轮到小组报告时,大家一起做一做,不想做的,搭个便车。考前突击背一背,拿个“正态”;或者多背三天,分数上90完全没问题。我现在修了100多学分,高质量的不到20个学分。学生们对高质量是有定义的,知道什么是好课的,修完后自己综合能力提高的就是好课。(FG12)
学生需要水课才能活下去,为什么“虐课可以学到东西,通选课却反而越水越火”?(FG09)学生们怎么对待通选课呢?
上通选课的心态是学校强迫我们去学,我们常遇到的教学是教科书式的,介绍一下人物生平,他有什么思想1234,他做出什么贡献ABCD……譬如XX课,一个老师主持,许多老师来讲,跑龙套式的,……好处是让我们对学科的概貌有了解,不完全没收获,但一个学期下来,还是有点空落落的,很鸡肋。(FG09)
这涉及对通识教育的理解——通识教育与通识课程之间是什么关系?通识课程的主体——文理素质通选课开设于2000年,当时被称为本科生素质教育通选课。它吸纳了1990年代素质教育理念下的文理互选课、艺术选修课的学分。通选课的上述缘起,使它易被诟病为通俗课——用浅显的方式向非专业学生讲授一些有趣的问题以及学科里的非科学的故事和史话——或通论课——泛泛地讲授本学科的整体概念、结构与方法,点到为止。[12]直到2010开始建设通识教育核心课。
通识教育在设计上仅在形式上关心自然科学、社会科学、人文科学等六个领域,老师们上课时应该换位思考:一个人文学生,他学自然科学时,需要学的是什么?教师上课时,应该尽量基于门外汉的经验与视角去讲这个课;要把学科真正的趣味与力量,传递出来,能简单地让外行听明白,而不是把我们当成这个专业最菜的学生来教。很多通选课其实是把学生当作专业之外的菜鸟来教。(FG18)
通识教育不在于课程门类的多与杂,而在于学得透彻。如何才能教得透彻?学得透彻?既能学进去、得到精髓,又出得来、回到自己的经验生活中化为力量?最基本的一条是不能简单地追求数量:
不是扔一堆书,既不知道为什么读,读后也没有深入的学习和讨论。作为文科生,真正的本科教育是学会怎么挑选书,一本经典,把它读透,用不同的方式阅读,批判性阅读,细致地讨论,用不同视角重构论证,这对学生的能力挑战更高。(SS04)怀特海提出两条教学的基本原则:“其一,不要同时教授太多科目;其二,如果要教,就一定要教得透彻。教授大量的科目,却只是蜻蜓点水地教授一点皮毛,只会造成一些毫不相干的知识的被动接受,不能激起任何思想的火花”。[13]这是一种“支离破碎”的知识。
通识教育是以最快的方式直击一个学科的思维,进而提升能力。能力与知识是什么关系?有悬浮于知识之上的能力吗?为能力而能力训练的课程可靠吗?能力源自“知识的利用”:
一门人文经典课,找十多部最重要的经典阅读,好的老师不是复述一遍材料,而是引导学生怎样去理解、去阅读材料。老师需要向学生解释:为什么要读这本书?这一章节在学术史及相关领域的位置与贡献——在它之前讨论的问题是什么?它的背景是什么?它回应了什么?拓展了什么?它最新的进展是什么?这些线索让一本书的阅读有了问题感。通过一篇文献,可以对一个领域有基本的把握。(SS04)
通识教育的前提在于“闲暇”——心无挂障,不役于物。它需要以精、少与慢来达到深入的理解、能力的提升、性情的涵养。在课程数量的膨胀、知识的庞杂、时间的紧张下,学生身心陷入忙碌与焦虑中,与“闲暇”已相去甚远。
与老师们的本科时代相比,如今的校园到底发生了什么变化?
老师当学生时,研究宋史,每天看一卷,一段时间就把一本大部头看完了,二十四史从前到后,看得透透彻彻,这是他做学问的功夫。老师常说,一定要有定力,要专注。我想遵照老师的建议,140多个学分,一学期学三四门课,看十几本专业书,滴水穿石,能做出扎扎实实的学问。但一看室友,都修30多学分!我有顾虑啊,万一学问做不出来,其他路也全堵死了!……我们现在哪能像老师当年那样坐得住!校园有各种诱惑,社会有各种压力,我什么都想占全,多数同学心态都这样,尽可能地一直往前冲……就怕有一天,突然发现自己被整个世界淘汰了!(L01)
钱博雅所在本科学院,旨在探索跨学科的人才培养模式。她最想进入的却是专业学院的学霸圈子,多个院系的课程选择已经让她们白天在不同的课堂、教室中穿梭。一个宿舍四个人,四个不同的专业,跨学科交流只剩下宿舍——这个夜晚睡觉的地方,在这个共处的空间里,共处的时间却极有有限,能把他们拉到一起的共同活动与兴趣更为稀缺。
在忙碌而碎片的校园时空中,他们朝向不同的目标,擦肩匆匆而过。
04 考评权力下的表现技艺
精英的本意就是极少数人,精英的产生正是以对多数人的严苛淘汰为前提的。
这是一个由各级各类“状元”组成的群体。考试既是他们证成加冕的盛典,又是塑造着他们心智品质、身心惯习的日常战场。身经百战的他们,个个身怀绝技,人人出手不凡。如同老练的猎人,一进入森林,就能嗅出猎物的蛛丝马迹;他们能敏锐地踩准各个得分“点”,又能凭直觉谨慎地避开细小的丢分“坑”,分数战是高妙的出题者与精明的答题者之间过招,鲜有失手。在北京大学,分数又成了高手之间的过招,胜负难料。
学不懂专业的赵状元,凭借一身应试的好技艺,在专业之外的各种考试中保持不俗的战绩,既填补了专业落下的“坑”,又成功地开辟了一番新天地。
在教学计划调整的同时,北京大学的考试与评价制度在“严”与“活”两个维度上既明确又谨慎地调整,它体现着对学业完成、知识掌握的尺度与要求,它与教学计划共同落实着人才培养的规格与标准。
学生们所说的成绩的“正态分布”究竟是什么?又从何而来?1980年代,考试评分标准清晰,维度单一,考试是考查学生对知识与技能的掌握程度。1998年的考试模式改革中,首次引入了“末位淘汰制度”,要求一门课程最后的成绩评定中,优秀率(85分以上)不超过20%,不及格率(60分以下)1%~10%。1999—2006年之间,相关规定各门课程最后确定的总成绩应该呈正态分布,原则上优秀率不超过20%,超过30%则整体成绩无法登录;不及格率不超过10%,超过15%则整体成绩无法登录。(参见《北京大学本科生考试工作条例[征求意见稿]》,2005年11月10日发布;北京大学文件校办258号关于印发《北京大学本科考试工作与学术规范条例》的通知,2005年12月6日第592次校长办公会讨论通过。)2007年又出台新的规定,优秀率一般不应超过30%,不及格率一般不超过10%。(参见《北京大学本科考试工作与学术规范条例》,2007年8月28日第657次校长办公会讨论修订,校发2007第 151号。)这一标准一直延续至今。这就出现整体成绩两头小、中间大的正态分布特征,它既体现着“严”的传统,又是以同伴之间的相互竞争来实现。
考试成绩“正态分布”原则的确定意味着考试评价不仅考察对知识掌握,更要评价学生在群体学习中的相对位置。“正态分布”是“norm”(规范)的数学形态,它准确地体现着福柯的“规范化裁决”,它不再是一个自然的分数,而是一个人为的秩序。其后的制度逻辑是:大学课程的成绩是相对成绩,是同时学习这门课程的学生之间的成绩的比较,分数成为学生们竞争的稀缺资源。学生所说的“被正态”即指在此人为秩序中的重新排序,或者说分数成为群体中人与人相对竞争的工具。
福柯指出:考试把层级监视的技术与规范化裁决的技术结合起来。它是一种追求规范化的目光,一种能够导致定性、分类和惩罚的监视。它确立了个人的能见度,由此人们可以区分和判断个人。[14]
“正态分布”由来于教学实践中总结出来的规律,据多年从事本科教学的理科教授(P03)的观察:
再优秀的一群人,只要重组,自然形成新的等级,20%~30%的优秀者,他们会非常主动地学习,不需要老师操心;最后的20%~30%,你拖着他们走,都很难;最重要的是中间的大部分,制度如何引导他们。(P03)
社会科学教授(P05)引用“二八定律”解释理科教授揭示的特征:
任何一组事物中,最重要的只占20%,其余80%都是次要的:管理学认为企业80%的利润来自20%的项目;经济学认为20%的人手里掌握80%的财富,心理学认为20%的人身上集中了80%的智慧。二八定律启发我们如何设计好考评制度,选拔出最优秀的人。(P05)教学院长(D03)建议:
我们要提高退学率,第一年至少要有5%的退学率。总会有学生被淘汰,考试不及格,他会很痛苦,过去他是最好的学生,习惯被捧着……我们强调以学生为中心,但人文关怀不是妥协。我们要坚持一个原则,大学学习是痛苦的,要克服困难才能完成。否则只会越来越妥协,学分越来越少,课越来越水。一所好大学的本科教育,是提供有挑战的课程与任务,鼓励学生积极向上,帮助他们努力实现最大价值,学校所考虑的学生发展应该定位在此。(D03)福柯揭示了考试的实质:考试成绩的正态分布建构了一个比较的体系,既能度量总体现象、描述各种群体,还能计算个人之间的差异以及这些人在某一片“居民”中的分布:[15] 在与他人的比较中,在整体的分布中,学习者个人被度量、被评价、被描述。尽管优秀率已从20%提升至30%,实际操作中默许为不超过40%,分数虽在膨胀,但竞争却没有减弱。“只要守住40%优秀率,每个人都会拼了命地相互比、相互学”(FG13)。
除了学生群体分数的“正态分布”,学生个体的成绩实施绩点评分制。与国际接轨,1999年开始采取4分制为基础绩点的等级制评估[16](参见附录4):这意味着将百分制过细的评价尺度放宽,在过细的评分标准中,得分点自然细、碎、密。等级评估引导学生不再计较于一分一厘的得失,90分实为最高分值,这意味着学生不必再费力将成绩从90提高到98,有效地纠正了学习效应的“内卷化”——分值越高,投入越大,提升越小,从制度上拒绝盲目追求高分,考前刷题、过度训练等做法,这也意味着可将学生的精力与时间从低效率的重复学习中解脱出来。
2007年北京大学实施平均学分积点,采用新的计算方法(参见附录5)。GPA的分值由等级制又变成一条连续的、精美的曲线,这是北京大学理科教授们的独创。对比而言,新方法有三个变化:其一,粗化的等级评估(99版的10个等级制)被还原成分值上的连续体,绩点差异从小数后1位变为小数点后2位的差异,重返评分的细密化;其二,各分数段的斜率不同,百分制与绩点的换算率不同,低于84分,绩点加速下降;高于85分,绩点减速上升;其三,满分值从90又被提高到99。
2007年对等级绩点评分的修改,将模糊化的等级评分重新“精确化”。然而,精确化(precision)绝不等于准确(accuracy)。课程绩点=课程考试成绩×课程学分。在选修制中,学生平均成绩是不同课程中所得分数的平均值,学生不是在同一条跑道上赛跑,而是奔跑在不同的道路上,互不相干。[17]互不相干的课程成绩拉在一起有什么意义?
学年或总评学习绩点=所学课程学分绩点之和/所学课程学分之和。所有课程参与GPA的计算,就课程对绩点的贡献来看,除了学分大小有差异之外,课程的其他特征都被夷平了:无论课程的必修与选修、专业与通选等分类特征,还是课程的难易度等分级特征,在一些院系的综合评价中,绩点评分涵盖学生工作等“隐形课程”,这意味着课程边界被打破。不同形式的课程都走进校园,平等原则与宽容原则一起建构了一个规模庞大、供给丰富、类型多样的课程超市。
面对正态分布与绩点评分叠加的考评权力,学习者如何自由选课?绩点如何具有“能见度”?如何运用谨慎的选课来实现自己的策略?理科院长(D03)介绍了一个案例:
有一个绩点高达3.89的学生来申请奖金学,(我们)一看,几乎所有难的、具有挑战的课程,他都巧妙地回避了,所以成绩单很漂亮。再追问为什么不选有挑战的课?他说,那不是他的兴趣所在;什么又是兴趣?他的逻辑很简洁:兴趣就是被承认,如果不被承认,就说明没有胜任力,自然也就没有兴趣。我得出结论,他不是对知识感兴趣,而是对分数感兴趣,对绩点感兴趣,他选所有的课程都非常有针对性,都是为了绩点。我坚决主张,不给他奖学金,如果我们奖励这样的学生,鼓励这样的做法,我们学校就完了。(D03)这就出现了选课的技艺,从斜率来看,GPA定位在3.6,考分即不低于84分,这是相对理性的投入,虽有优秀率的限制,优秀率又在不断地上调。期待适度、宽紧适度的分数评估为学生自由选择留足空间:在理性、精明、甚至积极的忙碌中,用勤奋的多样化学习来逃避持久、深入且专注的学习。学生们这样介绍他们的认识与策略:
绩点是为了评估人、筛选人而设计的既不准确,更不完美的工具,这个工具既不能反映心灵的品质或者灵魂的品质,也不能反映一个人的学术水平。但绩点不能变成一个逆向淘汰的机制。为确保虐课的时间投入,要学会挑水课。用选课来规避低分的出现,每学期选三四门感兴趣的,认真学,哪怕给分有偏差也能承受。剩下六七门,策略就是选水课,期末综合绩点就不会低。(FG18)“水课”不仅指内容稀松,更指分数宽松;如果内容水,分数严,同学选课就有上当感。这就出现了对课程“性价比”的评估,即学习投入与学习产出之间的关系。在课程的性价比背后,学生与课程、学生与教师之间的关系,已经是超市中的顾客与商品、顾客与商贩之间的关系。
我认为现在的绩点评分是鼓励学生往下走而不是往上走的制度。譬如,数学要求最低是学B,那谁会去学A,学B考90,学A考70,学C考100,那我肯定学C……绩点就是鼓励学生都去学C。难度大的课程,绩点应该乘以1.2,设立荣誉课程,大学的氛围应该鼓励学生努力向上。(这一提案已开始落实, “在学生中积极营造自主学习、自我挑战、实践创新的氛围,条件成熟的院系可通过设立‘荣誉学士学位’和相应的制度,激励学生选修更具有挑战性的荣誉课程并积极参与实践创新,为培养优秀学术人才搭建更高的平台。”见《北京大学2016年本科教育改革实施方案要点[试行]》。)(D05)
教师批评的“下行”策略,从学生的角度来看,他们有“填坑”的压力。经济学院要求修4门数学课,累计17学分。一名高中读文科的经济学院学生,数学课程绩点没有超过2,一门5学分的课,如果只得了70分,就意味着要用两门2学分的90分以上课程去拉,这就是所说的“坑”。作为“坑”的课程,分值只要低于70分,绩点加速下降;作为“拉”的课程,分值高过85分,绩点减速上升,这就是所谓的“绩点边际伤害递增”——一门课所造成的“坑”要用5门、甚至10门课程的绩点去填。本科四年,他不能申请出国,不敢修双学位,只做了一件事——孜孜不倦地挣分填坑(E01)。
当课程的专业边界、课程的难易度被忽略,不同学生基于不同的知识基础、不同的学习期待来到同一个课堂,如何在同一门课程中对其进行考评?例如在大类平台课中,既有跨学科学习,也有跨年级学习,学生选课时不仅要挑课程内容,也要挑选同伴群体,选择的难度系数增大,一招不慎,满盘皆输。以下是一封BBS上关注度颇高的投诉信:
我的成绩并不突出,在学院处于中游水平,希望能够保研本校的研究生,并且我相信,以我的能力和水平,只要认真和努力,就可以获得应有的机会。这个学期,我希望能够提高自己的成绩,接近目标,却万万没有想到,被自己喜爱的法理课打破了希望。这是4学分的大类平台课,课上非专业的学生有很多,我的成绩只得了61分,绩点1.15。
我承认,作为一个外来院系的同学,在学习法理之前没有任何法学基础,根本无法与那些专业学院大四选课的同学相提并论。当初选课,是基于对法学的兴趣和扩宽视野和知识面的考虑,也不知道会有这种结果。在这门课上,我投入很多,借来上几届同学的笔记和资料,并通读了课程要求的教材和任课老师的著作,好好复习。在学业成绩之外,不同院系综合测评的方式不同,有的院系在GPA中加入综合测评,鼓励学生多参与、多服务。一些学生按照学生工作是否参与评分以及分值高低,决定投入的多少——精心计算“得与失”的理性化逻辑贯穿校园生活的每一个细节。一位社会科学的同学(FG05)谈到:“我们院的做法是,在综合测评上,班长、团委副书记和部长加分不能叠加。我当过一个,可以加0.01,后来我又当了副书记,就只加了0.015,有些得不偿失。一入学,学长们就会传经,毕业时要保研、要出国,所有的努力都要使自己的各项指标有亮点。”(FG05)
如果说“正态分布”用高手之间的过招来确保“严”,“绩点评分”则以自由选择来体现“灵活”;前者用度量、区分来判断个体学习者的位置,后者则利用度量与区分的繁复与灵活,寻求新的自我定位。前者不得不接受的被比较、被定位的“可视性”,在群体的厮杀中尽显惨烈;后者则谨慎运用绩点的灵活组合,重新赢得在群体中的“能见度”。竞争由严酷厮杀,到兴趣的诱惑、策略的谨慎,更为温和而狡黠。
在考评权力的科学与细密、表现技艺的理性与灵活的共同推动下,任何细小的、能增加荣誉的指标都被放大。托克维尔这样剖析平等导致民主制下人人多怀奋进之心而少有大志:
所有的人不管能力如何,都不得不在同一个筛子上过来过去,统统经过许许多多预备性的小小实习或训练,从而浪费了自己的青春,使自己的想象力消失。因此,他们不再认为自己有能力充分享用他们有望得到的好处了,而他们终于有能力做一番大事业时,则已经失去了兴致。[18]社会给了他们宽阔的舞台,校园没有限制他们的前途,他们自己却缩小了目标。
05 继承人:寻找与从游
在大众高等教育中,许多家庭与学生将上一流大学看成是孩子美好前程的“敲门砖”,许多教授却远离、甚至鄙视没有学术氛围的外面世界。[19]师生之间追求的生活目标各异,教师仍是校园里的常驻居民,校园却成了学生的“驿站”。他们穿过本科教育这个“门厅”,是拿到打开专业学院钥匙,还是获得进入职业生涯的通行证?他们是要走进学科之内,成为学术继承人呢?还是借这四年时光,叩响某个圈子的门铃?他们究竟要成为谁的继承人?
在这所学校,最精英的那群Top Student,一个共同的特征就是最早就明确地知道自己要什么,选择的路不同,挑战也不同。
要走学术,就盯住Top five 学校。一个即将去哈佛读古典学的同学,他很早就清楚要做学术,关键在于申请国际名校,他绩点超高,在大学四年学了拉丁语、古希腊语;自学了德语和法语。他非常专注,四年就干这一件事,他百分之一百入校第一天就全力投入。
要想年薪百万,成为人生赢家,就盯住大投行或咨询公司,这一行核心竞争力在于有含金量的实习。
如果选择仕途,我一个师弟一入学就明确要混学生会、混团学(社团),要在这个江湖里混得风生水起,出人头地,这一行的难点在于要明白自己的身段是否够软,要善于鞍前马后,任劳任怨;凌晨三点大佬电话打来,我们喝多了,你来接;于是颠儿颠儿跑去接了……然后他就真的混出头了,运气非常好,未来很可期。(FG16)
这是学生们用他们身边事例中展现出的不同的成功目标与路径:他们来路不同,去处各异。短暂的校园时光,他们选择进入不同的圈子以及不同的生涯发展轨道。众多“圈子”的出现,表明象牙塔中的共同体已经裂变;“圈子”的运作,揭示着象牙塔之外的逻辑既侵蚀又重构了校园生活。
对职业取向的学生,实xi是大学学习的重要内容。学位不断膨胀、学历持续贬值,实xi的履历、研究生的文凭,都是职业市场的符号资本,也是身份的重要指标。“条条大路通CS(计算机科学),万般唯有金融高”,职业市场中对本科就业吸引力最大是高盛、花旗等顶级投行,“少数去顶级投行的‘大佬’把薪酬的平均数拉上去了——对这一群体,再读研究生,是一项得不偿失的投资。”(E02)根据出路的不同,学生不断地选择重组学习经历与课程模块。在高等教育大众化的压力下,复合应用型人才或跨学科培养项目有丰富的组合:人文背景加经双,适合咨询岗位、客户服务岗位;理工科背景交叉金融,针对金融机构的研究岗位有竞争力;新传叠加社会,为培养深度报道的记者量体订身。
一个哲学专业的同学,目标是投行,他修了经双,大一暑期就去一个经济杂志实习,他的过人之处在于选择做市场,从偏门进去,一步一步往上走;他做过两三个咨询的实xi,人文的本科让他能说会写,尤其长于说服别人,取得客户信任,他已经进入很好的咨询公司,可以独立跑项目了;他又跑去做投行,为了“得到”大三暑期的入职前实习,甚至休学一年。他最终如愿以偿,拿到了香港投行的实xi机会,他也将在那里开始他的事业。(L02)
对这一群体,如何在有限时间里,使自己的履历可视性更强,亮点更突出?“你的价值在于你过往的经历,实习既是对职业经验的熟悉,更重要的是获得机构的承认——这是你的市场价值。”(E01) 履历上的亮点实为符号资本,其运行逻辑是荣誉法则——超拔于众人之上的更有显示度的指标,它的竞争既是严厉的,更是隐秘的。它需要精英圈子内的榜样示范、观察体悟、不经意地点拨以及关键时刻的提携或推荐。
室友一进大学,家人就推荐她到了投行实xi。老板亲自带她做深度项目,言传身教。做了一段后,她对投行产生了厌倦,投行搞的是人情,要察言观色,拿捏分寸,总之,大客户就是上帝。学霸出身的她,不愿屈尊去适应这一行。大三中期,她临时决定转金融工程,强大的校友圈给她同样精确地指导,学长推荐她申请到国际投行的金工实xi岗位,她又报了国际名校一些著名的网课,还拿了证书。终于她拿到普林金工的offer。她真的很厉害!(E03)
多数同学还在懵懂迷糊时,他们清楚地知道所要的目标,以及达成目标的不同路径:从一个明确的、可操作性目标开始,逆向推导每一步,具体到每个时间点所需要完成的任务,整个规划都清晰、简洁。 他们的风格是:直击目标,不走弯路,理性简洁,既不想入非非,更不允许失败,理性的生涯规划让他们快速成长。
外企中的投行,以本科毕业的身份比较好进。捷径就是大三的暑期实xi,只要表现出色,通过答辩,拿一个return offer,可以直接入职。为了大三的暑期实xi,大一、大二就要开始实xi。(E01)
履历中的符号资本不仅体现在求职中,更延伸至教育场域,在任何竞争性的选拔中,履历的符号价值均被凸显。教育机构在此已经蜕变为人力找寻中精明理性的“猎头”,猎头的筛选逻辑是清晰的,评估与预期一个年轻人的潜力与未来,依据在于他已经获得的成就,他未来发展的限度取决于他过去的努力与资格中。猎头筛选的操作逻辑是简洁的,一群申请者之间如何排序,需要简单的、可比较的数字与符号,这既可量化、一目了然且程序公正,——这即是市场逻辑所培育出的“履历书写技艺”。福柯曾剖析规训权力对履历的书写:
长期以来,普通的个性——每个人的日常个性——一直是不能进入描述领域的。被注视、被观察、被详细描述,被一种不间断的书写逐日地跟踪,是一种特权。一个人的编年史、生活报道、死后的历史研究,是他的权力象征仪式的一部分。规训方法颠倒了这种关系,降低了可描述个性的标准,并从这种描述中造就了一种控制的手段和一种支配方法。[20]
“履历书写技艺”的出现再一次颠倒了福柯上述的规训权力,成为一种主动告白的技艺,迎合检查与评估这一新的权力运行方式,每个人的个性与特征以定量的数字与指标、定性的成就与奖励,以及各种荣誉性的符号来计量、描述,目的在于评估出高低,裁决出胜负。
在检查权力/告白技艺下,有限的校园被拓展延伸至外部世界的不同层面,校园生活变成多重轨道的折叠:第一轨道是以文凭为表征的学校人才培养规格与教学计划;第二条轨道是自我成长,如何认识自己,如何寻求朋友,如何确定自己的志趣,如何进入社会,这是一个缓慢的、尝试的过程;第三条轨道对应于实习、各种资格考试与证书,以及其后的见识与人脉,构成与知识学习并行的另一重要的学习与实践的台阶,它既是学生职业能力成长的重要环节,也是用心经营的职业敲门砖。
职业取向的学生再反思自己的本科经历时指出,只按照教学计划与学院的规定来做,根本就没有触及成功的秘笈:
学校里所学的都是屠龙之术,与我们的需要有什么关系?例如,毕业两三年后,我们有机会、有能力去影响货币政策吗?不可能!最急迫的实务知识只有靠自己去实xi,从做中学。学校课程希望培养我们看问题的方法,但不重视基本实务。理论知识决定你走多远,可实务知识决定你能否进入,没有实务的东西,你根本就进不去。(E02)“蚓无爪牙之利,筋骨之强,用心一也”,来自乡村的孙学商(E03) 完成了近乎脱胎换骨的蜕变:
我从农村考到北大,入学时学校发的校园卡,是全家第一张银行卡。我知道的差距,我会努力去弥补。第一个差距是英语,入学时是哑巴英语。从大一到大三,一千多天,我每天都坚持30多分钟的听说练习,从不耽误。刚开始,我连一分半钟的英语都听不完,因为听不懂,硬着头皮反复听。慢慢开始听VOA,听TED Talks,一步一步,可以大胆说话,可以流利地交流,还争取到去美国的交换机会。第二个差距是言谈举止,风度修养。金融是服务业,长得漂亮、具有文化资本的学生更有优势:见多识广,与人交往更有自信,气质与金融、投行等职业领域更契合。(E03)她中学接受的是“应试教育”,除了教材与课本,很少有其他读物。学校推行的通识教育给她打开了一扇扇精彩的窗口,她投入了极大的热情去上通识课,她的阅读也充满着计划性,大四开始选择主要文明国家中最有代表性的作品,一个国家一个国家读,以获得对世界文化地理的真切感受……离校时,她的借书证上显示本科期间总借阅书目为35本。
视野的差距比纯教育质量的差距更令人绝望,这不是你自己造成的,而是你的出身造成的。不少同学在这种差距面前,泄气、抱怨、拖延、懒散,自我放弃……我不愿意这样,我一直在努力。我高考成绩是我省被录取学生的最后一名,现在是年级前30%。我对自己的进步是满意的。但是,和直接去投行的同学相比,差距是隐性且巨大的。重要的是我不知道如何去弥补。大学四年,我无论怎么苦学都难以弥补的差距,这是人家长期熏陶和积累的资本。我想慢慢改变,最好的方法就是多跟他们在一起,可是这种机会并不多。(E03)
临近毕业,她才开始明白室友整天在忙什么,对商科学生来说,实习i履历与校园学习如同行走中的两条腿,哪儿短了,都是跛足。她选择继续读研:
读研对我究竟意味着什么?知识上的增长不过是从中级宏经到高级宏经,如果不从事专业学术研究,这个增长可以忽略不计。对我来说,未来二三年最重要的是做更有含金量的实xi,再以研究生的文凭去找更好的工作——去国企与私募,硕士是准入资格。(E03)知识真能改变命运吗?同一个校园,同一张文凭能给我们同样的出身吗?学校里的逻辑能够抵御社会的逻辑吗?这是贫困生焦点小组讨论中学生们困惑:
今天凌晨,我看到朋友圈的一条帖子:有时候你不努力都不知道什么叫绝望。——好像被戳到了痛处,刚入学时,信心满满,我从农村来,我的中学也没法和你比,但是,我和你来到同一所学校,——奋斗十八年,我和你终于成了同桌。但慢慢认识到:虽然同在一个校园,同上一门课,我们之间横亘的差距是难以缩小的。尤其是视野,前十多年的环境与经历所形成的视野的差距是实实在在地存在的,你认为好补吗?所学的知识看起来不都是客观的知识吗?不都一样选课吗?不都在努力地学习吗?我们只有在一些硬的课程(譬如有标准答案的数学课)差距不大,但在一些较“软”的课程里,譬如论文写作的角度是否新颖、切入问题的角度是否刁钻?是不是有些独特的想法,口试时是否能说会道,这些需要综合能力的地方,立刻就看到差距。(FG15)这里的“视野”差异正是布迪厄的“文化资本”:“成功地将先天特性的特权地位与后天获知的成绩结合在一起”,形式上是个体不同的天赋、努力与欲求的结果,实质上主要是以家庭为单位积累并传承的。[21]他们对个人努力的确信遭遇到文化资本排斥,“某种根植于经济和政治秩序的物质性中的历史性任意裁断的社会秩序,经过自我的转换,成为一种智力的贵族统治,每一处外在呈现都反映这种统治,经由社会炼金术的运作机制,社会等级制得以自我掩饰起来,好像是一种人的成就的度量表。”
体现文化资本的“视野”指知识所转化为人的见识、趣味、辨别力与判断力。长期的熏陶潜移默化地影响人的认知图示、审美趣味以及性情倾向。 文化资本如同一扇玻璃天窗,看似没有障碍,透明敞亮,只有用身心去撞击,在失败的疼痛中才体会到排斥的不露痕迹。
“什么是真正的不知道?就是你不知道自己不知道。”(FG15)
学校能给他们新的出身吗?他们要跻身哪个圈子?成为谁的继承人?
在这样的尝试、观望与选择中,教育该如何发生呢?传统中教育发生于师生之间的从游,“从游既久,其濡染观摩之效,自不求而至,不为而成。”[22]如今的师生关系更似梅贻琦所比喻的“奏技者与看客之关系”,看客如不得其妙,趣味索然,或左顾右盼,心猿意马,奏技者还去追逐讨好不成?没有教师的引导,学生与知识、学科、专业的关系变得更为复杂了。这就涉及一个严肃的问题:学生的自主学习能够替代教师的教育吗?对于大多数学生,制度如果不鼓励他们进入一个学科,获得深度的学习及相应的教育价值,而是允许他们自由地“转专业”,任何学科都有门槛,在“转”的市场逻辑下,学科门槛的高低宽严将如何调整?如果他们不跨入任何学科门槛,在DIY的积木搭拼式的课程套餐中,他们又将获得什么样的教育呢?
为什么同样的文本,有人读得津津有味,入迷入神;而换一个人,可能索然无味,完全不得其法?这就是学科的门槛:如鱼得水,兴趣盎然者,已经跨入学科的门槛;格格不入、味如嚼蜡者,即在学科门槛之外,或是不得其门径,彷徨在外;或是主动选择,不入学科之内。布迪厄的洞察富有解释力:在学习者的偏好、特长、志趣与学科知识之间,在学习者的心智结构与学科的文化结构之间,有无“亲和的默契感”或者说是“选择性的亲和感”?这是“选择/选拔”的核心机制,这个机制体现在学生一方是基于兴趣与志趣的选择,体现在学科一方则是对学习者的严格筛选。跨入学科之内的“亲和的默契感”体现为浓厚的专业兴趣,这并非专业学习的前提,而是深度的专业学习的结果。它需要课程精心的安排,需要教师的用心引导,需要学习者专心地琢磨,慢慢品味出学科的滋味与精髓,使躺在书本上的静态的知识真正化为自己的一部分,学科知识与人的情感、意志与经验融合在一起,发生化合作用,创造出“新人”—— 这是学科文化的教育价值,学科的思维与眼光如何转化为学习者观察与思考问题“活”的视角,“日用而不察”的概念,以及可靠的知识传统?进而形成生活风格乃至生命态度?即由专业达通识,准确地说是在深度的专业学习中达到通识教育的目的,这是人的教育中最艰难的地方。
这需要学习者“泡”(长时间的浸泡)、“炖”(煎熬与磨砺),更需要教师们——不是作为知识的生产者,或者是一个匠气十足的专家;而是既活在学科之中,又将学问化在自己身上的教师们——在日常的生活与学术研究中,身体力行地示范与教导。他的见识与判断,他的选择与坚持,他的信念与价值,这才是最真实、最有力的教育。春风化雨、润物无声,获得表层的知识与技能是容易的,教育中真正的困难在于学习者内在动力与热情的培植,以及判断力、辨别力与意志力的养成,它需要学习者“从游”于教师身边,观察、服从与追随。
在自由选择下,“长时间的浸泡”很难成为对学习者的制度要求。浸泡需要不被打扰,挡住外在的诱惑,一心一意地将自己放进去,先舍弃,再获得。然而,在评估制度所孕育的成功文化看来,这是一种“不计得失”的非理性选择。研究与教学之间的冲突本来就是一个棘手的问题,自由选择想借学生的脚投票,使院系与教师更投入教学。实践中却非常复杂,甚至南辕北辙。
例如,教师们把学生当作未来的学者——学术继承人来培养:
人文学科的教学非常精英化,老师预设学生以后搞学术,培养目标都是学术人才,上课的内容完全朝着专业化的道路走。教学中,老师常也只关注那些能跟上老师的思路、能与老师对话的学生,对多数普通学生,对想就业或转专业的同学,老师不太注意,甚至不大看得起。(L01)教师们不难以激赏的目光关注那些深谙学科滋味的“准学术继承人”。在进入学科之后的师生关系中,从游乃是典范,如同天空的雁阵,朝一个方向,以大致相当的速度飞翔,他们之间更多是精神与趣味上的同气相求,彼此呼应。但多数普通学生学习的困难、入门的犹豫,制度能否认真地体察、理性地引导?大鱼前导,小鱼尾随,当小鱼不能游、不敢游时,制度安排谁来当教练?当小鱼不愿意跟着大鱼游、在游来游去地试错时,能对自己的选择负责吗?
虽然学校在推行“导师制”,甚至有院系规定导师每学期与学生见面谈话不少于四次,但是没有共同的活动,没有自然形成的共同体,制度化的师生联系机制常徒有其形。教师办公室的门还开着,预留了office hour,有需要,可预约;老师们还组织了读书会,有能力、有兴趣者可参加,事实上,有自信参加读书会的本科生是极少数;“能够主动去找老师讨论问题的,都是学有心得、学有所获的同学。如果我一直没有跨入学科的门槛,我能与老师主动谈什么?”(FG03)
高考没有考历史的李人文(L08)被录取进了历史系,高考报专业时,她填报的是社会科学。北京大学历史系的成就让她敬畏,身边同学都似有浓厚的兴趣,她直觉这个水域并不适合自己的生长。
历史系同学的基础差别很大,有的同学入学就读二十四史、《资治通鉴》;有的同学除了上课,下来不大读书。我介于两者之间,不时还有下降的危险。
她在参与公益服务中找到了自己的“存在感”:编稿件、写公文,(我)发现自己比较擅长,也能获得肯定,逐渐开始往学生工作方面倾斜。大二上又修了法律双学位,投入专业学习上的精力变少,大二上绩点很低。随后调整学习策略,只选了三门专业课,其他选了大类平台课。因为精力更加集中,大二下学期专业课成绩提高了,大类平台课成绩也都不错,逐渐恢复了信心。(我)认识到专业与双学位无法兼顾,就把法双退了。(L08)
李人文在专业、双学位与学工之间,不断触摸水域的深浅,小心地调试:
大二下开始分专业,历史系分为中国和世界两个方向,中国又细分为古代和近现代史两个方向。我选了近现代史,一是因为中国古代史和世界专业史门槛很高,一个需要古文基础好,一个需要外语(好),中国古代方向门槛尤其高,基本都是学霸。因为中国近现代和现实联系更密切,(这)让我更有兴趣。分专业之后,我的专业课分数都不错。保研时又面临再次选择:一是自己不适合学历史,二是还是想学社科。为什么说不适合学历史?按照刘知几有史家三长论——史才、史学、史识,针对我自己,我认为自己史学薄弱,掌握的历史知识太少,史才、史识更难具备。特别是史识,如果没有老师的点拨,我很难在历史和现实中建立联系,这是我一直以来的困惑。如果再继续读本系的硕士,可能会更专更精,对自己整个人的提升却不大。再反思自己,很难克服只见树木、不见森林的状态,也很难将历史和现实建立联系,归根到底还是自己基础不扎实,不能融会贯通。于是保研时转了社科,准备走职业路线。(L08)本科的历史学训练给她这样的影响:
一是使人不虚妄,虽然很难达到以史为鉴的境界,但心里有历史的尺度,虽然上面的具体刻度可能模糊不清;二是增强判断力。比如看到信息,会下意识地去看出处。结合第一点,我觉得比较幸运的是虽然难以达到“真”,但可以驱除许许多多的“假”。(L08)未跨入学科之门的学生如同“小蝌蚪找妈妈”,在不断找寻中,磕磕跘跘地完成自己的“蜕变”。在人文场域,需要老师与课程的“引导”;也需要自己的“体悟”与“实践”,李人文在从游与寻找之间,慢慢完成了自己的“蜕变”。
06 自由选择:试误与成长
周竞赛(S05)本科毕业时,父亲批评他:“冶游四年,不学无术”。
周竞赛自幼热爱科学,竞赛拿到一等奖。他被理学院严格挑选出来,再经过严格的培养与教育,有望成为学术“继承人”。
他曾有浓厚的专业兴趣,他不喜欢刷题,习惯自己从教科书的原理出发,通过实验、推理,探索学习的过程。一进入大学,期中考试就栽了,高数只考了50分,登录成绩是开了根号的75分。这门5学分的课程让他整个一年都在“填坑”。大一上修了23.5学分,上课与实验时间加起来每周约45小时;实验课从早上10点一直做到晚上;大一下有两门实验课。学习压力太大,有同学甚至每天只睡3~4小时,困了趴在桌上睡,醒来继续写……刚从高三过来,学习的辛苦并不是最大的障碍。
理学院对他提出更严格的身心要求,“继承人”的塑造需要付出更高昂的代价:强制学生遵循一丝不苟的学习方法,严肃朴素的生活习惯,以个人生活的极大牺牲,实践在知识学习和社会交往两方面的禁欲苦行……[23]科学场域正是用这样的方式将“惯习”——与科研相适应的性情倾向,体现在人身上的历史——烙在其成员的身上,成为他的第二天性。面对这个“锻造”的过程,周竞赛疑惑了:
“这不是我想要的大学生活啊!我想象的大学生活,可以读自己想读的书,可以交友、恋爱……”(S05)科学场域的教育主要发生在实验室里,如同蜂巢一般,围绕科学研究,组织严密、分工有序,它的教学模式是严师高徒模式。科学场域需要他全身心投入,可他不再把这看成是一个充满意义的世界,他把苦恼告诉师傅,他想学管理。师傅听了,真诚地说:“先拿到科学博士,再从事管理也不晚。”他有些愤怒,他把这称为科学的“沙文主义”:“万般皆下品,唯有科研高。在老师眼里,为什么要去修‘乱七八糟’的经双?这完全是功利的选择,孺子不可教也!”(S05)
与外部世界的丰富有趣相比较,实验室的生活太单调乏味了。周竞赛决定背弃严厉的师傅,慢慢且坚定地从被他喻之为“斯巴达式”的教育中退场,他成为理学院中的“转行党”。放弃科研,这种挫折感是双重的:
不是智力有问题,就是品德有问题,师傅说:这意味着不敢面对挑战,不敢正视困难。转专业真的意味放弃与懦弱吗?对自己的兴趣是否忠诚?成绩不如人真的是努力不够或者智力有问题吗?(S05)周竞赛们陷入了两难:承认是对信心的致命打击,不正视就找不到适合自己的选择,他们不敢怀疑自己以竞赛获奖或高考高分进入时,做了一个错误的专业选择,因为那意味着对自己的否定甚至是背叛。他也不愿面对“态度有问题”之后,来自专业的承诺、责任与义务等的责难,他更不会正视“忠诚自己的兴趣”中的“兴趣”是真实的还是虚妄的?——这是他可以说服自己的唯一理由。
他们还遭遇到来自同学的蔑视,转专业这件事在同学中意味着心理上乃至身份上低人一等,学生群体中存在着撕裂。
决定留在理学院但不再做科研后,理学院一切评奖以及别的机会都与我无关了,我不能得到学院任何积极的培养。它只是给了我自由,即不禁止,不阻碍,但没给任何引导。我后来做的一切,好像是自己偷偷地,不能光明正大地放在台面上讨论,我过得到底如何,没人过问。(S05)
他在叛逆的内疚与诱惑的吸引中艰难地走出第一步,大二开始修经济双学位。经济双学位不像师傅所鄙夷得那般不堪,他喜欢社会科学的思维与视角,帮助他认识与理解身边的社会与人事。他开始对专业课彻底“放水”,他踏出去的脚步迈得越来越远。大三开始,他接手了一个濒危的社团,他的热情与投入使社团重新焕发活力。利用社团这一平台,他能自然结交家乡与北京的本省籍精英;社团给他一个实验场,他仔细地学习待人、处事、识势,他体会到了权力与金钱的力量,他看到权力怎么做事,也看到金钱怎么操作权力。社团使他提前走上社会的大舞台,他开始站起来,体会到做事的能力,成长的力量。他选择了一个社会科学院系继续读研,准备读完博士之后,出来创业。
学工教会我的是通用的能力,知识是固定的,能力是迁移的,我“不学无术”而“活动于社会”是找到了成长的法门。知识与能力是成长的两条腿,缺一不可。(S05)
他在专业学习之外,摸索适应社会的能力与成长逻辑。他先似一个弃儿,后像一个浪子,纠结地成长。大学毕业时,从校长手里接到“理学学士”证书时,他感到愧对世界一流理学院中最扎实的专业教育,他没能把一个专业学透学通。短暂的愧疚之后,他又充满热情地瞄准下一个目标。
游历的不仅仅是从实验室中出走的周竞赛,郑古典(L05) 用“试错”来定位大学的意义:
我的兴趣就是三分钟的热度,这想搞搞,那也想搞搞,这是性格特征。85%的同学都不知道自己想要什么,我现在差不多知道想要什么了,用了四年来试错,试错完了,该毕业了。你再也没有这么丰富的资源、这么多的机会去尝试了。(L05)她来自一所著名中学的文科实验班,以全市前10名的成绩考上北京大学。郑古典从小接受素质教育:
幼儿园就有英语口语,高三时晚自习还看小说《三体》,看英文电影“Rain Man”,玩游戏。与那些来自封闭的县中,能适应高强度的训练且坚韧不拔的同学相比,我绝对不会用坚韧和不懈努力这类词来形容我自己。(L05)回顾四年前的入学动机,她有四重考虑:第一,北京大学的本科文凭;第二,学习基础学科,本科学的专业与今后的职业没什么关系,要打下扎实的基础,因此选择基础学科;第三,父亲告诫她,北京大学的校友人脉很重要,要求她加入社团,认识一群官二代、富二代,这很现实。第四,大学四年,应该留下一段自由的青春回忆,很开心地玩了四年。
毕业时,再评估本科四年,她用“浪”来描绘自己的状态。“浪”首先是一种心气,她挑战成功者,她曾经是他们中的一员,她深谙成功的标准与成功的策略:成功者的选择是基于成功的考虑,在自己胜任的范围内不断用成功重复成功,或者固执地待在自己舒适的区域内用舒适延缓舒适。她选课都是基于兴趣,她敢于选择最新的培养模式,她参与跨学科项目,她不在意课程的难度与分数,选了很多挑战大、难度高且得分虐的课。
“浪”还是一种探索与叛逆,要敢于按照自己的节奏走,探索形成自己风格。她以既独立又依赖、既理性又任性的方式,与父母的权威、与制度的规范对话:
从小到大,花精力最多,做得持续最久的一件事就是和家长进行博弈吧,这是我人生的权利。之前家里管得严,刚入学的时候,天天就是玩。经常喝酒,喝到一两点钟;然后去混混社团、混混BBS;然后想干嘛就去干嘛,混团学,打游戏,又做实习……然后,大三就结束了,才开始说,要不然就出国算了;然后,又开始准备出国……(L05)“浪”并非她个人的状态,而是一个时代的风尚以及这一风尚下教育所滋生的一代人的基本性情。托克维尔在分析民主对人的性情影响时,指出有一种无知是由于知之过多而造成的[24]:
他们的生活被即兴的力量所支配,他们往往在这种力量的支配下去做他们没有学会的事情,去说他们根本没有理解的话,去从事他们没有经过长期学习的工作。他们不能对每个目的都有清晰地认识,所以容易安于一知半解。他们的好奇心既永无止境,又是容易得到满足,因为他们所热望的是尽快知道很多东西,而不是深刻地认识这些东西。他们没有时间,而且主要是没有兴趣去深入研究事物。注意力不集中的习惯,应该被视为民主精神的最大缺陷。[24]大众高等教育充分尊重这即兴的力量,以及这既永无止境,又安于一知半解的好奇心,他们被尊称为“消费者”。以“尊重选择”为名,大众高等教育既满足又培养新的教育消费者,既诱惑又塑造着他们的欲望与惯习。消费者热衷于追求的过程,他们总喜欢尝试新的,不同的事物,他们喜欢的是追逐本身。在“浪”的飘飘然中,未来、方向感成为有问题的提法,未来被理解为“现在”,“现在”用种种选择既敷衍了未来,也回避了过去,时间的链条被消解为一系列的叠拼的、断裂的“片段”,在一个个细碎的、没有因果关系、没有前后连续性的片段中,他们忙碌地消费着、体验着、迷失着——这就是成长吗?
我就这搞搞,那搞搞,如果在国内找工作,随便找个月薪八千、一万的工作混一混;如果出国,申一个不算名校的名校,找个不太热门专业混一混。其他同学呢?他们学习很认真,成绩也不错。但不也是这门课学一学,那门课听一听,社团弄一弄,恋爱谈一谈……其实也是这搞一搞,那也搞一搞,然后,他们可能就是比我多挣两千块钱,或者去的学校排名高些,专业热些……他们那么努力,最后结果不也差不多吗?(L05)
理斯曼(David Riesman)在分析社会结构与社会性格的关系时,提出了富有启发的视角:当社会心理不再是“匮乏心理”而是“富裕心理”时,极易出现“他人导向”的人格特征[25]。他们主要的心理约束是一种无处不在的焦虑,其控制装置很像雷达——敏锐地捕捉时尚与潮流,既与时俱进,也随波逐流。
一个人可以在试错中成长,一个群体呢?都需要在试错中成长吗?制度给他们提供什么保护与引导?而非仅仅是允许其试错?教育的作用呢?它不应简单复制市场的自由选择逻辑,教育制度不同于一般制度的教育性如何体现?它应引领社会风尚,而非迎合社会风气,教育的权威在于引领社会,引领的根基在哪呢?
中国教育一直在检讨年轻一代批判性思维不够,我们从小被鼓励大胆质疑,但很少被要求小心求证。随意地批判什么、怀疑什么是容易的,我们真正的困难在于选择相信什么,没有可以相信的东西,就没有办法在这个基础上继续往前,无论是科研,还是做别的事情……(S02)
如果我们的教育不能为成长中的心灵安置一台“心理陀螺仪”——内在导航的动力机制,让他们既有航行的方向感,也有可以锭锚的方位感,而仅仅是用所谓的批判与怀疑精神“把诸神和英雄投射在洞穴岩壁上的影子从想象的心灵中抹去,这只会抽掉其精髓,削弱其力量。学生们甚至在没有任何信念之前,就学会了怀疑一切信念。”[26]他们变得头脑空洞,心灵空疏,准确地说,生命真正的困境在于不知道可以真诚地相信什么,确定什么,在推倒一切的虚无中,生命的热情如何寄托?自由选择可以是持续地选择,用后一个选择推翻前一个选择,在教育的消费中张显所谓的自由个性;自由选择更可能是不做选择,准确地说是从众,用大众的选择代替自己的选择,用社会的流行代替自己的判断:
为什么要选商学院?因为既不知道热爱什么,也不知道不热爱什么,不幸高考成绩又这么高,有什么理由违背父母期待、挑衅社会的常识?(E01)进而,再用成功遮蔽成长,所有的热情都被调动,角逐于分厘得失之间,小心地回避困境,谨慎地避开挑战——如同在试卷中小心地绕开丢分的“坑”,精明地找全得分的“点”,填写人生的试卷同样需要精明的“眼光”:他们是既谨慎又轻佻的书写者,他们是看似活跃的教育缺席者,他们也是看似成功的失败者。
当然,更多的选择是延缓选择,甚至是延缓一切。与忙碌症相伴随的拖延症,同样如流感般流行:用茫然来面对茫然,用焦虑来逃避焦虑:
将来怎样无所谓,就算有一个目标,也会特别拖延,快乐一时是一时,明天的痛苦给明天吧。(FG13)拖延是把今天从对未来的担忧中解放出来,活在当下的慵懒、轻松与焦虑中,时间同样失去了连续性,挫折是细小的,但每时每刻都在。
吴不为(L03)来自乡村,大学一二年级,他认真学习,成绩不错;参加户外协会,足迹踏遍京郊山水,谈了一次恋爱……“大三以后开始颓了,突然感觉整个人很懒散,不太清楚自己想干什么了。”(L03)他的本研论文写庄子,毕业绩点在3.3左右,算中等偏下,够保研资格,但他不愿意像多数同学那样用读研来延缓选择。他主动选择了去支教两年,他希望用两年时间想清楚,他到底要干什么。他是一个消极的退却者吗?他是一个积极的行动者吗?都是他,真实的成长或许就是这样。
“心理的陀螺仪”究竟如何置放?它需要舍弃,才能获得;需要服从,才有引导;需要学习,方得教育——将自主的个体接续到传统中,在谦卑中感受伟大的力量。
丁修远(SS04)是理学院的学生,入学后确定自己希望从事的是基础学科,转专业成功,同时降级为社科院学生。大二开始修社会学双学位,毕业时原本想直接申请古典学方向的博士,因为准备不充分,又延缓毕业一年,“不应该着急,慢慢积累,再有一个时间能够缓冲一下,能够写出足够好的研究。”他用六年时间完成了本科学习,中间出国交换过一学期,修了221学分,经历了从自然科学到社会科学,再到人文学科的跨学科学习。他明确了研究方向,找到了一生从事的志业。
我真的耗费了最宝贵的六年时间才找到了真正的研究问题,最后一两年才慢慢开始知道应该如何去学习,怎么样去听课,跟哪些老师学习,怎样去看书,怎样做研究,这是一个非常漫长的试错过程。(SS04)
六年的本科经历不仅是学习中的寻找,更是不断地辨析,甚至背弃家庭及其后社会的期待:
我来的地方比较偏远,我的家庭对高等教育的期待不过是社会流动的跳板,用我们地方的老话就是“兴盛了”,家人看你上北大了,就是要当大官了,挣大钱了……庆幸的是,这些年我的(价值观)有了很大的改变。本科培养了一种独立思考的能力,不是人云亦云,在浮夸或拜金的社会,能找到让自己定下心来、自己想干的事情,这是我最大的收获。人生是一场很漫长的赛跑,北大的自由与包容给了我这个空间,对自己心境有一种磨炼,不太计较一时的得失。(SS04)
在这里,他找到了传统,找到了伟大的老师。他感受到了神召,即韦伯意义上的以学术为志业,这是一种与“天命”——个人不得不接受的、必须使自己适从的、神所注定的事。[27]在这里,他是被拣选,而非自由选择。这是一份激情,一种奇特的“陶醉感”:
没有这份热情,没有这种你来之前数千年悠悠岁月已逝,未来数千年在静默中等候的壮志——全看你是否能够成功地做此臆测——你将永远没有从事学术工作的召唤,你们应该去作别的事情,因为凡是不能让人怀着热情去从事的事,就人作为人来说,都是不值得的。[28]07 结语
本文讨论的问题聚焦于研究型大学本科教育中的人才培养。在北京大学的案例凸显了通识教育与专业教育的关系。随着素质教育、通识教育、博雅教育的话语不断变更,在专业人才、复合型人才、跨学科人才的不同定位中,通识教育与专业教育出现形式上冲突、实质上割裂的状态:在有限的学分与学习时间之内,两者之间有竞争关系,如果通识教育仅仅体现为“广泛涉猎”,略知皮毛,实际上更有可能“博而不通”,专业教育也将“专而不精”。
这需要我们重新认识通识教育与专业教育的关系。通识教育与专业教育并非割裂,通识教育既不是专业教育的基础或土壤,也不是专业教育的结果。通识教育与专业教育之间是彼此融合、共同成就的一个过程。怀特海指出:“在学习中,不存在一种课程仅仅传授普通文化修养知识,而另一种课程仅仅传授专业知识。为普通文化修养教育而设置的科目,都是需要专门学习的特殊课程;另一方面,鼓励一般心智活动的方式之一,就是培养一种专门的爱好。不能把这种浑然一体的学习过程进行分割。”[29]
通识的核心观念是“文化”:即“以文化人”,是知识对人性的培植,它常是深度学习与专业学习的馈赠。我们在人才选拔中所强调的“浓厚的学科兴趣”,在学科文化结构与个人心智结构之间“亲和的默契感”正是专业学习的馈赠:那些“眼睛发亮”的学生们,他们不仅在知识的精确阶段上求精,更突出的是在“综合运用”阶段,他们获得了掌握原理之后的自由感,他们可以不再拘泥于知识的细节,而是获得规律运用中的力量感、风格体验后的美感。通过高强度的学习,不仅由“专”走向了“精”,进而将学科知识化为人性的塑造与人格的养成。本科教育的核心是人的教育,塑造新人是其最核心的使命,教育的任务不仅是认识外在世界,参与或建设外部世界,更重要的是在我们身上建设一个新的教育世界,即不断提升人性,培植道德人格。
教学与育人不是割裂的,而是一体的,它要求所学的知识一定要能回返铸造人的智力与心灵:它要和人的感知、情感、欲望、希望,以及调节思想的精神活动联系在一起。只有让人既能浸入其中又能回返于人的知识,才是有意义的知识;否则,仅是外在的信息,一个人拥有再多的信息,再见多识广,对他的智力生活、对他的内在精神世界也是无用且无趣的。
通识教育是一种融入专业学习中的能力教育,如何获得知识背后的能力——激发求知欲、提升判断力,对复杂环境的控制力以及运用理论知识对特殊事例做出的预见与判断。[30]这是通识教育的内涵,如何引导学生真实地学习,将外在的知识化作自己的经验,将躺着的知识化为认识的力量,大学教育的目的正在于此。它是深度学习所获得的判断、见识与审美,它建立在学科基础上,是对学科风格的感知与欣赏, “风格帮助人直击目标,富有远见,提升力量,而不陷入细枝末节之中,不被不想干的事物所打扰;风格是专家所独享的特权,风格是专业化学习的产物,是专业化对文化的特殊贡献”[31]掌握了风格即掌握了学科的精髓。通识教育不仅体现在审美层面,还在智慧与信仰层面,智慧来自于知识运用所获得的自由感,责任感来自于知识所赋予个人的力量感,敬畏感来自于感受到的传统——让个体和超越自我的东西融合,对价值的认同会给生命增添难以置信的力量。如此,才能从“眼睛发亮”提升为“灵魂有光”:所学懂的知识让他感受到发现世界的喜悦,所学的东西在帮助他理解生命中所遭遇、所筹划的一切“发生”,这个学习的过程既安静又激动人心,既困顿又壮丽。学习的过程必须是专注且深入的,兴趣必须在此时此刻被激发,能力必须在此时此刻训练,人格在此时此刻被涵养。教育需要细节,需要艰苦的训练,这是一种需要在细节的掌握上耐心又耐心的过程,是沉浸于时间之流中自然而缓慢的过程,学习无捷径。
然而,在大众高等教育的背景下,在学习者自由选择的消费逻辑下,“艰苦的训练”与“刻苦地努力”易被回避,主导选择的与其说是“兴趣”,毋宁说是极易与兴趣混淆的“有趣”或“诱惑”。“有趣”与“诱惑”正是杜威所批评的“用快乐去行贿”,在这样的诱惑中,学生的注意力不能持久地集中,意志力不会得到培养。“提供多样化的选择”要区分于“令人眼花缭乱的诱惑物”,如果这投向外部世界的形形色色的兴趣不能再回转过来,再形成人格的统一性,从而具有“教学的教育性价值”,就会出现赫尔巴特所担心的状态:“我们是否会跌入轻浮的境界呢?轻浮者每时每刻都是另外一种人,至少他每时每刻都染上了别的色彩,因为他本来就根本不是固定的。他热衷于表面印象与幻想,从不把握自己,也从不把握他感兴趣的对象。”[32]因此,他需要严格的教育:他需要专心致志的活动,他应当明晰地把握每一件事,全心全意地献身于每一件事,不应当把各种各样杂乱的痕迹刻画在他的心灵上;他还需要审思,审思将一种专心活动与另一种专心活动汇合起来!人格的形成正依赖于专心,依赖于审思,依赖于积累。[33]学生主动的学习、自由的选择都不能替代教育。他既需要明确的培养计划、稳定的学院文化,以及教师的权威引导。
在这出教育改革的大戏中,演员是学生们,故事的主要情节是基于学生成长的自由选择,情节的关键却是制度的选拔,而这出剧所讨论的主题则是大众高等教育中精英究竟如何培养。导演却是两股既无形又无处不在的力量:教育的逻辑与理性化的逻辑——两者之间的对峙、交锋、抗争、妥协,主导着故事的起承转合。舞台已不再局限于象牙塔内,而是置身于社会的中心,高等教育已深度卷入、嵌套于社会的多重逻辑之中,它已经成为国家发展、全球竞争的核心机制。
另一方面,理性化还表现为消费主义重构了校园教与学的日常活动,这体现为学生的“自由选择”:无论是专业选择的冷与热,还是课程的性价比,绩点评分的理性经营。更进一步,在以“学生为中心”的自由选择下,师生关系被扭曲为“奏技者与看客”、课程贩卖者与用脚投票的消费者之间关系,教育的权威性被解构了。消费主义还体现为充分尊重一知半解的好奇心,用体验替代探索,用成功遮蔽成长,用“即兴”的片段组合消解时间的严肃性与心智的专注性。
教育的逻辑在顽强地抵御着,它体现为对学生兴趣与志向辨析的细心、“广泛涉猎”与“学有专攻”间平衡的小心,“由专业达通识”背后化育的耐心,以及对继承人锻造培养的精心中。当然,它直观地显现于学习者对知识的沉潜与入迷,它体现为舍弃与获得、选择与拣选、服从与引导的成长中,个体接续于传统后所获得的自主性以及谦卑地服从中所传递出的伟大力量中。
教育的逻辑还表现为教育者理智的清明与务实的谨慎,这是一所承载着伟大传统的学校。我们希望这艘巨轮能凭智慧与勇气走出一条新路。近一个世纪前,鲁迅先生在纪念北大建校27年时,写过这样的话:
北大是常为新的,改革的运动的先锋,要使中国向着好的,往上的道路走。[35]
本文原载《北京大学教育评论》2017年第4期。
饶毅:生物专业适合普通家庭、智力一般的学生
作为生物学教师,特别是需要注意招生工作和学生毕业出路的老师,十几年来,我一直关注生物学学生的生源和就业情况。
高考后,很多人希望知道学习什么专业意味着什么,而各种跨界的意见谬误很多。
生物学适合于普通家庭、智力一般的学生选为本科学位,毕业之后可以有多种选择、而且适合一般家庭出身的智力中等的人。
生物的职业前景跨度较大:做的好,可以有高尚的追求成为造福人类、取悦自己的伟大科学家;做的一般,可以成为生物技术产业的普通从业人员。
1)科学智力特高,可以做纯数学家或理论物理的学生不宜学生物。
生物很多需要实验,而生物应用的数学也是简单而又简单,不适合这批学生,因为他们不会有特长而被实验所烦恼和耽误。当然,这是指很少一批人,不是任何中学的数学尖子都能算作这批人的行列。需要与北京大学的数学系的学生比较,如果进不了每年全国数学前100名,恐怕就不要认为自己可以做纯数学家。也就是说全国大多数高中数学第一名并不能保证可以成为纯数学家。当然可以用数学里面最简单,简单到一部分纯数学家认为不是数学的统计,统计是很多认为自己可以做数学家,但后来发现不可能而可以用于很多职业的一门技能。也许,统计是全部科学中有着最广泛职业应用的学科。
生物只在很少的时候和学科发展节点出现过非常聪明的人起关键作用的情况。如1886年的孟德尔、1953年的克里克。其他时候,不是不需要一定智力,但作用较小。
成为数学家,在中国还必需在少数几个高校念本科,否则也就可能荒废。
成为生物学家,在中国很多大学念本科都可能。特别是,中国有些农业大学也是优秀科学家的摇篮,这一点很多人想不到。农业大学的遗传分析,教的比很多生命科学学院和几乎全部医学院都更好,这种农业大学培养的本科生就更好。例如,中国农业大学本科毕业成为真正科学家的可能性大于协和医学院(强调:真正科学家)。
我和施一公改变了北大清华的生命科学教学,一方面是真正懂科学的老师大大增加,一方面我们强调教学改革,从以前的背书填鸭教学,到需要思考。但是,我们教学改革的成效,还需要时间、需要历史证明是否有效:北大清华的生命科学本科生是否就确实因为我们的教学而不同于其他学校。
2)家庭社会经济状况不够好(指大学期间和大学毕业后马上需要接济家庭经济的学生),学生物会有困难。
3)家庭社会经济状况特别好的学生,是否学生物,取决于个人爱好。但生物不能带来家庭的简单预计,不会很容易出人头地,也不会很容易升官发财。如果家庭社会经济状况特别好的家庭父母开明,后代有自由选择。如果家长有不良预期,就不会很舒服。
4)对于智力一般、家庭经济状况一般(不需要在大学期间和大学毕业后几年内接济家庭经济)的高中毕业生,学生物不用特别智力、不靠后台,主要是自己一辈子靠自己努力。
5)学生物在本科生后每一个阶段的预期很稳定,也不费钱,还长期有一般的经济保障。从研究生开始,一般就不用家庭负担。
6)本科生物内容有,而且不学不会,学了就有专业基础。不像有些专业,学了与没学对以后的职业没有太大差别。
本科生物的核心是遗传学、生物化学、分子生物学、细胞生物学。这些课程需要一定的大学化学基础。而数学和物理基本是高中程度的复习(当然可以以大学版本出现)。
如果学习不够好,可以反反复复多学这四门课,反反复复读四本教科书,也能胜任技术员工作。
当然,如果学的更多、懂得更多,基础更好、前沿更好,前途更好。
7)如果生物学本科毕业后出国读研究生,不仅比其他专业都容易,而且不需要家庭负担,全部学费可以由外国学校或院系、实验室支付,还有足够自己和配偶生活的助研费。
8)如果留在国内读研,现在也比较容易。生物学大量缺乏优秀研究生来源。以前出国的很多,现在即使出现转折,从北大清华开始都有相当一些留在国内读研究生,整体研究生需求还是很大。
全国前二十的大学,其生命科学学院一般每年一百多本科毕业生(少数有两百多的)。而北大和清华每年招收生物学的研究生就有600以上。北大清华本身是生物的研究生远多于本科生。
可想而知,科学院很多研究所都难以获得足够数量的优质生源。例如,某年,有些非常出色的研究所,招收大量的来自烟台大学的本科生读研。这不是特例,而是中国大量需要生物学研究生的现状所造成。
北京大学每年需要生物学的研究生:
生命科学学院几十(以前称为所谓老体制,实际现在也是新体制了)
交叉学院下的:生命科学联合中心(CLS)近百、PTN(北大清华北生所)几十、与北京脑科学中心联合接近二十、定量生物学中心十几
心理与认知科学学院的部分研究生也可以是生物背景的
化学学院的化学生物学方向的研究生部分是生物学背景的
未来技术学院和分子医学研究生也有几十
昌平实验室在北大交叉学院每年也招生,实际也是生命科学方向
北大清华之外,西湖大学、上海和南方科技大学等新型研究型大学,北京生命科学研究所、北京脑科学中心、首都医学科学创新中心,国家实验室有三个是生命科学的(北京昌平实验室、上海临港实验室、广州呼吸病实验室),其中北京昌平的迄今无疑领先。深圳医学科学院、深圳湾实验室。中国科学院在北京、上海、昆明等地的十几个研究所。各个大学的生科院。
9)生物研究生不仅来源于综合大学生命科学学院,也来自医学院的基础医学部、农业大学的一些专业。我国农业大学的遗传经常教的优于生科院和医学院,经典遗传分析大有用途,比基因测序有用的多,可以从考分较低的农学院入本科之后研究生到比较好的大学和科研机构读研究生。
农业大学是我国特色的院校,如果选对专业,学到扎实有用的内容,可以对以后的科学生涯很有益处。
北大的博士生如果在国内就业,很多地方对于吸引北大博士有优惠。
10)生物学博士毕业后,一般需要做一段时间的博士后。在国外和中国现在都是实验室资助。中国以前博士后数量不多、工资很低,现在很多单位都改观了。目前,国内博士后一般年薪至少二十几万,有些到40-50万的单位和实验室(也与年资和优秀程度有关)。因为一些单位博士后完全由导师决定,所以名额不是问题,而收入差别可以较大。
北京市对博士后有非常优惠的政策。他们在校期间享受教授的子女入学附小附中政策,结束后可以落地北京户口。
外地也有吸引北京博士后的优惠。
11)生物的博士后做完,可以申请国外、国内大学和研究机构的助理教授或研究员。中国的生物学教职很多,各个大学每年都在招收。现在至少有几十个单位的年薪和研究启动经费都比较好。比较这些单位的时候,目前真是要比较前景,而不是比较眼前给的经费(大多数人经常犯这种只看眼前的钱的错误,而且劝不动,后来发现自己吃了近视的眼前亏)。可以说,有些单位在年薪上都可以与美国相比了,甚至更高。当然,一般人会不相信,但事实就是这样。
现在中国也出现了一个正常的健康现象:科学特别好的单位,年薪要低一些,而希望加强科学质量的单位、在有条件的情况下愿意提供更高条件。这一点,哈佛早就是这样,但中国是近年才出现。十年前,中国科学质量好的单位也是年薪最高的单位,现在不一定了,而出现负相关是对的。单位的质量就是整体条件的一部分,单位质量还需要提高的只好用其他条件来弥补。
12)不做博士后、甚至不读研究生的本科毕业生,也可以加入生物技术产业。
中国真正是生物技术产业第一次小起飞就是这近7、8年。以前很多是编的故事。只有在中国药监局改革后、加上其他几个原因,中国的生物技术产业才第一次小起飞。到前几年非常热。但去年下半年开始进入冬季、现在是寒冬。
热门的地区特别是苏州。可以说,苏州做得好的人,当时北京、上海很多企业想去苏州挖人。
热门的时候,投资过多,重复太多,原创太少。但员工福利曾经猛增,有些企业可能过多福利。甚至有些背景很一般而且很年轻的从业人员,当时也出现尾巴翘上天的怪现象,当然并非多数。有些国外企业管理经验的人,担任国内企业高管后也出现收入可以进入华尔街前几名的现象。
冬天后,过度的、不合理的逐渐被挤泡沫,是良性的循环。没有危机周期的行业是不健康的行业,有热就应该有冷。
国际上生物技术产业周期性规律预示着中国的生物技术产业过几年会再度出现高潮,第二次高潮。以后可能与国际一样,每过几年一次循环。循环冲击创业人员大于冲击从业人员。
北大清华都有一些本科、研究生毕业的生物学生创业,有些看上去很不错。
与所有其他产业一样,创业不容易,各种各样的问题,最后成功的很少。但从业却不难,做一般员工容易。
中国生物技术产业类似信息产业的领先企业还没有确定,但猜想不会超过十几二十年就应该基本确定、至少出现或清楚。
咒骂生物专业的北大清华学生基本没有了,当然外地还有很多学生认为生物是坑,不过那是落后的表现。
有些行业已经饱和、甚至正在过气,但学生和家长趋之若鹜,说明井底观天的人有时是多数人。
也许,多数时候多数人都是井底观天而自以为是?
作者系北京大学生物学教授