从“过度模型化”到“过度演绎”:AI时代,如何做实证研究

顾洁
2026-05-26 17:59

当中国哲学社会科学致力于构建自主知识体系、回答时代之问时,最为关键的或许正是研究者是否始终保持着对真实世界的关切与敬畏。

习近平总书记指出,要“加快构建中国哲学社会科学自主知识体系”,“更好回答中国之问、世界之问、人民之问、时代之问”。这一重要论述旨在推动哲学社会科学研究扎根中国实践、回应时代关切,产出真正具有解释力和指导意义的知识成果。

然而,过去二十年间,中国实证社会科学研究在走向规范化、技术化的同时,工具与问题的关系亦经历着深刻变迁。技术工具似乎逐渐从“助手”演变为“主导者”,研究的方法日臻精密,结论却与真实问题渐行渐远。

这一趋势在2026年的经济学界引发了一场少见的学术期刊内部对话,而生成式人工智能的全面介入,则使问题呈现出了新的形态。

经济学研究的自省:从“过度模型化”到“回归问题”

2026年初,《中国社会科学》刊发了陆铭教授的论文《经济学研究“过度模型化”的误区及其纠正》。文章指出了当前实证研究中存在的两种典型倾向:其一,模型构建过程未能充分纳入现实情境,“为了让模型成立而忽略现实”,导致对现实问题的误导性结论;其二,对方法复杂性和精确性的过度追求,“为了让方法成立而牺牲问题”,使研究对现实问题的关注呈现内在不完整性。陆铭教授指出,在大量以双重差分法为主流的实证研究中,研究者过度强调识别策略的“干净性”和结果的统计显著性,却在筛选数据、调整模型的过程中逐渐丧失了问题意识。其结果是,面对诸多重大现实问题,经济学研究反而难以提供有深度的事实描述和有效的政策建言。

针对这一问题,《中国社会科学报》刊发了评论员文章《中国经济学研究不应“过度模型化”》,进一步概括了这一现象的多种表现:研究缺乏理论和问题意识,模型变量缺乏经济意义;方法论上唯模型是从,对不可测度、不可计量的重大问题视而不见;用复杂模型包装苍白结论,在理论与实证上均无实质贡献。

学者江艇在《中国社会科学》第4期的回应文章中进一步指出,既有批评所揭示的偏差存在与偏差成因是两个不同层面的问题,前者是现象描述,后者才触及问题根源。实证研究的深层症结,在于研究者的注意力被计量模型所承载的“功能过载”所占据。在发表压力与学术评价体系的共同作用下,工具本身获得了超越研究问题的主导地位。江艇强调,应当将识别策略的合理性置于模型复杂性之上,而非相反。

生成式AI与“过度演绎”的新风险

如果说“过度模型化”的风险主要发生在方法层面,那么生成式人工智能带来的新风险,则更多发生在文本层面。

2025年前后,以AI4SS(AI for Social Sciences)为代表的研究范式转型,正以前所未有的速度改变着社会科学的知识生产方式。有学者将这一转型视为人文社会科学研究的“第五范式”,其特征是人工智能全学科、全过程赋能研究活动,并在选题、文献梳理、假设生成与验证等各个环节发挥作用。

一项发表于《科学》杂志的研究显示,AI写作工具的广泛使用使科研人员论文发表数量最多增加了50%,但由此激增的文章在文字流畅度与科学价值之间存在明显脱节。在全球20个国家的学术调查中,生成式AI工具在社会科学领域的认知度最高,而其主要用途集中在学术写作辅助,而非数据分析或批判性思维的支撑。

然而,当社会科学论文的写作工作可以被AI高效完成时,研究的外在品质与内在实质之间的张力便急剧放大。笔者自2025年以来参加多场学术会议的直观感受是,学术生态中正在出现一种从“过度模型化”向“过度演绎”的演变。研究在生成式AI的辅助下,标题、引言与结论被塑造得富有冲击力与思辨性,而研究设计和实证分析环节却无法有效支撑这些有价值的命题。一方面,AI工具能够帮助研究者提炼出高度凝练、颇具修辞吸引力的标题和引言,其中不乏巧妙的隐喻和宏大的理论关涉。另一方面,进入实证部分后,研究方法、数据支撑与核心命题之间往往存在明显的裂隙。变量选取的随意性,识别策略与机制检验的力度不足,或样本数据无法有效回应引言中提出的深层问题。而在结论与讨论部分,借助AI的语义生成能力,论文的结论性论述往往再次攀升至相当的理论高度,形成一种表面自洽、实则脆弱的论述闭环。

问题不在于AI工具本身“制造”了虚假研究,而在于它正在以高度的文本说服力替代严谨的经验论证。

“过度模型化”vs.“过度演绎”

“过度模型化”和“过度演绎”看似不同,一个偏方法,一个偏文本;一个发生在计量模型里,一个发生在AI辅助写作中,但它们指向的是同一个问题,即研究问题本身被持续弱化。

“过度模型化”类的研究,研究者需要耗费大量时间处理数据、调试模型、应对规范性的技术审稿意见。其危机在于,研究者容易在此过程中迷失问题意识,使论文沦为“方法驱动的文本”。而“过度演绎”类的研究,因生成式AI的高度介入,研究问题和研究动机的表达不再围绕真实世界的问题和理论。当AI可以瞬间生成研究问题,文献综述能够自动完成研究空白的定位,文本容易在形式上完成自洽,却丢失了研究应有的严谨与真实。研究者当然希望论文更规范、更好看、更容易发表,但社会科学研究如果只剩下规范和好看,离真实世界就会越来越远。

何以纠偏:回归问题导向

纠偏的第一步,是回归调查研究的经验基础。社会科学研究的起点,应当是研究者对现实世界的直接感知。实地调查、深度访谈、案例研究等方法能够捕捉制度运行的微观机制和行动者的真实逻辑,这些是计量模型和AI工具难以替代的。研究者的困惑与问题意识,不能仅从文献缝隙或数据可得性中产生,更应源于对具体社会过程的观察与理解。在学术训练中,应当鼓励研究者走入真实场景,从经验出发凝练问题,而非从方法出发寻找问题。

第二步,确立“问题优先”的研究逻辑。江艇所倡导的“问题-识别-模型”路径,将“提出一个真正值得回答的问题”置于起点,识别策略服务于问题,模型服务于识别。顺序的重置意味着问题意识重新获得了方法论上的优先地位。陆铭也指出,对于具有重大理论和政策含义的研究,需要在问题的重要性与模型的精确性之间有所权衡。

第三步,纠偏评价体系中的双重偏向。过度模型化表现为对识别策略的苛刻要求和对统计显著性的迷信,而AI时代过度演绎的风险在于,研究者容易被精致的标题、流畅的引言和拔高的结论所吸引,忽略了实证分析能否真正支撑论述。学术期刊与评审体系应形成共识:反对简单问题复杂化,同时警惕以修辞替代论证的倾向。

第四步,规范AI工具的合理使用。生成式AI在数据处理和语言润色方面具有显著效率优势,但研究者需要清晰区分“属于自己的学术判断”与“AI辅助的文本生成”,防止后者反向塑造前者。研究动机的提出应基于研究者对现实的观察与思考,而非由AI生成若干研究空白供挑选;结论的升华应有实证分析的坚实基础,而非借助AI的语义生成能力进行脱离证据的拔高。在人机协作的知识生产模式中,研究者的主体性与判断力仍然是不可取代的核心要素。

(本文作者顾洁系上海社会科学院副研究员、社会科学智能实验室秘书长、产业创新数据实验室主任。)

    责任编辑:吕娜
    图片编辑:李晶昀
    校对:姚易琪