破解估值黑箱：他们提出ERA框架，让大模型读懂专利价值

2026-05-25 17:01

浙江

“科研”

ZJUSOM

在知识经济快速发展的今天，专利既是技术创新的重要载体，也是市场竞争的关键筹码。无论是研发布局、投资决策，还是技术交易转化，都离不开对专利价值的合理判断。然而，专利价值评估如何兼顾实时性、可解释性、准确性与自动化，一直是困扰学术界和产业界的“最后一公里”落地难题。传统方法要么依赖滞后的引用数据，要么依赖主观的人工判断，难以穿透专利“技术—法律”双重黑箱，更无法满足当下创新决策对时效性与透明度的需求。

图片来源：©千库网

针对这一难题，浙江大学管理学院副教授刘景江与合作者，在信息科学与计算机科学领域高水平期刊Information Processing and Management发表论文“ERA: Aligning semantic models with revealed economic preference for real-time and explainable patent valuation”。他们构建多模态数据、开展人工智能技术实验，创新性地提出了“经济推理对齐理论与架构”(ERA，Economic-Reasoning Alignment)，并验证了其在复杂决策场景下的有效性。这项研究不仅验证了AI在垂直专业领域深度适配的可行性，也为专利资产价值的数字化、智能化评估提供了高效的全新决策支持系统。

论文发表截图（点击文末左下角“阅读原文”可查看该论文）

本期【科研】专题，我们一起走进这项研究，看看他们如何让大模型学会“经济推理”，从而破解专利估值难题。

学者简介

刘景江，浙江大学管理学院副教授。主要研究方向：技术创新与创业管理、战略科技人力资源管理、人工智能技术在管理研究与产业创新中的应用（机器学习、人-机-场景交互智能、群智适配创新）。

*澳大利亚麦考瑞大学Yongmin Yoo、澳大利亚悉尼科技大学Seungwoo Kim同为论文作者。

专利估值为何“难”？

专利作为典型的无形资产，其价值评估的难度远超有形资产。长期以来，学术界与产业界都在探索可靠的估值方法，但始终面临两大核心瓶颈。

一是信息不对称与技术文本的“黑箱”特性。专利文本是高度专业化的“技术—法律”混合文本，充斥着专业术语与法律表述。外部评估者、投资者甚至企业管理者，都难以快速理解一项专利的核心技术价值与市场潜力。这种信息壁垒直接导致技术市场交易效率低下：高价值专利容易被埋没，低价值专利却可能占用大量资源，形成“劣币驱逐良币”的现象。

图片来源：©千库网

二是传统指标严重滞后，无法支撑实时决策。现有专利价值评估高度依赖引用数据、专利家族规模等文献计量指标。然而，这些指标存在明显的时间滞后性——一项专利往往需要数年才能积累足够的引用数据，这种“向后看”的特性使之无法在专利申请、布局、投资决策等关键节点提供实时判断。同时，传统方法多为“黑箱模型”，只能给出估值结果，却无法解释“为何这项专利有价值”，缺乏决策可信度。

简单来说，传统专利估值要么滞后，跟不上创新节奏；要么不透明，无法让人信服。面对全球科技竞争白热化、知识产权布局日趋激烈的新形势，构建一套实时、精准、可解释、可规模化的全新估值体系，有助于打通专利技术文本与市场价值之间的壁垒。

他们提出并验证ERA框架，用大模型赋能专利估值

面对这一难题，研究团队跳出传统思路，首次将经济显示偏好理论与大语言模型语义推理深度融合，提出ERA框架——通过指令微调实现经济推理对齐，让大模型真正“读懂”专利技术内涵，同时“看懂”市场真实价值信号，完成从“文本理解”到“价值推理”的跨越。

图片来源：论文原文

具体而言，团队创新性地用专利续费行为代表“显示性经济偏好”：专利权人每年需要支付逐年递增的专利维持费用，本质是用真金白银为专利价值“投票”，直接反映了专利的价值与市场认可度。与滞后、易受操纵的引用数据相比，专利续费行为是实时、客观、无噪音的价值信号，能够有效解决传统估值缺乏可靠监督信号的痛点。

进一步地，ERA框架构建了一套完整的“经济语义对齐”机制，分为三大核心环节，实现大模型从通用语言能力到专利估值专业能力的精准适配：

第一步是经济思维链（Economic Chain-of-Thought）逆向构建。研究团队设计了四步专利价值推理范式，让模型按照技术识别—市场应用分析—法律保护范围解读—价值综合评估的逻辑展开推理，模拟知识产权专家的专业评估思路，避免大模型“幻觉”与主观偏差。同时，利用大模型作为“教师模型”，基于1万件欧洲专利局真实续费数据，逆向生成高质量经济推理样本，构建专业的专利估值推理数据集。为保证实验的科学性，团队还设计了“领域—价值”交叉分层抽样协议，确保技术领域与价值等级的平衡分布，有效消除了传统抽样中常见的偏差。

图片来源：©千库网

第二步是参数高效指令微调。团队采用低秩适配（LoRA）技术，仅微调不到0.1%的大模型参数，在保留模型通用语言能力的同时，快速注入专利估值领域的经济逻辑与专业知识，实现轻量化、低成本的领域适配，让普通硬件也能支撑高效推理。

第三步是可解释估值生成。与传统“黑箱”模型不同，ERA框架不仅输出专利价值等级（高/中/低），还同步生成完整的经济推理依据，清晰说明“这项专利技术优势是什么、市场潜力有多大、法律保护有多强、为何值这个价”，实现估值过程全透明、可追溯、可验证。

简单来说，ERA框架就像一位永不疲倦、精准客观的知识产权资深分析师，既能快速吃透专利的技术与法律细节，又能锚定市场真实价值信号，给出实时、可信、带完整推理过程的估值结果，解决传统方法的滞后性、主观性与不透明性。

研究意义：ERA的三重价值

在这项研究中，刘景江团队首次提出了“经济推理对齐”理论与架构（ERA），并验证了其在专利价值评估这一复杂决策场景中的有效性，为专利资产的实时、可解释、准确、自动化评估建立了新范式。

在理论层面，这项研究提出了全新的“经济语义对齐范式”，架起了经济现实与人工智能语义推理之间的桥梁。其一，研究引入了“显性经济偏好”（即专利续费行为）作为人工智能领域自适应的全新监督基准。其二，研究定义了“经济思维链”机制，超越了传统的“输入—输出”黑箱模型，将生成式人工智能的应用从简单的文本摘要扩展到经济语境下的生成式推理。其三，研究为企业实现AI驱动的场景适配创新提供了可计算的理论路径。

图片来源：©千库网

在方法层面，研究团队开发了一套严谨且可复用的技术方案。首先，设计了基于固定配额的“领域—价值”交叉分层随机抽样协议，确保技术领域与价值等级之间的平衡分布，有效消除了传统抽样中常见的偏差，使数据集天然适配少样本学习评测。特别是，将单元格配额设为5或10的倍数以确保8:1:1划分呈精确整数，消除梯度优化中的“舍入偏差”，保障训练数值稳定，同时直接契合大模型前沿的N-shot评测协议，使数据集能跨架构公平评估各量级模型在极低资源下的泛化能力与语义捕捉精度。其次，提出了参数高效微调与领域特定指令协同优化的混合训练策略，既避免了过拟合，又大幅降低了计算成本。再者，通过消融实验等结构化设计，实证证明了“经济思维链”是模型性能提升的因果驱动因素，而非表面特征记忆。最后，研究验证了该方法在不同技术领域（跨IPC分类）的强大泛化能力，能有效应对小众技术领域的数据稀缺问题。

在实践层面，ERA框架为研发策略制定者、专利律师和风险投资者提供了一个可直接应用的决策支持系统。一方面，它实现了真正的实时评估——专利公开即可估值，无需等待数年积累引文数据，帮助企业快速识别高价值专利与低效资产，优化研发资源配置。另一方面，ERA生成的显式推理链为人类专家提供了“认知支架”，形成了“AI提案+专家验证”的高信任协作模式：AI负责高吞吐量筛选并输出透明推理，专家只需快速审查逻辑合理性，无需从头阅读冗长晦涩的原始文本。这种模式将AI的计算能力与人类的战略直觉相结合，最大限度地降低了深度学习黑箱带来的决策风险。

图片来源：©千库网

专利价值的精准度量，是激活创新活力、优化资源配置、推动科技进步的关键一环。从百年前的传统评估方法，到如今的大模型智能估值，专利估值领域的每一次进步，都在降低创新的不确定性，让真正有价值的技术被发现、被保护、被转化。

刘景江团队的研究，不仅彰显了浙大管院在创新管理、数字经济与AI交叉研究领域的深耕，更为全球知识产权估值研究提供了“中国方案”。这项研究是在管理学院在人机协同及数智管理研究领域的又一标志性成果。未来，学院将继续以“学科交叉BEST战略”为牵引，推动更多扎根真实场景、服务产业创新的交叉研究走向纵深，让知识创造真正转化为经济价值与社会财富。

附：论文摘要

This study proposes the Economic Reasoning Alignment via Instruction Tuning (ERA) framework, which aligns the semantic reasoning of Large Language Models (LLMs) with revealed economic preferences to establish a new paradigm for real-time and interpretable patent valuation. We theoretically conceptualize patent renewal history as a revealed economic preference and leverage it as an objective supervisory signal to align the generative reasoning of LLMs with market realities, a process we term Eco-Semantic Alignment. Our empirical analysis of 10,000 randomly sampled European Patent Office patents across diverse domains confirms the efficacy of this approach. The ERA framework achieves superior performance across all evaluated metrics compared to the baseline models. Specifically, it surpasses the traditional Random Forest model based on TF-IDF features by 36.3% in accuracy, 33.1% in Macro-F1, and 88.1% in the Matthews Correlation Coefficient (MCC). Against the discriminative pre-trained language model Longformer, ERA exhibits gains of 11.5% in accuracy, 8.7% in Macro-F1, and 27.4% in MCC. It also exceeds the zero-shot performance of the generative LLM GPT-5-mini by 9.6% in accuracy, 8.3% in Macro-F1, and 21.5% in MCC. The ablation study confirms the criticality of the Rationale Generation module (Economic Chain-of-Thought), whose removal led to the largest performance decline, with a 6.4% relative drop in Macro-F1. Moreover, ERA demonstrates robust applicability across heterogeneous patent landscapes.

编辑 | 伍梁永

初审 | 佟庆

二审 | 刘景江

三审 | 陈超

终审 | 王恩禹

原标题：《破解估值黑箱：他们提出ERA框架，让大模型读懂专利价值》

阅读原文

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。