原创 洪治纲 陈艺明 上海市法学会 东方法学


强人工智能(Artificial General Intelligence,AGI)是指基于强大学习能力,具备“目标自主性+行动自主性”能力,可以自动完成预设目标,可以与外部环境交互并自我进化的人工智能。强人工智能可以理解、学习、适应和实现绝大部分的人类智能活动,并且具有自我意识。自以ChatGPT为代表的强人工智能技术出现与应用之后,人类事实上已经进入强人工智能时代,强人工智能技术对社会各行各业以及人们的生产生活的影响将是十分深远与巨大的。也正是如此,目前许多国家都将人工智能提升为国家发展战略,我国亦是如此。
从已有实践及未来发展来看,强人工智能对社会发展的影响,会突出表现在行业转型、治理转型和制度转型这些重要的方面,这其中当然就包括对税务领域的深刻影响。就治理转型来看,在强人工智能时代下,传统管理将会向现代治理转型,也就是社会的治理与监管必然要同人工智能全面相结合,并且深度使用人工智能技术来解决社会治理与管理的问题。就制度转型来看,强人工智能将会促使管理制度朝着适应人工智能技术运用需求的方向发展,并且同时要重视对人工智能技术本身的限制与规范。具体到税务领域而言,例如,我们如何让税收征管适应新技术的发展以更有效率、更精准、更公平公正?在强人工智能应用于税务领域不可避免的情况下,又该如何使新技术能够在保证符合征管目标任务的前提下去使用?这些都是税务领域在面对强人工智能时代时所必须要认真考虑和重视的问题。
二、“互联网+”与人工智能时代背景下税收征管面临的主要问题
2021年3月,中共中央办公厅、国务院办公厅印发《关于进一步深化税收征管改革的意见》。该意见指出,本次税收征管改革的主要目标是提高税务执法规范性、税费服务便捷性和税务监管精准性,实现精确执法、精细服务、精准监管,全面推进税收征管数字化升级和智能化改造。改革也从侧面反映了“互联网+”、大数据和人工智能时代背景下,我国税收征管在执法、服务、监管等领域存在着不少需要改进的问题。
(一)
税收执法需要完成从经验式执法向科学精确执法转变
《关于进一步深化税收征管改革的意见》指出要实现从经验式执法向科学精确执法转变。而要实现税收科学精确的执法,不仅仅要提高税收立法的清晰性和准确性,而且要着重提高税务人员的专业性以及税收征管技术手段的科学性与精准性。
然而,我国税收征管领域目前仍存在不少“经验性执法”现象并且因此导致了执法结果的不确定性。这一方面固然是税收征管立法不够科学精确造成的,但更主要的原因应当还是在于税务人员的专业性与征管技术手段的科学精准性不足。而这显然不能适应强人工智能时代的需求,因为纳税人在不断地更新运用智能化技术。而且,摆脱传统税收治理过程的不确定性和经验性亦是税收征管体制改革的核心领域。所以,解决这一困境的出路,在很大程度上要依赖于在税收征管中主动应用强人工智能技术。正如有学者指出的那样,税收征管的过程本是理性与非理性交织、合法与非法斡旋的过程,而人工智能的存在无疑将会让这个过程画上句号,创造出算法思维下的税法领域的近乎“唯一正确答案”。
(二)
税收服务的精细化不足
我国税收征管正在经历由“对纳税人管理”向“为纳税人服务”转型,实践中税收服务仍存在个性化、精细化、智能化不足现象。从数量上看,现有的纳税服务资源数量无法满足日益增长的纳税人需求。根据国家相关部门的统计,截至2023年9月底,全国登记在册经营主体达1.81亿户,但截至2022年底,全国已取得税务师职业资格的人数仅为29.8万余人。假设全部税务师均为登记在册经营主体提供涉税服务,平均每人服务约600户经营主体。在质量供给上,随着经济社会发展,“跨区域经营、集团经营、线上线下经营、微营销等新的商业模式不断涌现,市场主体涉税业务呈现复杂化、个性化的趋势。”当现行税收征管法规在复杂涉税事项的适用上存在争议时,决定税收服务能力高低的重要因素就是对现行法律的解释能力,而解释能力在根本上主要取决于税务人员的专业性程度以及征管技术手段的科学精准程度。目前不同地域税务人员的专业能力存在差异,并且税务专业人员的培养机制无法跟上经济社会变化节奏,导致税务机关在为纳税人提供个性化、差异化的纳税服务上仍存在短板。
(三)
数字经济中的税收监管精准度明显不足
税收监管的核心是税源监管。税源是国家课税的经济来源,是征税的基础。在传统经济模式下,生产场所较为固定,生产要素的流动受到地域限制,税源的监控相对便利。如今数字经济已经成为国民经济的重要组成部分。根据2023年4月国家网信办发布的《数字中国发展报告(2022年)》中的统计,我国数字经济规模达到50.2万亿元,占GDP比重达41.5%。数字经济背景下,生产场所由线下转为线上,网络交易过程中资金往来、信息交换以及物流运输均可能存在背离的情况,交易的地理位置以及交易发生的时间点较难确定,导致物流与资金流等难以监控与追踪,税源跨境、跨省、跨市甚至跨国的流动性增强,不利于税务机关核查经济信息。同时,数字经济准入门槛降低、经济多元化发展需要以及商事制度改革的深化,加大市场主体的复杂性和多样性。在此背景下,税务机关和纳税人之间信息不对称加剧,这既为纳税人隐蔽税源创造了空间,大大增加了税收监管的难度,也使得税收征管的科学精准度欠缺,从而导致可能的征管不公平、不公正的问题。
综合以上分析,在强人工智能时代条件下,为了实现税收征管的科学性与精确性,也为了给人工智能发展之国家战略的实现提供更好的税法环境,我国税收征管需要主动和积极加大强人工智能技术的运用。
三、强人工智能在税收征管中的优势
(一)
数据处理能力更加强大
随着互联网和物联网的快速发展,数据呈指数级增长,传统方法已无法处理如此大规模的数据集。而强人工智能借助分布式计算和并行处理等手段,能够有效地处理海量数据,并从中提取有价值的信息。强人工智能的算力经过长时间的迭代更新,已经比七十年前发展了近6.7亿倍。数据处理能力的增长决定了数据价值的上限。在税收征管中,税务机关基于过去、现在和未来的征管行为,会产生大量的税务数据。随着政府部门间数据共享机制的建立,税务机关获取税务数据或其他政务数据的渠道更加广泛。在“以数治税”“算法治税”和“智慧税务”的时代,税务机关比以往任何时候都更加需要人工智能技术帮助挖掘海量税务数据的价值,最终将数据价值转化为税收征管与服务价值。
(二)
自主学习能力更加突出
弱人工智能虽然具备数据处理、自主学习和快速改进的能力,但其局限在于无法进行推理和通用性学习。强人工智能在弱人工智能的基础上,还具有完整推理能力,可以掌握学习与推理的方法,减少对人类的依赖,这主要通过迁移学习、小数据推理和强化学习来实现。迁移学习,在一个模型训练任务中,针对某种类型数据获得的关系也可以轻松应用于同一领域的不同问题;小数据推理可以对样本量小且存在不确定性的数据样本进行推理,发现共性并通用到其他场景中;强化学习让人工智能在正常运行中学习,随后利用自己所学的知识完成人类指定的任务,修正自我偏差行为,不断进化。强人工智能的自主学习能力,为税收征管及时应对强人工智能时代背景下的征管任务提供了高效率的技术手段。
(三)
知识运用能力更为强大
强人工智能的数据挖掘能力比任何数据分析工具更加强大。数据挖掘是数据库知识发现中的一个步骤,一般是指从大量的、不完全的、随机数据中提取隐藏但又是潜在有用信息和知识的过程。传统的数据挖掘方法,通常只基于统计分析和推断,对数据的理解和处理存在较大的局限性。而强人工智能,能够通过大规模的数据学习和模式识别,发现隐藏在数据背后的复杂关系和趋势,并且通过深度学习算法的应用,进而从海量数据中挖掘出更加精确和准确的信息,以及“从非充分的原因和结果中推导相关关系,这有助于提高风险分析效率,帮助税务人员作出精准的预测与判断”,从而提高税收风险管理的科学性、精准度与效率性。
(四)
人机协作的性质改变且效率更高
纵观人类发展史,生产力的提高过程,本质上是生产工具的进化过程。传统生产工具的本质是人类四肢活动能力的延伸,人类通过身体操纵生产工具从事生产活动,进而提高生产效率。而强人工智能的本质则是人类脑力的集合,它像人类一样会进行自我学习和逻辑推理,可以和人类进行互动。传统人机协作方式是单向协作,由人给机器下命令,机器负责执行人的意志,机器本身没有分析推理能力。而强人工智能下的人机协作是双向的。一方面,人们通过人机交互界面向人工智能系统输入指令,人工智能系统在接受指令后,会利用自身的算法和模型进行分析并得出结果。另一方面,人工智能系统在学习和分析过程中,可能会发现一些问题或者新的知识,并反馈给人类,从而帮助人们更好地理解问题或提出新的解决方案。可见,强人工智能改变了传统人机协作的单向性并且效率更高,这可以极大地增强税收征管的科学性与精准性。
四、强人工智能在税收征管中的应用现状
(一)
国外相关应用情况
强人工智能技术出现之后,国外不少国家已在积极将这类技术应用于其税收征管的方方面面,这里仅从税源监控和税务案件执行两个方面作简要介绍。
1.税源监控
强人工智能能够帮助税务机关提高反欺诈能力,打击逃避税行为,这在国外得到了相当的应用。例如,美国通过利用大数据分析交叉对比处理技术,借助统一的个税识别号来精准定位身份信息、信用度和纳税记录,并使用管理系统中的“遵从性模型”事前评估分析纳税人税收遵从及信用程度,同时利用各部门信息共享数据及专业公司设计开发的数据挖掘和分析工具,对高净值人群进行税务风险评估并对该类税源精准预警、监控及有效追踪。法国开发出税务欺诈检测算法,通过采用“税务文件模型”,从税务欺诈案例中总结规律,并定义了三大类最有可能实施偷税漏税的群体。该算法实现了高达0.851的平均精度(AUPRC),表明强人工智能检测潜在欺诈具有良好的前景。
2.税务执行智能化
根据巴西国家司法委员会2022年的数据,巴西全国约有7700万起案件正在审理中,其中35%是税务执行案件,这其中又有将近90%的案件处于“拥堵”状态。如果排除上述税务执行案件,巴西司法部门的案件拥堵率将从74.2%降至67.9%。由此可见,税务执行案件成为巴西司法机构真正的瓶颈,其平均处理时长约为6年零11个月。为缓解税务执行拥堵问题,巴西各地的法院致力于开发人工智能系统协助税务执行案件,在税务执行中搜索债务人资产和执行其他机械重复任务。
(二)
国内相关应用情况
我国强人工智能在税收征管的应用上是世界领先的,这与我国是数字经济大国以及人工智能技术大国有关。下面仅择其典型做一简要叙述。
1.税收风险评估
在税收监管中,企业所得税的管理既是难点也是重点。当前企业所得税的管理模式是:企业每个季度自行申报预缴,年底实施汇算清缴。企业每年度向税务系统报送的汇算清缴表近40余张,税务系统除了收到汇算清缴表外,还采集其他各类涉税信息。传统的数据分析手段是:基于业务人员的税收专业知识形成分析指标,将数据按照不同指标和不同维度交叉分析,在此基础上,利用统计方法进行各种比对分析。这种传统的分析方法存在较大的缺陷:一是只能反映数据的局部情况,不能反映数据全貌;二是不能充分利用大数据“大”和“全”的特性,揭示其内在关系和规律;三是分析结果对数据质量波动非常敏感,分析结果利用效果欠佳。
因此,国家税务总局山东省税务局研究出了一种基于机器学习对企业所得税风险评估的方法。该方法首先规划机器学习数据集的属性集合,根据企业所得税的管理特点从属性集中选择机器学习的290个目标集合;其次对数据分类抽取,按照不同属性所在的系统和表单分类并抽取数据,然后将数据按户归集形成机器学习最终的数据集,并选择决策树和支持向量机算法模型进行集成和连接,形成适用于所得税的机器学习算法模型;最后运用该模型运算输出结果以及对结果的核实反馈,以有效地实施企业所得税风险评估。上述方法的优势在于让税收征管顺应技术发展潮流,利用大数据平台的并行计算能力和算法模型从海量税务数据中提取有价值的内容和规律,从而为企业所得税的风险评估提供有效的支持。
2.一体化智慧税务
深圳市在深度应用人工智能技术对税收征管数字化、智能化改造和升级的问题上走在全国前列。深圳市税务局在税收征管的人工智能应用上进行了多场景的实践探索。在纳税人识别场景中,通过人脸识别技术对纳税人进行识别,只要纳税人出现在办税大厅,不用携带身份证即可办理纳税服务;在税收宣传方面,通过利用机器学习、推理和人机交互,为纳税人搭建咨询服务平台,及时推送与纳税人相关的税收政策;在纳税人服务领域,应用大数据和机器学习算法,分析纳税行为和与纳税人相关的资产信息、银行流水信息、金融资产交易信息等,对纳税人进行全方位、个性化的剖析,实现对不同行业、规模、存续时间的企业分类分级,做到科学客观授信,为精细化、个性化管理服务纳税人提供更多维度参考。
(三)
简要评析
从上述国外与国内的应用现状来看,在税收征管中不断应用强人工智能,其作用是让传统税务适应时代要求,转变为智能治理的智慧税务,以更好地实现税收征管的目标任务、更好地服务纳税人以及创造更优的营商环境,并且在税收征管中积极与全面地应用强人工智能技术已经成为不可逆转的时代趋势。
不过,从既有的应用现状来看,虽然都在积极探索如何应用,但无论是国外还是国内,都还仍处于点状运用试验的初始阶段,也都尚未建成全面应用强人工智能的智慧税务完整体系。固然要建成完整体系尚需要时日,也需要进一步不断地试验探索,但是此时我们在理论上全面梳理强人工智能对税收征管到底有哪些应用作用,以指导后续的继续探索和全面应用。
五、强人工智能在税收征管中的主要应用作用
(一)
在纳税人识别上的应用作用
现代税收征管方式经历从弱事实、强规范向强事实、强规范的转变,“税收征管的前提是了解国民财富多寡进而认定纳税人资格并合理定税。这需要尽可能收集纳税人的财产事实进行财产认证。进行财产认证的第一步就是为个人和企业建立真实、准确、唯一的经济身份。”在现代国家,这个经济身份就是纳税人识别号,纳税人识别号赋予纳税人唯一确定的经济身份。《税务登记管理办法》第六条规定纳税人识别号的编制规则,并强调纳税人识别号具有唯一性。在确定纳税人识别号后,通过整合纳税人全部经济特征,收集尽可能全面的财产事实,让税收征管建立在全面的事实基础上,从而实现课税的强事实基础。
纳税人的经济身份以数字或编码作为标识,本质上是对纳税人身份的数字化,只不过这种数字化属于简单的特殊组合编码,其中包含的信息有每个纳税人的地区、行业和经济性质等,但以上信息在海量纳税人数据前宛如沧海一粟。纳税人识别特征不仅要具有唯一性,更需要具有多维性,可以涵盖纳税人的基本情况、经济活动、纳税行为等全部信息。因此,可以通过借助强人工智能的数据挖掘、机器学习等技术手段,在海量数据资源的基础上,将纳税人的多维度特征进行抽象概括,构建目标特征标签,再根据具体应用场景对纳税人信息进行集成整合,形成纳税人画像,并以此来丰富和完善纳税人识别号信息与管理。相较于传统的纳税人识别号管理模式,纳税人画像在保持唯一性的基础上,对纳税人的识别更加多维立体。在掌握纳税人多维度特征后,税务机关可以对纳税人进行分级分类管理,针对不同类型的纳税人提供差异化、个性化的税收征管服务以及其他相关涉税服务。
(二)
在税源监控上的应用作用
强人工智能技术应用于税源监控,可以有效解决两大难题,即:数字经济条件下税源的隐蔽性问题和高净值人群逃避税问题。针对数字经济税源的隐蔽性问题,当前的解决路径主要是推动数字税立法,引入“用户价值创造说”作为新的课税联结点,但这并未能从源头解决数字经济条件下税源隐蔽性问题。税源监控是获取课税事实基础的前提,如果未改变当前的弱事实基础现状,仅通过加强法律规范和增加税种方式来解决,这势必会造成“弱事实基础+强法律规范”的新困境,并且同时还会降低纳税人的遵从度。
数字经济条件下,“交易数据化的破解之路在于征管的数据化,借助‘大数据+强人工智能’有助于税务机关脱离‘税务信息孤岛’”。随着常态化、制度化数据共享协调机制的建立与完善,税收数据的规模更大、类型更多、价值更高、颗粒度更细。充分利用强人工智能技术对这些税源数据进行结构化处理,利用标签提取技术对大量数据进行提炼,让冗杂的数据呈现出清晰且具有逻辑性的特征。如此,加强对纳税人数据的深度挖掘,对纳税人进行全样本监控,可以真正实现对税源的全面管控,减少税收流失。同时,结合人工智能技术的机器学习特点,在经验学习的基础上不断改善算法,并适时自动更新调节特征提取权重,优化数据分析算法模型,可以进一步增加数据的分析、预测价值,从而更好地实现税源监控。
针对高净值人群的逃避税问题,仅通过传统的纳税人自行申报数据和税务稽核是无法全面识别其逃避税行为的。而通过强人工智能的机器学习算法,对过往逃避税人群的多维度经济数据进行分析挖掘,包括社会职业类别、收入、支出、财产金额等等,从中抽象出该类人群的行为特征,形成高净值人群的风险模型,并以此对该类税源进行智能监控、精准预警和有效追踪,这可以有效地解决高净值人群逃避税的问题。
(三)
在征管风险应对上的应用作用
强人工智能的发展为税收征管风险应对提供了很好的技术基础。在税收风险管理智能化方面,人工智能决策树、神经网络分析法、机器学习模式能客观构建纳税人风险特征,计算风险结果和特征的相关性,并对风险进行监督、预测。在税收风险管理自动化方面,人工智能技术可以智能化设置关键阈值,从而触发税收风险管理全环节,并处处留痕,打造数字驱动的自动化管理模式。
当前新时代背景下的税收风险监管思路,已经转变为“事前预警、事中阻断为主,事后追责为辅”的新框架。因此,风险应对路径应当坚持源头监管和动态监管,不仅要将风险应对关口前移,而且要将风险监控适用于税收征管的全过程。强人工智能可以对历史纳税数据和征管经验进行分析、筛选和标识,形成数据的特征集,并利用机器学习等先进算法来预测纳税人的逃避税概率。税务机关可以根据该等算法结果,在事前对高风险逃税人群及时预警,提高税法遵从度,在事中及时阻断逃税路径,限制逃税人的财产转移路径,以及在事后追究逃税人的责任,从而有效配置有限的税收征管资源,及时发现潜在风险,从事后追责转为对涉税风险的有效识别和事前阻断的动态防御模式。
(四)
对税收征收管理模式创新的重要作用
强人工智能是知识社会中重要的技术手段与方法,它对经济社会运行格局所造成的影响将是全面而深入的,也必将促使税收征收管理模式的创新。这些创新将可能体现在如下方面:
一是税收征管的开源化管理。随着强人工智能的深入应用,各级税务机关将形成数据共享、模型共享、指标共享和算法共享的局面。未来决定税收征管水平高低的重要因素将是税务机关获取和使用涉税数据的能力,谁的数据规模更大,数据质量更高,算法更先进,指标更全面,谁就能提供更全面的纳税服务。因此,未来税收征管模式会更加注重构建常态化数据共享协调机制,主动打破部门间、区域间的数据保护心理和决策的孤岛现象;同时,各部门间会联合建设各类税收模型、指标和算法,加强不同部门和不同区域就人工智能赋能税收征管工作的建设经验与创新理念的交流与共享,实现税收征管智能化成果跨部门、跨地域共建共用,亦即税收征管的开源化管理。
二是实现“信用风险”导向化管理。税务资源的有限性和纳税服务需求激增间的矛盾,在可预见的未来仍将继续存在。在征管服务数量供给不足的情况下,税收征管模式会更注重优化税务资源配置,以提高税收监管的全面性与精准度。通过强人工智能则可以构建纳税人信用风险指标分析模型,采集纳税人行为特征、涉税数据和其他相关经济数据,并分析纳税人的信用风险,从而对信用好、无风险的纳税人不予打扰,对低风险的纳税人予以提醒,并对严重失信、高风险的纳税人实施重点监管,做到从事前、事中预警的角度提高征管效率和纳税遵从度。可见,强人工智能应用下的信用风险导向化管理,将会成为税收征管模式创新的重要内容。
三是形成以算法监管为核心的治理结构。强人工智能的兴起,让以算法为核心治理架构嵌入税收征收管理模式渐次出现,并会全面而深入。基于税务大数据和算法模型的分析预测进行快速且精准地决策,将是人工智能对当前及未来税收征管应用的最突出体现。算法监管聚焦行为预测,通过历史数据对纳税人未来的涉税行为进行推演,将税收征管整体前移,不仅聚焦违法行为如何处置,更注重如何提高税收遵从度,降低纳税人逃税避税的风险,从而减少后期监管的问题以及后期监管资源的投入。不仅如此,以算法监管为核心的税收征管新模式,还可以基于纳税人行为预测和纳税人纳税要素数据为纳税人智能化提供纳税申报服务和税款解缴入库服务,从而大大提高税款征收的科学性、精确性与效率性。
六、强人工智能在税收征管中作用的必要限定
虽然强人工智能在税收征管中有着不可逆转的巨大应用作用,而且税收征管模式将可能因此转变成以算法监管为核心的新治理模式,但是任何一项新技术都是会存在一定负面性,所以对于强人工智能在税收征管中的应用,我们还必须要做出必要的限定,以尽量消除该新技术可能的负面性。
强人工智能技术产生之后,人们一方面惊叹其功能的强大,另一方面也引起了人们对其风险损害后果的担忧,并且因此各国(地区)都在积极探讨如何规制这项新技术可能带来的风险,以保证该项技术仅为人类带来福祉。2023年12月8日,欧洲议会、欧盟成员国等就人工智能法案达成临时协议,使得欧盟成为第一个为人工智能使用设立明确规则的地区。根据该临时协议,强人工智能发展将划分为四类进行监管,即分别为最小风险、有限风险、高风险和禁止类。参照欧盟的该做法以及我国关于强人工智能的现有规定,强人工智能在税收征管中的应用应当是归属于最小风险的这一类别。
尽管如此,强人工智能在税收征管中应用的负面性仍然不可忽视。我们认为,该负面性集中体现为算法模型在税收征管中决策的偏差性和错误性,以及由此带来的税收征管结果的非法性或不公平性。造成该负面性的原因会有很多,主要包括技术的非完善性、数据的非全面性、算法模型训练学习的不充分性以及算法模型自主推理的偏差性等。基于此,我们认为,在大力加快强人工智能在税收征管中应用的同时,还必须同时对其应用作用作出如下的必要限定:
一是坚持税收征管的最终决策始终由税务专业人员作出。无论强人工智能再“强”,其智慧来源于人类,并且应当始终服务于人类,而不是破坏人类。所以,在法律上我们必须要确立一条对强人工智能作用的限定原则,那就是强人工智能的决策结果永远只能是一项决策参考,最终的决策必须由人类作出,而不是假以算法模型。因此,虽然在税收征管中,我们可以运用强人工智能计算出各类结论结果,并且这些结论结果在很多时候都可以成为我们执法的依据,但是最终的决策则必须由适格的税务专业人员做出,以防止算法模型决策的错误以及对算法模型决策的滥用。
二是算法模型决策的偏差错误性最终应由税务专业人员复核。从当前强人工智能技术在各行各业的应用情况来看,算法模型决策的偏差错误率一直存在。即使随着该技术的不断发展迭代,其偏差错误率会不断降低,但始终不可能消除。当出现偏差错误时,我们可以也需要以另外的模型或者技术予以复核,但是基于前述最终决策应由人类掌握之同样的原因,对于该等偏差错误的最终复核确认亦应当由税务专业人员做出,而不应当仅以强人工智能技术复核为准。
上述两项限定原则,虽然简单但是十分实用,而且符合人类同强人工智能之间的关系原则,必须始终贯彻于强人工智能在税收征管中应用的全过程,必要限定强人工智能的作用,保证强人工智能更好更优地为税收征管服务。而至于如何具体实施该两项原则,则可以根据具体情况予以探索。

原标题:《洪治纲 陈艺明|强人工智能在税收征管中的作用与限定》