落地有声|政务大模型潮起,将如何重塑新应用场景?

澎湃新闻记者 喻琰
2024-06-24 12:38
来源:澎湃新闻

【编者按】由ChatGPT引发的大模型热已一年有余,围绕大模型创业的公司也如雨后春笋,技术最终要为产业所用才能创造价值,当大模型落地千行百业,能够发挥怎样的价值?澎湃科技走进产业一线,访谈创始人、专家、投资人,调研大模型落地产业现状。本文为政务大模型访谈。

·政务大模型可以有效解决大量人工咨询和投诉问题,有助于释放人力资源,降低政务服务成本。

·有投资人指出,未来全国及全球的政务大模型市场将呈现高度分散、各取所长的格局。政务大模型的成长空间不能仅仅依赖于各公司本身在功能模块上的纵向拓展,还需要行业整体在落地应用场景上的持续创新。

传统的政府公共服务可能无法满足用户对高质量信息反馈的需求,利用政务大模型进行人机交互,可以有效解决大量人工咨询和投诉问题,有助于释放人力资源,降低政务服务成本。

政务如今正在成为大模型商业落地的一个重要领域。有研究指出,当前,北京、上海、杭州、深圳等地都出台政策推动政务领域大模型应用落地,政务热线、智能客服、城市治理、医疗、教育等都是重点落地方向。据不完全统计,国内至少有56家大模型厂商在政务领域展开布局,其中不乏百度、科大讯飞、商汤科技等知名科技企业。

大模型落地政务服务,将如何重塑新应用场景?国内语言智能和垂直大模型企业——上海蜜度科技股份有限公司(以下简称“蜜度”)CTO刘益东日前在接受澎湃科技(www.thepaper.cn)采访中表示,未来政务大模型在市场上最终会呈现出多元化、“百花齐放”的状态。在大模型落地政务场景的过程中,内容准确、数据安全是关键。

大模型落地政务场景,为政府工作人员“减负”

成立于2009年的蜜度自主研发的专注于政务领域的大语言模型蜜巢,于2023年7月世界人工智能大会上正式对外发布。蜜度CTO、蜜度蜜巢总裁刘益东表示,2009年该公司成立之初,是希望在移动互联网时代开发出创新应用的产品。但由于当时的市场环境,面向消费者的业务模式和盈利方式尚未成熟,从2012年起,决定围绕政务、媒体和国有企业客户端提供大数据产品服务,经过十多年的发展,蜜度积累了近四万家ToB(企业)端和ToG(政府)端客户,为日后研发大模型产品打下了基础。

“是客户需求最先找到我们。”刘益东称,2023年,在与合作伙伴的一次偶然交流中,他了解到政府部门对政务大模型有迫切的需求,希望能借助大模型技术提高工作效率。他们用了3个月的时间,便成功推出了一款基于大模型能力的舆情分析产品。

在刘益东看来,打造一款通用基座大模型远超其公司能力范围,“通常只有大型企业才能承担。”由于他们前期已有相应的政务端客户积累,在选择大模型落地场景时,便结合具体政府需求,最终瞄准了政务领域场景——政务热线、文稿智能写作和智能舆情分析。

“过往,传统的政务服务场景里,每天拨通的12345市民热线电话近2万个,话务员知识面相对不够专业、不够全面,只对客户满意度等内容做简单记录,并不涉及后续解答工作。 ”刘益东认为,结合大模型技术,可以简化这一流程。

此外,政务服务场景中另一大需求是大量的政府文书工作,刘益东表示,可以运用大模型结合专业业务知识库,为政府工作人员个性化地生成各种报告,这同时也为政府工作人员“减负”。

正式发布的蜜巢大语言模型,聚焦智能知识管理、文稿智能写作、智能舆情分析三个垂直应用方向。为了“提效”,刘益东称,在政务热线、企业电销等对话场景中,蜜巢智能知识管理能力不仅能为接线人员提供可靠的知识检索,还可以将语音自动转换为文本,快速提炼关键信息。另外,根据内部汇报模板,该模型可帮助工作人员将来电诉求的意见和建议整合成报告,便于工作人员整理和反馈问题。

内容准确、数据安全是挑战

中国人民大学公共管理学院教授马亮,专注政府创新、数字治理和绩效管理。他在接受澎湃科技时表示,利用政务大模型进行人机交互,可以有效解决大量人工咨询和投诉问题,有助于释放人力资源,降低政务服务成本,能提升公众对政务服务的满意度。除此之外,在专业性较强的服务领域中,政务大模型的应用将大幅减少对人力的依赖。

不过,马亮也提及,由于政务服务涉及教育、医疗等多个敏感领域,因此数据安全至关重要。马亮建议,将政务大模型部署在政务云上,以加强数据保护,避免信息泄露风险。

此外,大模型算法透明度不足,与政务服务可问责性相悖,这可能导致在出现问题时难以进行有效解释和问责。

“如果大语言模型没有经过适当的工程化处理,直接用于回答问题,可能会因超出其知识范围而产生误导性或不准确的信息。这种情况是大模型落地政务服务领域中必须避免的。”刘益东表示,由于场景特殊,涉及大量政府工作,政府对生成式内容准确度要求极高,幻觉是大模型落地面临的挑战。

如何确保生成式内容的准确度和数据安全?

刘益东称,该公司研发团队广泛采用深度语言学习模型,同时基于过去十余年在政务领域积累的海量数据基础,在大模型研发过程中,团队会自己构建预训练数据集,进行专业清洗,确保数据与模型的价值观对齐,去除不符合价值观的内容。

“2017年,基于Transformer模型衍生的Bert分类模型已经显著提高了自然语言处理(NLP)的性能,Bert分类模型的准确率已经达到了80%,再通过公司技术人员结合特定场景对数据进行训练和微调、有效地监督学习,可以将准确度提高到85%到90%,足以代替人工。”刘益东称。

刘益东表示,目前蜜度大模型团队共有18人,团队人员主要集中在技术和产品研发。蜜度的自然语言处理(NLP)、计算机视觉(CV)等核心技术能力,再加上该公司多年累积的海量图文音视频资源为大模型研发提供了高质量语料数据支撑。“我们目前开发的文本生成AI的检测准确率已经达到95%至98%左右。”刘益东说。

未来将呈现高度分散、各取所长的格局

当下,大模型市场卷技术、 卷产品、卷研发速度。To G端和ToB端的大模型应用也层出不穷,如何同G端、B端需求实现有效对接也成为众多企业面临的一道考验。

刘益东告诉澎湃科技,蜜度公司打法是“小切口、大纵深”,即一个切入点深入挖掘,以满足客户需求。“随着服务的深入,客户对我们的满意度提升,便会将更多的业务场景交由我们处理。”刘益东称,满足客户的关键需求后,便可快速实现服务的规模化扩展。

“我们在提供解决方案时,会考虑到成本,尽量把价格控制在100万以内以保持竞争力。”刘益东说,“有的大厂仅提供一个模型就需要几百万,还不包括业务层的微调和应用开发等额外费用。我们的知识问答功能报价可能在几十万以内,文稿生成服务可能还需增加相应的服务费用,如果还需要多语言翻译功能,可能会加入翻译模型的费用。”

但大模型目前也存在挑战。在政务领域,常常会涉及对复杂问题的理解,例如在市民服务热线的场景中,群众诉求往往涉及方方面面,问题表现各式各样,这就需要大模型有更强的应对复杂事务的能力和响应速度。“目前,我们正在尝试一些新的思路,通过采用MoE混合专家模型,来有效拆解、处理包含多领域知识的复杂问题。”刘益东认为,未来政务大模型在市场上最终会呈现出多元化、“百花齐放”的状态,“整个市场不会由一家公司来完全掌控,一定还会有其他对行业有深刻理解的参与者共同参与政务大模型市场中。”

马亮预测,随着技术进步,大模型将不仅仅作为辅助工具,更可能成为主导政务服务流程的关键力量,引领政务服务模式的创新与变革。今后,围绕着大模型的技术发展将与政务服务深度融合,推动实现政务服务全流程的智能化。

此外,通用人工智能技术在应用于国家治理时需要考虑其专用性转换,即在大语言模型的基础上开发服务特定国家治理领域或场景的专用人工智能。“在从通用人工智能向专用人工智能的推进方面,会衍生出许多新的发展契机,也有利于国家治理现代化向纵深发展。”他说。

领中资本投资总监张烨樑认为,未来,全国及全球的政务大模型市场将呈现高度分散、各取所长的格局。政务大模型的成长空间不能仅仅依赖于各公司本身在功能模块上的纵向拓展,还需要行业整体在落地应用场景上的持续创新。

 

    责任编辑:宦艳红
    图片编辑:陈飞燕
    校对:丁晓