大模型+数字人始于电商直播,发展于千行百业

2023-10-12 18:33
北京

“只需几分钟的训练素材视频和1000美元成本,品牌方就能实现全天候直播售卖产品。”中国的AI数字人技术深度赋能电商产业,实现全天候直播。

近日,《麻省理工科技评论》发表了文章《Deepfakes of Chinese influencers are livestreaming 24/7》,让全世界看到了中国先进的AI技术,在文章中,《麻省理工科技评论》着重讨论了AI数字人技术在电商行业中降本增效的巨大优势。

来源:MIT Technology Review

近年来,直播电商的兴起为电商行业注入新的动力,而头部主播的地位不可撼动,业内人士曾表示,举例直播企业中2-3个头部主播将贡献总销售额的70%至80%,而剩余的销售额由7-8个腰部及尾部主播达成,而这也为AI数字人主播的发展提供了土壤。

在AI数字人主播的“竞争”之下,为行业带来切实的降本增效,据iiMedia Research数据显示,与2022年相比,2023年中国直播主播的平均工资下降了20%。

来源:平台截图

快速的深度合成训练、全天候24小时直播、AI技术加持,能够实现主播高效且低成本的普及。从30分钟训练视频到现在的1分钟视频就能合成数字克隆人,数千元低价取代真人主播,中国AI数字人技术应用在电商直播中的成绩也引来了国外网友的惊叹,接下来,和大模型之家一起来探讨中国的数字人发展。降低生产门槛,大模型重塑数字人行业

“虚拟偶像”一词诞生于20世纪80年代的日本,早期偏向二次元,主要指面向演艺活动打造的虚拟歌姬,比如家喻户晓的初音未来,以及乐华娱乐推出的虚拟偶像团体A-SOUL等。2020年以来,随着资本加大布局,技术日益成熟,虚拟偶像的应用模式呈精细化、智能化和多样化发展趋势,加之元宇宙概念的火爆,虚拟人技术逐渐进入到大众视野中。

而在2023年,伴随着人工智能技术的发展,数字人发展迎来了新一轮的高潮:

3月,万兴科技发布AIGC营销工具“万兴播爆”,输入文案,即可一键生成AIGC“真人”营销短视频;5月,硅基智能正式发布炎帝大模型,兼备生成多种内容形式的能力,包括文本生成、声音生成、图像/视频生成。用户只需告诉炎帝大模型直播间的要求,一个数字人直播间就能迅速搭建完成;6月,360推出“360 AI数字人广场”,拥有超200名虚拟数字人角色,包括市场、运营、程序员等数字员工,给用户相应的回答和建议;7月,新壹科技发布基于视频大模型的数字人平台;

……

虚拟主播的出现,实现了IP的“人设”与“皮设”的分离,大幅降低了IP的孵化与运营成本。在《麻省理工科技评论》的文章中了解到,硅基智能目前能够实现使用一分钟的训练视频进行数字人克隆,随着技术的改进,现在生成一个基本的AI克隆数字人大致花费在8000元人民币左右(1100美元)。

来源:MIT Technology Review

硅基智能创始人司马华鹏公开表示,从2022年开始,硅基智能开始推动数字人商业化落地,线上进军电商直播带货、线下覆盖本地生活场景。在硅基智能看来,每一个 AIGC 数字人都是一个硅基劳动力。目前,硅基智能的 AIGC 数字人每天直播数量可达三四万场,生成数百万条短视频。

作为数字人行业大模型,硅基智能推出的炎帝大模型具备多模态能力,同时兼备生成多种内容形式的能力,包括文本生成、声音生成、图像/视频生成,能够快速完成直播间的搭建。

值得注意的是,直播间的主播、运营等角色都可以由AI扮演,大大降低了直播内容生产的门槛,并且在直播过程中可以通过大模型自动获取竞争对手直播间内的信息。当直播间观众数量下降时,AIGC数字人将执行各种选择器、任务器和反馈器的任务,数字人主播对应生成一系列响应,比如生成降价促销的直播话术。

诚然在大模型之家看来,AI数字人主播的出现,并非为了完全取代真人主播,而是协助人类。以当下的直播环境分析,头部主播的个性化特性鲜明,能够与观众进行情感交互,给用户提供信赖感和可依靠的角色,而数字人的出现是能够补充在头部主播的非直播时间,实现24小时全天候直播,依靠AI预训练的脚本提供最基础的商品咨询保障,引导观众进行关注等,但在情感交互和商品后期保障中与真人相比还存在差距。

图源:直播平台截图

以淘宝、抖音、京东、快手等平台的店铺直播为例,当下已出现不少的AI数字人直播,能够依靠后台设置的脚本进行商品介绍,并能够引导关注,但在和观众的互动中表现较差,口型和肢体动作也略显不自然。在某些家具产品介绍中,AI数字人能够流利的介绍产品,但不能真正坐在沙发上或躺在床上,缺少实测体验。

虽然目前的AI数字人表现强劲,能够进行基础的互动,实现全天候直播,为商家能够实现降本增效的目标明显,但仍需要严格的内容把控,今年5月9日,抖音官方发布了关于人工智能生成内容的平台规范暨行业倡议,要求创作者、主播、用户、商家、广告主等平台生态参与者,在抖音应用生成式人工智能技术时,应对人工智能生成内容进行显著标识并负责。

在实时直播与交互的过程中,AI 数字人的表现会受到多重监控,针对AI数字人是否会在直播中说出不正确的话术,硅基智能创始人司马华鹏表示,硅基智能所推出的数字人是一个群体智能。在整个直播过程中,可能会用到7-8个大模型,分别负责投放广告、直播、与观众互动、审核内容和画面以及监控竞品直播间变化。

据了解,今年9月,硅基智能还与华为云正式签署数字人+盘古大模型行业解决方案合作协议。将基于华为云盘古大模型与硅基智能数字人联合打造行业解决方案,实现数字人+大模型在知识生产、虚拟直播、数字永生、数字文娱等多维度的生态共建。AI浪潮下数字人的新发展

大模型之家了解到,目前,除硅基智能、微软小冰等创业公司外,中国科技企业也正测试其AI数字人直播。阿里巴巴、腾讯、百度和京东今年都允许其平台上的品牌使用数字人主播。

据了解,基于AICG技术,硅基智能和薇娅旗下的谦寻控股合资成立了谦语智能,主打电商领域的数字人直播带货,不断扩大硅基智能在数字人直播电商中的版图。

以硅基智能为例,其下一步的目标是为AI数字人融入“情感智能”。司马华鹏表示:“如果用户对AI主播使用攻击性语言,它会表现出沮丧;而当AI主播成功售出产品时,它会显得高兴。”

图源:《人工智能大模型产业创新价值研究报告》

《人工智能大模型产业创新价值研究报告》中表指出,针对不同行业的场景特点,进行有针对性的知识增强在解决现阶段问题中发挥着重要作用,通过链接知识库进行专业知识增强,打造行业大模型,或是通过增强联网的能力实时扩充大模型知识储备,大模型能够深入了解各个行业的专业知识,并将其融合到模型的学习和推理中。

加持垂直领域的行业大模型,数字人应用边界将不断被拓宽,智能教师、医生、金融分析师等的身份也将不断涌现,数字人也不止局限于直播电商行业。

硅基智能创始人司马华鹏认为,数字人是“硅基生命”的一种形态,有别于人类的“碳基生命”。硅基智能计划2025年为全球打造1亿硅基劳动力,还提出人工智能倡导“科技平权”,硅基劳动力将引领服务、教育、医疗等各领域的平权。

他还表示,“直播带货并非数字人的最终应用场景;硅基智能的数字人的最终目标场景是在影视行业,未来将运用AIGC数字人技术,将一部部小说搬上荧屏,可以理解为用AIGC生成电影;在数字永生方面,未来也会是很大的市场。”

大模型之家认为,人工智能大模型在数字人行业的应用将使得数字人更加智能化、高效化、人性化,将为数字人行业带来更多的机遇和挑战,同时,在自然语言处理、语音识别、图像识别等方面仍然存在一定的技术瓶颈和数据隐私问题。未来,人工智能大模型需要克服技术、数据、成本、隐私和人机交互等问题,才能更好地推动数字人行业的发展和应用。

    特别声明
    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。