秒级生成海量生产,媒体大脑为进博会3天编发330条短视频

澎湃新闻记者 俞凯
2018-11-07 22:58
来源:澎湃新闻

中国国际进口博览会新华社新闻报道中心。 澎湃新闻记者 俞凯 图

对前方记者来说,中国国际进口博览会既是一个“新闻富矿”,又是一个巨大挑战——又要写文稿,又要拍视频,如何才能忙得过来?

不过,中国媒体上马的一条神奇的视频生产线,令首届进博会的视频报道“如虎添翼”。这就是新华社自主研发的人工智能视频生产加工系统,又称“现场云”移动采编平台+“媒体大脑Magic系统平台”。

新华智云联席总裁傅丕毅透露,截至11月7日中午12点,新华社联合13家参加进博会报道的媒体,运用“现场云”移动采编平台,用手机边走边拍边发,两天半时间就已发出285条短视频,到当晚可突破330条。

“这些短视频在新华社客户端的浏览量、点击率也相当可观,达到了‘秒级生成、海量生产、受众喜欢’的预定目标。”傅丕毅透露。

最快的视频制作仅耗时6秒

那么,这是如何做到的呢?

新华社新媒体中心透露,前方记者基于现场云实时采集视频素材,即拍即传,完成第一轮报道。之后,现场云报道以素材形式进入Magic智能生产平台,经过人脸识别、语音识别、数据处理等AI工具,自动或人机协作批量生产短视频内容,这是第二轮生产。最后,审稿人对批量内容集中审核,稿件签发后完成第二轮传播。

新华社新媒体中心副总编辑贺大为表示,就进博会视频报道来说,采编发流程要具有快速批量处理能力。“现场云”发挥了重要作用,它可以理解为媒体大脑Magic智能生产平台的前端应用和客户端,300多位新华社记者可以在进博会各个现场举起手机,按各种格式进行视频拍摄和采集,实现移动化的视频采集加工,供媒体大脑Magic智能生产平台进行后期的AI人机互动加工和生产。

现场云移动采编发系统与媒体大脑Magic智能生产平台的合作,是一种智能化生产模式,首次在进博会这样的大型报道上得到实战检验。

傅丕毅表示,作为国内第一个媒体人工智能平台,新华社的媒体大脑Magic系统平台是在2017年的互联网大会上宣布建成并向海内外媒体开放服务的,在2018年6月14日-7月16日的世界杯期间,总共生产制作了37581条短视频,占央视、爱奇艺、优酷等短视频总产量的58.6%,平均每条短视频的生产时间在1分钟以内,最快的一条世界杯进球视频制作出来仅耗时6秒。

媒体大脑”编辑制作视频时的显示画面。新华社新媒体中心 供图

不是取代记者而是解放记者

傅丕毅透露,以前视频记者每人每天的视频产出量平均为3条,按此测算,330条进博会短视频至少需要110人,如今这些人力都被机器节省下来了。

傅丕毅表示,本届进博会应用的是媒体大脑Magic系统平台3.0版本,采用的人工智能技术主要包括人脸识别、语音分析、自动标注、视觉分析、自动合成、机器配音等,可运用人工智能技术对这些视频进行再加工,通过对视频画面逐帧拆解和再组合,又生产出全新的视频。在语音识别上,目前普通话的识别准确率已达97-98%,上海话识别率在70-80%左右,英语识别也OK,小语种暂时还不能识别。

“为确保安全,审稿流程也全部由人工进行严格把关,逐条审核通过,机器仅提供辅助。”傅丕毅强调,现场云和媒体大脑Magic系统平台不是取代记者,而是解放记者,让记者解放出更多时间去做更有创造性和思考性的工作。

新成员“AI合成主播”诞生

澎湃新闻从新华社新媒体中心获悉,11月7日,在乌镇举行的第五届世界互联网大会上,新华社联合搜狗又发布了全球首个虚拟主持人“AI合成主播”,运用最新人工智能技术,“克隆”出与真人主播拥有同样播报能力的“分身”。

“AI合成主播”是通过提取真人主播新闻播报视频中的声音、唇形、表情动作等特征,运用语音、唇形、表情合成以及深度学习等技术联合建模训练而成。该项技术能够将所输入的中英文文本自动生成相应内容的视频,并确保视频中音频和表情、唇动保持自然一致,展现与真人主播无异的信息传达效果。

“真人”主播一天工作8小时,但“分身”能够不知疲倦地工作24小时。只要小编们将文本输入系统,TA们就能随时工作,并且一直工作下去……

即日起,“AI合成主播”正式成为新华社报道队伍中一员,用户登录新华社中英文客户端、新华社微信公众号、中国新华新闻电视网(CNC)、新华视点微博、新华社中国网事微博、新华社“微悦读”小程序,都会看到“AI合成主播”的身影。

在傅丕毅看来,“AI合成主播”是媒体大脑家族的新成员,它的出现将让真人主播得到彻底解放。

    责任编辑:郑浩
    校对:刘威