新闻生产智能化

时间:2021-06-06 14:26:57 浏览量:

唐琦

摘  要:
人工智能时代各项技术不断革新,落地场景不断丰富。其中语音转写、机器写作、AI主播和短视频智能生产融合了语言科技的多项技术,如语音识别、语音合成、语言生成、语义理解、机器翻译等,其相关产品和应用进入新闻生产中采编、写稿、播报等各个环节,使新闻生产模式向智能化方向发展。

关键词:
语音转写; 机器写作; AI主播; 短视频智能生产

中图分类号:TP391          文献标识码:A     文章编号:1006-8228(2021)02-12-04

Abstract:
In the era of artificial intelligence, various technologies continue to innovate, and the landing scenes are constantly enriched. Among them, speech transcription, machine writing, AI anchor and short video intelligent production integrate multiple language technologies, such as speech recognition, speech synthesis, language generation, semantic understanding, machine translation, etc. Their related products and applications have entered all aspects of news production, such as collecting, editing, writing, and broadcasting, so that the news production model is developing in the direction of intelligence.

Key words:
speech transcription; machine writing; AI anchor; short video intelligent production

0 引言

在以互联网、大数据和深度学习为标志的海量信息时代,各项技术不断实现新突破,人工智能落地场景不断丰富,这对各行各业都产生了深刻影响——“智慧交通”、“智慧医疗”等新理念涌现,具体内涵也不断丰富。其中新闻传媒业也在这场工业革命浪潮中迎来新的机遇和挑战。

目前新闻传媒业正处于从传统媒体向新媒体的持续转型中,具有以下特点:一是媒体融合趋势逐渐向纵深发展,二是行业竞争不断加大,三是逐渐从信息介质向服务平台转型。为了提供更好的用户体验,达成最佳的传播效果,新闻传媒业无疑需要借助语言科技的成果不断实现自我革新。

语言科技对新闻传媒业的影响主要体现在新闻生产模式上,使其由原来的“专业生产”转变为“专业生产+智能生产”。新闻生产至少包括采编、写稿、播报等环节,在融媒体大背景下还包括了短视频呈现。在这些环节中,语音转写、机器写作、AI主播、短视频智能生产等多项技术为新闻的智能化生产提供了支持。

本文总结了上述语言科技在新闻传媒业的具体应用,并分析其发展的现状、瓶颈和前景。

1 语音转写满足记者高效采编的需求

语音转写主要依托语音识别技术。语音识别是指利用计算机实现从语音到文字自动转换的任务,这不仅需要将人声与嘈杂背景音剥离开来,还需要攻克语义理解上的技术难关,综合了自然语言处理、机器学习、信号处理、模式识别等多项技术。

2015年底,科大讯飞推出“讯飞听见”平台,专门用于录音整理;2017年,科大讯飞联合新华字典发起“方言保护计划”,在留存方言文化的同时为方言识别和转写积累了海量数据;讯飞开放平台目前支持中、英、日、韩、俄、法、西七个语种的识别,结合机器翻译的功能,可以实现跨语言转写。除了“讯飞听见”平台,科大讯飞还推出了一体化的产品,极大提升了记者的工作效率。2019年两会期间,讯飞听见M1转写工具是很多记者随身携带的设备,成为两会报道技术升级的亮点。记者通过将讯飞听见M1与讯飞听见APP连接,便可实时地将采访时的录音转写成文字,随即将文字传入新闻业务系统,实现移动查看、电脑端写稿、投送稿库的全流程移动发稿[1]。

2019年3月,搜狗推出AI录音笔C1,其转写准确率在95%以上,并且拥有实时互译、云端分享、中英同传等多种功能。2019年8月,搜狗将AI录音笔背后的搜狗听写服务开放出来,进而引领整个录音笔行业的智能化变革。

在人工智能等技术的助推下,语音转写技术不断实现新突破。

一是准确率越来越高,转写速度越来越快。目前 “讯飞听见”平台和搜狗的听写服务都可以做到一小时的录音最快五分钟内出稿, 准确率最高可达95%以上。

二是功能越来越强大。在“讯飞听见”平台转写录音时可以选择语气词过滤、关键词优化、在线编辑、一键共享等功能;搜狗听写服务可以通过云端智能纠错编辑技术,基于词图搜索和输入纠错模型,针对置信度低的转写结果提供多个候选词,帮助用户对转写結果进行纠正,同时,还具备自动区分说话人、智能文本顺滑和标点预测等功能[2]。

三是应用范围越来越广。随着方言识别准确率的提升,方言转写不只是方便沟通,也有望在新闻采编中发挥作用;跨语言的转写服务解决了涉外场合中的语言问题;通过录音设备、转写平台与报业系统有机结合,可以实现新闻稿件的智能化采编,提高新闻生产力,完成多种场景下的新闻报道任务。

2 机器写作促成高效写稿

机器写作指的是系统根据程序和算法获取目标数据,自动生成新闻文本。其核心是自然语言生成技术,在新闻写作领域主要是将数据分析和整合的结果进行结构化处理,重新排列组合,套用事先设置好的写作模板,加上一些简单的语义加工和风格调整[3]。

国外写稿机器人的应用相对较早。2014年,由写稿机器人“Quakebot”撰写的关于地震的报道经过人工校对后发表在《洛杉矶时报》上,此后机器写作真正进入大众视野。目前,机器写作在国外一些媒体已经得到广泛应用,代表性的写稿机器人有“Wordsmith”、“Heliograf”等,详见表1。

国内最先出现的写稿机器人是腾讯研发的“DreamWriter”,它撰写的第一篇稿件《8月CPI涨2% 创12个月新高》引发关注。此后,国内媒体陆续开发写稿机器人,如“快笔小新”、“DT稿王”“Xiaomingbot”等,机器写作在不同领域得到了应用,详见表2。2019年,山东广播电视台北京融媒体演播室开办《两会大家谈》栏目,该栏目将百度智能写作、智能推荐等AI技术融入采编系统,根据关键词进行智能稿件撰写,实现了智能纠错和智能摘要功能,提升了稿件编审的工作效率[4]。

写稿机器人写稿快,出稿量大,极大地提升了新闻生产效率。但受限于技术发展,目前主要用于撰写体育、财经、突发事件等对时效性要求较高且不需要额外添加素材的领域新闻。而在民生等其他领域,机器写作的应用还处在起步阶段。民生报道涉及范围广、主题涵盖面大,要想通过机器人写出好的稿件还面临很多难点,如训练语料较为缺乏等。不过从撰写春运新闻到生成政府工作报告摘要,“小南”等写稿机器人已经在不断做出新的尝试。

总体而言,当前机器写作还处于人机协作阶段,写稿机器人能胜任的主要是数据的高效搜集和初级加工,以及基于行业的深度结构化数据完成基础数据分析、文章生成[5]。写稿机器人将新闻工作者从繁琐的编辑整理工作中解放出来,使新闻工作者有更多的时间和精力去从事选题策划、深度报道等需要思考和创造的工作。

3 AI主播助力新闻快速播报

AI主播是新闻传媒业发展的新风口,将新闻以更生动的形式报道出来,在机器写作的基础上更进一步,推动传媒智能化发展。只需要输入一段既有的新闻文本,AI主播就可以实时播报,而且发音和唇形、表情、肢体动作等也能互相配合。这是语音合成、语音识别、深度学习、计算图形学等多项技术共同发展的成果。2018年11月,新华社与搜狗公司联合打造的AI主播“新小浩”上线,这是全球首个全仿真智能AI主持人。

AI主播的发展虽然已经有一段时间,但近几年才真正在媒体中得到应用(详见表3),这既得益于语音合成等技术的突破性进展,也与媒体融合新趋势相适应。目前AI主播相关技术和产品有以下几个特点。

一是随着技术不断成熟,AI主播越来越智能。从虚拟形象到真人驱动,从半身播报到全身播报,AI主播能够更加自然地运用表情和肢体语言;有的AI主播具有变声功能,为播报提供了多种选择;多语种虚拟主播使这项技术的应用前景更加广阔。

二是AI主播不仅能胜任独白式新闻播报,也开始参与一些需要互动的新闻节目。在东方卫视融媒体新闻直播节目《小冰摇摇吧》中,微软小冰作为“互联网大数据播报员”,能够利用大数据推送最热新闻,收集筛选网友评论,通过线上视频采访网友,全程主持节目并与主持人搭档互动[6]。

三是AI主播已经形成了相对成熟的产业链。科技公司解决技术问题,为客户打造操作简易的编辑后台,而媒体编导人员只需要导入目标文本就可以实现新闻播报。

功能越来越强大的AI主播使新闻的快速播报成为可能。在应对台风、地震等突发性事件时,还可以与写稿机器人结合起来,24小时持续播报最新情况。不过当前AI主播在韵律和情感上还远不能达到要求,在自然度和表现力方面还有上升空间。如何充分挖掘自然口语中的语义信息、如何针对自然口语语料提高韵律模型和声学模型的精度,是语音合成领域急需解决的难题。[7]另外,在语言的创造性发挥上,AI主播也不能与专业的主持人相比,真人主播的互动、即兴的段子金句等,仍是AI主播无法取代的。

4 短视频智能生产推进媒体深度融合

目前我国短视频用户规模激增,短视频成为国人相当重要的娱乐休闲方式。在这一大趋势下,短视频的智能生产成为传媒行业转型升级的关键。短视频智能生产指的是机器根据现场获取的图片、采访资料、视频片段等,加工制作出可视化的视频新闻。除了将语音转写、机器写作和AI主播这几项技术融合,短视频智能生产还需要对视频内的语义场景进行理解,以便调用相对应的素材进行匹配,让视频内的信息更加直观。

2018年12月,新華社发布中国第一个短视频智能生产平台“媒体大脑·MAGIC短视频智能生产平台”,该平台设置了多个智能模板,覆盖时政新闻、突发事件、体育赛事、时尚娱乐等多个场景和领域,推动数据可视化、视频化、自动化。

在2019年两会期间,光明网与中国政协传媒网联合推出“委员全息履职”系列节目,该节目利用影谱科技的智能影像生产技术,可视化、智能化呈现政协委员履职作业[8]。这种呈现方式直观易懂,也生动有趣,能够达到更好的传播效果。

可以预测,在未来新闻表达和传播中,短视频将会成为主要载体。但短视频制作需要耗费一定的时间和精力,光靠人力难以同时达成高质量和高产量的目标。而短视频智能生产技术则为这一困境提供了解决之道,新闻从业者可以越过技术壁垒,快速生产优质短视频。不过数据的收集和标注、主题和内容的合理匹配等,仍是短视频智能生产技术层面上需要继续深入研究的内容。

5 小结

语音转写、机器写作、AI主播和短视频智能生产属于新兴智能技术,涉及语音识别、语言生成、语音合成、语义理解、机器翻译等多项语言技术,使新闻传媒业向智能化方向发展。这几项技术都已经在新闻传媒业中找到落地场景,相关产品和应用越来越多,为新闻媒体从业者带去极大便利,提高了新闻生产力,重塑了新闻媒体的生态。

但在技术方面仍存在不少亟待解决的难点,如语音合成中韵律和情感的还原等。在实际应用中也存在很多需要完善的地方和综合考虑的问题,如生成文本的评估、数据的收集和标注等。此外,在5G技术和技术融合大背景下,新闻生产的智能化趋势必将持续推进。这些方面都是研究者可以继续努力的方向。

参考文献(References):

[1] 董丝雨.新装备让采访更高效 语音转写工具准确率最高达95%[EB/OL].人民日报,http://paper.people.com.cn/rmrb/html/2019-03/07/nw.D110000renmrb_20190307_5-16.htm,2019-03-07.

[2] 毕磊.搜狗开放听写服务[EB/OL].人民网家电频道,http://homea.people.com.cn/GB/n1/2019/0828/c41390-31323578.html,2019-08-28.

[3] 喻国明,郭超凯,王美莹,刘苏,王晓虹.人工智能驱动下的智能传媒运作范式的考察——兼介美联社的智媒实践[J].江淮论坛,2017.3:134-138,150

[4] 冯雯璐.全国两会报道的新技术应用[EB/OL].人民网,http://media.people.com.cn/n1/2019/0827/c429362-31320844.html,2019-08-27.

[5] 郑海涛.人工智能:一位科技工作者对传媒人说……[J].中国记者,2018.3:26-28

[6] 佚名.微软小冰,很有温度的人工智能主持人[EB/OL].IT之家,https://www.ithome.com/html/it/311514.htm,2017-06-02.

[7] 中国中文信息学会.中文信息处理发展报告(2016)[R].中国中文信息学会,2016.

[8] 李经.影谱科技AGC技术助力政协委员讲述履职故事[EB/OL].光明网,http://economy.gmw.cn/xinxi/2019-03/08/content_32617495.htm,2019-03-08.

推荐访问:智能化 生产 新闻

《新闻生产智能化.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:

文档为doc格式

一键复制全文 下载 投诉