产业

【年度观察】视听新技术发展与应用:“未来电视”正萌发

2022年,广电总局明确提出“未来电视”发展战略,更加强调以科技赋能推动行业重构,加强新技术研究和治理、健全视听技术标准体系、加强和规范科技创新实验室管理、组织多项技术应用创新大赛,我国广播电视和网络视听行业(以下简称“视听行业”)开展了重大关键技术的集成创新和应用创新,全面赋能、有力支撑了行业的融合创新,科技创新驱动视听业务能力和服务能力显著提升,“未来电视”已萌发勃勃生机。

导 读

2022年,广电总局明确提出“未来电视”发展战略,更加强调以科技赋能推动行业重构,加强新技术研究和治理、健全视听技术标准体系、加强和规范科技创新实验室管理、组织多项技术应用创新大赛,我国广播电视和网络视听行业(以下简称“视听行业”)开展了重大关键技术的集成创新和应用创新,全面赋能、有力支撑了行业的融合创新,科技创新驱动视听业务能力和服务能力显著提升,“未来电视”已萌发勃勃生机。

一、数字基础设施稳健发展,为视听行业提供强大支撑

(一)信息通信基础设施建设规模增长迅速,服务能力大幅提升

网络基础设施全面向IPv6演进升级,截至2022年8月,我国IPv6活跃用户数达7.1亿。移动通信进入“5G—Advanced”发展期,6G领域的愿景需求研究、关键技术研发、国际交流合作加快。截至10月,我国建成5G基站数占基全球5G基站总数的60%,5G移动电话用户占全球5G用户的60%,其中中国广电可提供服务的基站总量已达360万个。

卫星技术持续融合拓展,北斗导航卫星实现全球组网、规模应用,北斗系统(BDS)已在全球20多个国家开通高精度服务,全球总用户数超20亿,在提供广播电视收听收看、应急通信服务等方面发挥了重要作用。

(二)算力基础设施达到世界领先水平,推动文化数字化建设迈上新台阶

我国算力总规模超过140EFlops(每秒浮点运算次数),近五年年均增速超过30%,算力规模排名全球第二。一些广电机构抓住文化数字化发展机遇,推动自身转型升级。如贵广网络成为国家文化大数据西南区域中心建设和运营主体,以统一架构、统一服务、统一API的广电云系统对所有的物理存储计算资源进行管理。

(三)超级深度学习实现突破,AIGC推动内容生产模式变革

依托大规模人工神经网络预训练模型(即“AI大模型”)取得突破,AI实现从认知功能到生成功能的突破。生成式AI技术2022年进入应用爆发期,并开始运用于文字、图片、音乐、视频、游戏素材的创作和生成,在语音转写、智能写作、智能剪辑、影片修复、虚拟数字人、虚拟场景合成等环节得到应用。美国AI实验室OpenAI的GPT-3,拥有1750亿个参数,是目前最强大的自然语言生成式AI模型之一,元(Meta)、谷歌(Google)以及百度、腾讯、抖音等公司均推出了AI绘画、AI视频产品。

图 AIGC主要应用场景

数据来源:量子位智库,中邮证券研究所

(四)元宇宙关联技术加速探索部署

2022年全社会对“元宇宙”有了更多的理性思考和认识,更加务实地研究、部署、推进。虚拟现实(VR,含增强现实、混合现实)是主要支撑技术之一,也是最先发端于视听行业且广泛应用的新兴技术。华为、爱奇艺、字节跳动子公司PICO等多家公司均发布或升级其智能化穿戴设备。不完全统计,我国虚拟现实相关企业已经超过1万家。11月,工信部、广电总局等五部门联合发布《虚拟现实与行业应用融合发展行动计划(2022—2026年)》,有望拉动元宇宙产业创新发展。

一些视听行业主体已建立了相对成熟的内容制作和支持技术体系,初步参与到元宇宙基础设施和内容的构建。如湖南广电旗下公司芒果幻视发布元宇宙产品“芒果幻城”;河南台推出“大象元”元宇宙平台,还升级了XR沉浸式4K扩展现实演播厅,能够实时渲染输出;江苏台在《2060元音之境》等节目中打通了虚拟技术在广播级卫视平台的录制流程,自主研发出适合节目生产的演播录制和直播系统;北京星光视听产业基地搭建了600平方米的虚拟演播室,在总台2022年元宵晚会等活动中应用;爱奇艺新建虚拟拍摄棚,已应用于影视剧拍摄;快手发布“数字人及XR解决方案”。

二、视听行业迈向全流程数智化、交互多维沉浸化

数字技术持续融合演进、集成创新,技术矩阵搭建起数字底座,为视听行业创作生产、传播分发、呈现体验等各环节提供了新型解决方案,极大提升了视听机构的生产效率,拓展了视听产品的表现形式、应用场景,赋能视听行业迈向更加智能、无界、沉浸、绿色的未来。

(一)供给侧,视听创作深化“全流程数智化”

视听机构积极运用新技术,加快节目制作、存储、编辑、播出系统的高清化、网络化、智能化建设,实现平台IP化、云化、融合化、智能化,提高定制化、个性化、精准化供给能力,深耕专业化、垂直化、场景化内容服务。

1.视听机构深化“上云用数赋智”

不少视听机构已经建立了数智化的内容生成和分发体系。如江苏广电自主研发的荔枝云平台对人员和采编播的全流程实时监控调配、快速响应、高度共享;总台云听打造“AI一体化应用平台”,自制音频快讯AI生产比例已达到95%以上。爱奇艺、优酷等网络视频平台已建立了基于海量用户数据的智能创作系统,并在运营阶段依据用户和环境特征,实现个性化、精准化内容推荐。

我国视频云服务市场也日渐成熟,主要互联网平台均推出了针对视听行业的云服务产品。视频直播、视频点播与音视频通信是核心应用场景,媒资管理、轻量化内容生产、客户触达、以及面向传统行业的远程视频连接等场景和需求日渐增加。华为推出面向内容开发者的服务平台华为云MetaStudio,字节跳动、快手也依托行业经验和技术优势分别推出火山引擎视频云、StreamLake等视听解决方案。

2.智能生成技术在视听行业各环节广泛运用

2022年,视听行业的多个环节应用开展了更为深入的智能化改革探索。如创作环节,TTS(Text To Speech)技术助力多地应急广播实现快速智能播报紧急消息,百度的TTV(Text to Video)技术具备摘要提取、脚本改写、素材检索及智能匹配、内容情绪还原等能力;剪辑环节,央视频智能剪辑赛事精彩集锦,自动生成竖屏视频,大幅提高内容生产效率;渲染环节,华为通过离线渲染AI加速,实现在同等画质效果下,视频渲染速度比普通云渲染提升2—4倍;审核环节,广东台触电新闻推出秒鉴多媒体内容识别系统,内容审核准确率和召回率超99%;营销环节,腾讯的广告混元AI大模型,可根据广告文案生成广告视频并精准推送,以此提高用户体验以及广告转化效果。

3.虚拟人应用场景更加广泛

2022年,虚拟数字人更加广泛的运用在视听行业的各个领域,展现了广阔的发展前景。但受限于技术、成本、交互性等因素,目前仍处于前期培育阶段。AI手语主播在新闻报道以及大型活动、赛事中的应用越来越普遍,且理解度不断提升。央视频“AI王冠”具备梳理知识结构、形成知识图谱的能力。湖南台“橙双双”、浙江台“谷小雨”、广东台“悦小满”(粤语)等虚拟数字人陆续推出。淘宝、哔哩哔哩、抖音等视听平台以及部分MCN均推出了虚拟电商主播,不少直播间已采用虚拟主播或“真人+虚拟人物”模式直播。

值得注意的是,这也引发了技术滥用的隐忧。大量视听节目中为追逐新概念扎堆运用虚拟数字人、虚拟背景等元宇宙元素,但囿于技术限制,一些虚拟偶像的细节较为粗糙、动作机械,舞台背景与节目主题关联性较低,反而适得其反。

4.新技术推动视听行业赋能千行百业

视听技术日益以实时在线、智能生成、沉浸体验、多维交互等新型产品和解决方案,注入相关行业的生产要素之中,催化、推动了大量新场景、新应用、新模式。如音视频交互和VR技术推动在线会议临场感不断增强,解决了办公、教育等领域难以实地聚集的痛点;国际足联在卡塔尔世界杯中引入的半自动越位识别技术(SAOT),依托12台特种摄像机进行判罚;海尔洗衣机互联工厂通过实时数字孪生、物联网等技术,打造了一个与工厂生产流程同步运行的“透明工厂”。

(二)消费侧,视听呈现强化“交互多维沉浸化”

1.超高清音视频已成为主流呈现方式

一是高清频道已成为电视主流播出方式。截至2022年10月底,全国各级播出机构经批准开办高清/超高清电视频道共1059个,省级台频道高清化率达96%,地级台频道高清化率达86%。今年1月1日起,各广播电视台已无需再在高清电视频道播出画面的右上角标注“高清”字样,这也意味着高清/超高清真正成为电视播出的基本模式。

二是超高清内容生产能力迅速提升。总台已经突破每年5千个小时的4K/8K内容制作,广东省现存4K内容已经超过2万多个小时。爱奇艺、腾讯视频、哔哩哔哩等网络视频平台均开设了4K/8K内容专区,大部分自制、修复以及用户上传内容均支持超高清显示。

三是“双Vivid”标准生态逐步成熟,多项技术实现从无到有突破。HDR Vivid与Audio Vivid标准已逐步形成端到端的全产业链布局,分别在多项重大赛事活动中得到应用。2022年1月,“HDR Vivid”(菁彩HDR)被确立为国家广电行业标准,卡塔尔世界杯直播中,咪咕视频实现了双Vivid标准首次联合应用。“Audio Vivid”(菁彩声)是一种三维声技术标准,首次引入了神经网络技术用于编解码,在提高编码压缩率的同时极大的还原语音质量。

2.VR推动视听产品走向多维度、全感官、强沉浸

视听机构通过VR系列技术实现了虚拟场景与现实舞台巧妙结合,呈现出“时空穿梭”感,如央视新闻新媒体的《三星堆奇幻之旅》、河南台“中国节日”系列节目等。配合可穿戴设备则能实现更为沉浸的观影体验。如在卡塔尔世界杯期间,Pico VR一体机上线多人观影功能以及VR直播和点播内容,可邀请好友实时互动。

3.内容传播与分发更加无界、智能

场景方面,视听内容展现出了更广阔的发展潜力,智能音箱、车载音视频、户外大屏等终端都成为传播渠道。咪咕视频推出车载应用观赛新场景,实现了多视角观赛、AR眼镜互动播放等座舱沉浸式超高清赛事体验。

分发方面,以算法为核心的智能科技近年来在视听领域广泛应用,网络算力升级、算据建设和算法应用加快推进,主流价值对算法的引领力持续增强。一是电视频道的智能化演进有了重要探索。2022年9月起,中国广电集团有线电视智能推荐频道服务在北京、上海、杭州试点上线,创新电视服务形态,通过AI计算,从海量内容库中自动编排、连续推送定制节目。二是5G频道有序推进。12月,广电总局印发《5G频道技术白皮书》,提出5G频道视听新内容、新消费、新沟通以及新入口四大应用场景。三是网络视听平台特别是短视频平台逐步用主流价值优化算法推荐机制,将精准推送和有效供给相结合,优质内容的传播力、影响力有效提升。

三、发展展望:迈向未来电视

当前,我国平均每个家庭可使用的泛智能设备为9.2台,其中有约一半的设备可接入视听节目,形态异常丰富、数量极其巨大的视听消费环境已全面到来,这拓展了视听行业的应用场景,无疑也增强了传统视听的可替代性。对行业是挑战,更是机遇。应从新型视听的研发和现有视听的革新两个维度展望思考。

首先,未来电视的形态已经萌芽。电视的定义已不止于显像管或LED组成的机器,而涵盖了各类视音频媒体。“未来电视”也不会偏安一隅,其既涵盖了视听行业的内容、分发、交互、安全等多个领域,也将以视听作为生产要素催化、驱动、融合多个行业。供给侧,内容生产将进一步向云端迁移,视听产品的形态将持续向沉浸式、多维度发展。互联网迈入AI辅助生产阶段,个人定制化和产业端内容数量将指数级增长,视听也将继续从文娱向工业、民生、安全等多领域拓展,推动视听及相关行业降本提质增效。消费侧,依托5G-A/6G、人机交互、虚拟现实等技术,交互方式更加自然、自由,通过面部表情、眼神交流、轻微肢体动作,甚至脑电波,实现物理世界与虚拟世界的内容无缝融合、实时互动。

其次,当前视听技术领域还存在一些瓶颈和难点。一是视听关键领域研发和应用能力不足,在CMOS、GPU、视听制作软件等领域还存在一些“卡脖子”的技术环节,研发与行业需求的匹配度还需进一步提升。二是各级各类云网、媒资、数据等技术资源较为分散,整体利用率和效能不高。特别是数据作为核心要素的作用发挥还不充分,影响数字化转型和治理能力升级。三是广播电视的部分服务滞后用户需求,新频道、新业务吸引力不足。四是安全形势更为复杂严峻,数据、身份、隐私、内容、金融、炒作等风险隐患交织,影响入局者、投资者、消费者信心。五是新业态存在“规则”真空,比如AIGC的版权归属等。

展望未来,一是加快打通、挖掘行业数据资源,推动广播电视和网络视听技术系统纵向贯通、横向联通,打破数据孤岛和垄断,实现数据高效汇聚、联接、运用,推动构建数据驱动、创新引领的新发展模式。二是以国家战略需求和视听行业需求为导向,聚焦人工智能、虚拟现实、仿真交互等重点领域,推进关键核心技术攻关,提高科技成果转移转化实效。三是管好用好技术,以行业数据治理工作为牵引,全面提升数字治理能力,强化视听安全技术措施同步规划、同步建设、同步使用要求,既守牢安全底线,又留出创新空间。

“犯其至难而图其至远”。未来电视将面临无限广阔、更加开放、竞争更加激烈的发展环境,视听行业应进一步强化技术支撑,以创新驱动构建现代化大视听格局。

(作者:国家广电总局发展研究中心 赵京文)

监 制:杨明品

轮值主编:李秋红

后期编辑:丁 琪

24快报
JSON抓取失败