第一章 概述


说起概述,我的理解有两个方面:一是对此书所写技术发展与展望进行概述,二是对此书所述内容进行概述。而我更倾向于后者,这是因为好的概述对如何使用本书起到至关重要的作用,关于技术发展上的概述将会在本书的最后章节“视频编解码技术发展与展望”做详细地探讨。

本书可以分为四大部分:编解码通用技术(颜色空间、编码结构、帧内预测、帧间预测、变换量化/反量化反变换、环路滤波以及熵编码)、编解码核心技术(参考帧管理、码率控制、率失真优化、网络分层、并行处理以及Smart编码)、编解码扩展技术(屏幕内容编码、可伸缩视频编码、多视点视频编码、立体视频编码以及虚拟现实编码)、硬件编解码技术。

编解码通用技术:编解码通用技术主要是围绕着主流编解码设计方案的各个模块进行介绍,即混合编码框架中的各个模块,主要包括编码结构、帧内预测、帧间预测、变换量化/反量化反变换、环路滤波以及熵编码等。这些模块在不同的视频编码标准中都有着细微的区别,这些区别就是研究各个编码标准的关键所在,因此,在每一章节都会将不同标准中的区别提炼出来,主要包括H.264/HEVC、AVS1/AVS2、SAVC1/SVAC2、VP8/VP9、AV1。为了让读者更好地理解编码输入的格式区别,还在伊始增加了颜色空间这一章节,主要是结合FFMPEG实例进行“工具层面”上的概念介绍和使用方法介绍。

编解码核心技术:编码核心技术主要围绕着关注点较多的几个关键技术,这些技术其实已经在编码框架中的各个模块中涉及到,这里拎出来的主要目的是进行深入的剖析,以便深入浅出地理解视频编码的各个模块。这些技术主要包括参考帧管理、码率控制、率失真优化、网络分层、并行处理以及Smart编码技术。相信对于编解码领域有着硕士或博士经历的童鞋来说,这些核心技术的重要性是不言而喻的。

编解码扩展技术:编解码扩展技术一般就是新的编解码应用应运而生的产物,这里主要介绍屏幕内容编码、可伸缩视频编码、多视点视频编码、立体视频编码以及虚拟现实编码。就拿虚拟现实来说吧,正是近几年虚拟现实应用的大力发展促进了虚拟现实编解码领域的研究,这种善性循环的社会发展潮流注定编解码技术的道路越走越宽。

硬件编解码技术:硬件编解码技术是视频编解码发展的方向之一,主要是因为基于软件算法的视频编解码方法大大消耗了CPU,而基于GPU的编解码算法充分发挥了GPU硬件“快而专”的特点,省出更多的CPU资源去做它擅长的事情。据本人了解,目前这样的产品主要是服务器产品,例如人脸识别服务器、车辆识别服务器等,它们的特点就是利用Intel GPU进行Codec,以便处理更多的视频路数,利用NVIDIA GPU做AI方面的工作,这种“协同作战”的方法也是未来智慧城市中各个产品的套路之一。

为了使得读者更好地掌握视频编解码技术,下面给出几句“老生常谈”的建议(均是本人多年来总结所得):(1)新手入门视频编解码技术,建议从解码器入手,先学会分析码流,再对比标准;(2)预测技术的分析必须着眼于三个关键点,即运动矢量、参考索引以及预测方向;(3)视频编解码技术的掌握必须理论(标准)结合实践(代码),绝不能“纸上谈兵”,切记!

希望“贵客”读完本书,可以完成人生四大愿望(久旱逢甘霖、他乡遇故知、洞房花烛夜、金榜题名时)之一的“久旱逢甘霖”。好吧,开玩笑的,希望本书对你有用!!!

results matching ""

    No results matching ""