源自BBC的一篇问答式HDR科普,觉得是个蛮好的入门材料故翻译了一下并加入了部分自己的观点(有标注),原文链接在文末。
HDR 是指高动态范围(high dynamic range)。这项技术利用了现代显示设备的能力通过高对比度的方式展现画面。高对比度同样会赋予画面更锐利的印象。HDR 画面可以显示高光和镜面反射以及对于画面暗部的扩展。
有些人说动态范围是显示设备最亮和最暗的比率。这实际上是错误的,因为一些 OLED 显示设备可以实现 0 亮度的输出,(如果按照上述的定义)则会有无限的对比度。这是根本没有意义的。
有另一些人说“动态范围”是显示设备可观测的最亮与最暗的比值。显示设备最暗处会被屏幕反射出的光影响,不仅仅是由屏幕发射的光定义。在广电领域,我们通过一个“PLUGE test pattern”(一种灰阶测试图)来设定黑位。但这种定义实际上仍然不太正确。因为这种测试实际上是不考虑画面质量的。
(对于动态范围)更好的定义是画面最黑与最亮处的比值但同时不会有可观测的“现象”(artefacts)。可能出现的“现象”包括断层(banding)或者“psterisation”(类似于断层),这种现象尤其经常出现于传统的 SDR(标准动态范围)电视,这种问题主要由信号并不充足的量化位深产生。
更加准确地说,这才是显示设备动态范围的准确定义。然而,信号的动态范围却有些差别。信号的动态范围与 PLUGE 标版设定的黑位无关。信号的动态范围是由“ITU-R”定义的即“归一化的名义上的(nominal)黑和白的比值的倒数”。这个定义被广泛地应用于比较(comparative figures)。这实际上是非常误导人的,因为再一次,这种定义是不考虑断层等问题的。因此,显示设备层面的动态范围定义是更为实用的一个指标。
传统的 8 bit SDR 电视的动态范围大约为 32:1 或者说 5 挡(log2(32))。(这样水平的动态范围)听上去挺低的。很多人可能会以为一个 8 bit 的系统至少应有 8 挡的动态范围,但这样的想法实际上是不考虑可能出现在显示设备上的断层问题的。
对比来看,一个打印输出的照片同样只有(比 8 bit SDR 电视)稍大的大约为 6 挡的动态范围(原因在于黑色墨水的反射)。打印出来的照片看起来可以很好看,所以 SDR 电视能够显示好看的画面也不意外。
人眼感知的范围是巨大的,从微弱的星光到太阳(~104 到 105 nits)。这种感知能力的范围至少是 100 万:1 的。但是人眼实际上是在适应光照水平的,这种情况下,在同一刻,人眼可看到的亮度范围实际上是(比上述说明的可感知范围)小很多的一个范围。尽管人眼既可以看到星光也可以看到太阳,但却无法同时看到这二者。毕竟,即便是白天,星星实际上仍在哪里,但我们却看不到它们。这就是因为它们都被太阳光所“淹没”了。
在任何一个单独的场景,人眼的动态范围只有大约 10 000:1(也就是不到 14 挡的水平)。在部分场景下,那些亮度不到最亮处 1/10 000 的地方很可能就被淹没于黑暗中从而不能被看到。
在理想情况下,HDR 视频的静态动态范围应优于人眼可感知的动态范围。所以对于最终的画面,视频的动态范围应至少是 10 000:1。远超人眼的动态范围是无用的。
根据巴顿模型,一个 10 000:1 的动态范围包含约 700 个可察觉的灰阶。尽管这个模型适用的是灰阶,在电视系统中,单独的红、绿、蓝像素通常也会有和亮度构成同样的精确度。因此,单独的“700 红”、“700 绿”、“700 蓝”也会呈现出 10 000:1 的动态范围,同时要去避免断层现象。通常来说,一个 10 bit 信号包含 1024 个码值,这对于 HDR 是必须的,8 bit 是不充分的。
视频信号包含三个颜色元素,红色,绿色,蓝色(即 RGB)。这三个色彩元素可以被看作是一个三维空间。这三个元素的“最大值”(即亮度)和最小值(黑位)定义了一个空间,也就是“色彩空间”。
描述色彩空间的一种方式之一就是“能有多少种色彩和亮度可被信号表达”。值得注意的是,考虑到人类视觉系统的特点,有些即便是可被表达的颜色仍然会较难以察觉。尽管如此,这仍然是一个具有实用意义的定义。
对于一个 8-bit 标准动态范围(SDR)的(TV)信号,有约 250 个 RGB 信号分层(译者注:也就是有 RGB 三色各有 256 种,其中码值为 0 时为黑,如果抛去这一码值,则有 255 种),也就是总共大约 1600 万种颜色和亮度(亮度的区分度)。对于一个 高动态范围(HDR)显示设备,则至少需要 RGB 各 700 种颜色以及 3.4 亿种颜色以及亮度。
译者注:一般来说,我们只会考虑到颜色的种类,而至于亮度则一般不这么表达。我考虑可能是因为毕竟每种码值的搭配实际释放的能量不同,以及考虑到人眼对于不同颜色的接收感知不同,所以也可以说“有多少种亮度”这种说法。
显然,一个 HDR 系统具有数倍于 SDR 系统的色彩空间。而到底大了多少倍,由于人类视觉系统的复杂性,则实际上是难以精确计算出的。
Recommendation ITU-R BT.2100 是一个关于高动态范围项目制作与交互的国际标准。它定义了 HDR 视频的两种格式,PQ 和 HLG。
国际电信联盟(ITU: International Telecommunication Union)是一个顶级的国际标准组织,也是一个联合国的部门。
HLG 是一个相对的(以码值为坐标),场景参考的信号。它是一种先进的 HDR 实现方式。以码值为坐标的场景参考的信号(系统)也同样被应用于例如 BT.601, ITU-R BT.709, ITU-R BT.2020, 索尼的 S-Log, 阿莱的 Log C, 以及 Panavision 的 Panalog。
PQ 是一种绝对的(以实际亮度为坐标),显示参考的信号(系统)。它是一种新的视频制作方法。
PQ 和 HLG 是两种根本上不同的系统。
译者注:通过篇幅和内容的描述相信读者可以感受到作者是更加推崇 HLG 的。但实际上 HLG 和 PQ 只是适用于不同的场景,并无技术上的优劣之分。而作者更加推崇 HLG 则主要是因为 HLG 事实上就是由 BBC 和 NHK 联合研发的更加适用于广电领域的编码方式,所以自然要自吹自擂一下。
“场景参考”是一种较为传统的“视频制作方式” (the conventional approach to video)。信号表明了被摄影机捕捉到的光。
“显示参考” 则直接直接表示实际显示到屏幕上的光的亮度。
场景参考和显示参考的不同是因为从整个的内容制作系统来讲,从摄影机到屏幕并不是线性的。从电影制作的角度来说,视效部门说“总的来说,胶片负片就是一个被编码为 HDR 的 图像,之后经过正片的处理后得出一个经过色调映射的显示参考的图像。” 对于 CGI 来说,画面是基于场景参考制作的以便于进行光线追踪。
相对视频信号是一种传统的视频信号种类,并早已被广泛应用于静态、动态摄影机很长时间。这种信号表示的是相机传感器能够接受到的光的强度的一种比例关系。当然,相机的光圈和快门可以进行大范围的调整以获得最佳画面。通常来说,你很难仅通过摄影机产生的信号去得到场景的亮度。相对信号本质上是一种比例。
绝对视频信号代表的是像素的绝对亮度值。绝对亮度通常可以用“candelas per square meter”(也就是通常所说的 nits)去表示,也就是绝对亮度信号的单位。
目前,PQ 是唯一的使用绝对亮度信号的编码系统。其它所有的视频信号全部都是相对信号。
在现实生活中,我们在它的环境中观察世界。但是我们看屏幕时是在一个可调环境光的环境下。屏幕的亮度和观看亮度总的来说是和实际拍摄的地点非常不同的。人眼对于现实世界和在一个暗淡的环境中看屏幕的适应方式是不同的。通常,我们需要去调整被显示的图像是贴合人眼的适应性调整,以便让图像看上去是正确的。
“渲染意图”是一种端到端,摄影机到屏幕,非线性,有主观意图的调整。它的目的是为了让图像主观地尽可能贴合现实世界。一个“幂函数”或者说 gamma 的非线性曲线已经因为这个目的已经在广播和电影领域被应用多年。HLG 继续使用 gamma 曲线去“呈现”创作意图,PQ 同样使用一条非线性曲线去呈现,但与 HLG 有所不同,这二者在 BT.2100 中有详细定义。
“创作意图” 同样被称为“OOTF”,也就是“光-光-转换函数”。
“创作意图”是视频画面最终呈现出来的一种“结果”,是导演、制片人(以及涉及内容创作流程的诸多人员)希望传达给观众的结果。理想状态下,观看端的观众可以看到精准地看到这种“结果”。“创作意图”也同样被成为“艺术意图”。总的来说,因为观看端屏幕和观看环境的限制,保持最开始的创作意图经常是不现实的。保证三色以及亮度的相同并不能让呈现出来的结果相同。这是因为人眼人眼观看屏幕的结果会受到环境的影响。也正是如此,被显示的画面去要去调整以尽量贴合创作意图。
同样的 10-bit HLG 和 PQ 可以轻松超越人类视觉系统。HLG 可以在最终的屏幕上提供了 16 挡的动态范围(这取决于屏幕的黑位),并且一定程度上在制作阶段如果采用 12-bit 信号则(动态范围)则可能会更高。PQ 提供大约 28 挡的动态范围,远超摄影机、屏幕、人眼的能力。这种宽广的范围对于显示参考这种需要广泛适配性的系统是必要的,从在暗室环境的数字电影到明亮环境的屏幕。极限一点来说,人眼的可感知范围在大约 1 000 000 000:1,一个基于绝对亮度的系统在理想状态需要约 30 挡的动态范围。
HLG 信号可以表现的由 ITU-R BT.2100 中的广色域,并且能够提供一种连续的方式去适配所有屏幕的亮度(最高可达 4000nits)。在一个峰值俩亮度为 1000nits 或更亮的屏幕上,HLG 信号可以提供一个实质上更大的色彩容积相比于 PQ 的端到端流程。
PQ 可以提供一个不被 HLG 支持的高饱和,高亮度高光。HLG 系统不(支持)展示这种颜色是因为这些颜色不会在所有屏幕上以一种感知上一致的方式上呈现。如果这种颜色在 PQ 流程的调色中被制作出来,那么可能在一个可调亮度的屏幕上产生一致的创作意图。对于这种色彩的应用可会导致在不同显示器中再现不一致的,不同亮度图片。
译者注:这段表述实在是有失偏颇。BBC 和 NHK 因为深耕广电领域,所以自然会更加在意兼容性。但事实上上文吹嘘的“色彩一致性”或者所谓的能够更好的传达创作意图实际上也是一种“妥协”。因为只要是基于码值的系统则不可能保证在观看端呈现出来的效果与创作意图统一,只是说用户产生的效果是可预测的。PQ 的兼容性确实比较差,但是如果一旦获得比较标准的 PQ 观看能力则无论是还原创作意图还是最终的显示效果实际上都是要优于 HLG 的。但需要再去重申,这两者只是因为研发意图上有所不同所以呈现出不同的特性,并无优劣之分。
对于 HDR 显示设备,我们实际上会应用种类广泛的屏幕和不同的监看环境,从家庭影院到客厅中的电视。我们已经在行业展示中呈现了 HLG 可以在不同亮度下呈现微不足道的中间调映射错误。
HLG 对不同亮度的屏幕有基于公式的在 ITU-R BT.2100 中详细说明的公式,并且这些调整会由显示设备制造厂商内置进机器中。所以 HLG 可以在一个(600 nits)常规显示器中调色,也可以在(甚至是 4000nits)更亮的显示器上调色,并且在一个可调亮度的显示设备上提供较为一致的观感,这样,(HLG)系统就是独立于屏幕的。
PQ 要求显示器映射,如果最终观看端的亮度低于调色的显示设备则可能会在高光处改变创作意图。静态的显示器映射在 ITU-R BT.2390 中被定义,但这可能会改变创作意图。并且如果观看端的显示亮度高于调色时的监视器则没有被定义(该如何处理)。通过应用元数据,PQ 画面可以更好地被显示器映射以更好还原创作意图,但这种制作流程在广播制作领域是不明确的。
译者注:同样,这一段充斥着大量较为有失偏颇的表述。首先,HLG 实现跟随显示器亮度调节的方式是在 EOTF 函数中引入显示设备亮度这一变量,显示设备不同的亮度可以自然地影响 HLG 的 EOTF 函数。但事实上这种调整的结果并不理想或者说充满妥协。关于 PQ 系统,首先在实际校准过程中,对于高光处的亮度映射并不是必须的,各显示设备厂商通常确实会加入自己的色调映射,这确实会影响创作意图的还原。但通过对 HDR 制作流程的不断完善,PQ 家族例如 HDR10 具有静态元数据,杜比视界和 HDR Vivid 具有动态元数据,这些都可以更好的帮助播放器和显示设备更好的做出色调映射,并且杜比视界在制作端更是实现了允许创作者针对不同亮度进行微调从而输出多个模板进而更好地还原创作意图。而这显然比一条仅仅是引入显示设备亮度作为变量的函数要更加灵活并且极有可能会获得更好的效果。当然,PQ 的流程较为复杂,整个流程中间任何一环的不兼容都可能导致极为灾难的结果,而 HLG 则不会面临这种问题。
这是为了避免已经出货的数以百万计的超高清电视接收器(大概是机顶盒的概念?)不再可用吗?这是正确的,但不仅如此,更为重要的是旨在促进轻松迁移到 HDR 电视制作。与 SDR 显示设备的兼容性允许广电制作端继续使用便宜的传统显示设备。并且,场景参考的方式,不对元数据的要求允许了使用传统的制作工具,编解码器和播放系统。
值得注意的是,HLG 不提供对 BT.709 屏幕的向后兼容,一个色彩空间转换在这里是必须的。在一个 BT.709 的屏幕上会播放 HLG 内容会呈现一种欠饱和的结果,但这仍然对很多不严谨的播放设备来说是足够的。
译者注:终于在第 16 个问题露出了马脚。读者可能会注意到,HLG 并不能自然地支持 BT.709 设备。这意味着,前文 BBC 所提到的兼容性全部建立在一个基于 HLG EOTF 校准的 SDR 显示设备。但事实上,几乎不会有任何一款民用的 SDR 显示设备出场便内置 HLG EOTF。这就意味着前文所说的所谓兼容性基础成为了无稽之谈。当然,后文 BBC 给自己找补说即便是不兼容的也是可以被接受的。关于这点,译者认为读者可以自己去尝试观看一下最终结果。至少在译者看来,那种结果是不可被接受的。
是的……(前文说过了,懒得再翻了)
并不是,HLG 并没有一个目标屏幕显示亮度,因此也就没有“被限制”这么一说。它是一个码值系统。1000nits 是一个典型的目前 HDR 显示设备的峰值亮度,并不是 HLG 的限制。有些消费者的屏幕目前甚至已经可以显示比 1000nits 更亮的亮度,而这实际上在 HLG 系统上被非常高质量地呈现。
事实上正好相反,如果内容是基于 1000nits 峰值亮度进行调色,那么在更亮的显示设备上则会显得暗淡无光。因此,PQ 就有可能使内容过时,除非重新调色。
HLG 不会有任何这样的约束在调色时烧录进素材,因此这实际上是一种更好的格式。因此,作为一个相对亮度的系统,对于具有更亮显示能力的显示设备,更亮的内容可以自然地被显示,并且在更亮的环境中也可以得到适应,结果也是可预测的。
PQ 显示设备的色调映射同样可以类似的方式增加内容的亮度。但是官方并没有给出一个标准的色调映射函数,因此在不同屏幕之间,PQ 的内容是无法被预测的。
译者注:BBC 在这一段已经直接不装了。当然,一个相对亮度的系统确实可以做到不受母版制作规格的限制。但是我们需要明确的是,1000nits 实际已经是一个相对来说足够亮的亮度,更高的亮度未必一定能带来更好的效果。并且考虑到人眼的亮度感知曲线,也可以参考 PQ 曲线在不同亮度区间的码值分布,事实上人眼对 200nits 以下的内容质量是更为敏感的,对于高亮度部分则不太敏感。所以一味的强调对更高亮度的显示设备具有兼容性并且可以持续将内容“变亮”是一个非常值得考虑是否正确的事情。
PQ 系统只有在和调色师相同的情况下才能呈现出完全同样的创作意图。
HLG 在与调色师完全相同的环境下观看一样可以提供完全一致的创作意图。但事实上 HLG 则会在跨设备的情况下提供更好的创作意图传达。
译者注:关于这点,上面已经有所补充,内容正确性值得商榷。
色调映射控制是 PQ 系统在应对不同显示能力和观看环境下所必须的。 PQ 系统具有一个 OOTF 内置在设置里。这个 OOTF 只在调色时所应用的监看设备和环境下才是正确的。元数据则是用来描述这个 OOTF 的,并且在面对一个新的观看布置的时候调整 OOTF 是必须的。这是通过内置在显示设备中的色调映射去实现的。动态元数据在 PQ 内容是基于一个高亮度显示设备调色时非常有用,它可以逐场景地识别哪些信号区间被使用。
HLG 是一个场景参考系统,基于相对亮度,并且也不需要内容的元数据,但却可以自我调整(but will have static signalling to identfy itself as HLG)。当 HLG 信号描述场景时, 它并不嵌入一个 OOTF,也因此不需要元数据。正确的 OOTF 会被自动的完全有显示设备呈现。
译者注:对 BBC 无言以对。当然啦,自然可以想到杜比也会对 HLG 进行一些有失偏颇的描述。
建议直接查看原文。
参见原文。
译者:Daniel
原文链接:https://downloads.bbc.co.uk/rd/pubs/papers/HDR/BBC_HDRTV_FAQ.pdf
受限于译者水平,文中肯定有诸多不足,还望读者多多包涵并批评指正,感谢!