Цифровое видео – это не обязательно и далеко не всегда компьютер. Первый цифровой видеомагнитофон появился в 1986 г., когда до начала эры компьютерного мультимедиа было еще далеко. К настоящему времени число цифровых форматов перевалило за десяток.
Стало общим местом утверждение, что цифровая запись всегда превосходит по качеству аналоговую. Цифровое описание считают одним из величайших достижений цивилизации. Как ни забавно, но принципы цифрового кодирования не чужды и природе. Везде, где речь идет о стабильных структурах, начиная от атомов и кончая клетками живых существ, обнаруживается дискретность. Это и понятно: дискретные системы гораздо более помехоустойчивы. Искажения непрерывного сигнала уловить сложно. Малые отклонения вообще незаметны. Однако через несколько актов передачи эти исходно незначительные ошибки могут заметно исказить первоначальную информацию. В своей деятельности человек, как это часто бывает, лишь по-своему реализовал присущие природе принципы.
При этом, однако, следует учитывать, что данные, которые мы оцифровываем, носят аналоговый характер. Поэтому возникает задача не потерять, не исказить информацию при преобразовании непрерывного сигнала в цифровые форматы. Не вдаваясь в технические детали, постараемся выяснить, как это делается.
Принципы цифрового описания
Этот раздел посвящен описанию процессов, происходящих при преобразовании непрерывного сигнала в цифровую форму. Автор постаралась избежать сложных формул и подробностей, касающихся аппаратной реализации преобразований. Заинтересованный читатель без труда найдет эти сведения в специальной литературе, где рассматриваются вопросы теории дискретизации и аналого-цифровые/ цифроаналоговые преобразователи (АЦП/ЦАП).
Принципы и проблемы цифрового описания мало зависят от носителя информации, поэтому изложенные здесь сведения с небольшими оговорками применимы и для компьютерных цифровых изображений.
Дискретизация и квантование
В работе аналоговых устройств мы обычно имеем дело с непрерывным сигналом, изменяющимся по тому или иному закону. В процессе оцифровки с определенной частотой (называемой частотой дискретизации) (рис. 3.1) происходят измерения значений необходимых параметров.
Рис. 3.1. Частота дискретизации и глубина квантования сигнала
Необходимая для качественной оцифровки частота дискретизации непосредственно зависит от полосы частот самого сигнала. При слишком низкой для данного сигнала частоте дискретизации информация о высокочастотных компонентах сигнала будет искажена или утеряна (рис. 3.2).
Рис. 3.2. Искажения высокочастотной компоненты при низкой частоте дискретизации
Поскольку в цифровом описании мы имеем дело с двоичным представлением, полученные значения необходимо воспроизвести в виде двоичного кода. При этом происходит усечение значений параметра до ближайшего допустимого значения (рис. 3.1). Степень числа «два», при которой мы получим нужное число допустимых значений параметра, называется глубиной, или уровнем квантования, или разрядностью слова данных. Уважаемый читатель, не спешите пугаться обилию незнакомых терминов. Разберем несколько примеров. Крайним может быть случай, когда для описания выделен один бит. Тогда параметр может принимать 21 = 2 значения: 0 и 1. Изображение, описанное подобным образом, будет состоять из черных и белых точек. Если, допустим, уровень квантования равен 8, то для описания выделено 8 бит (1 байт), и параметр может принимать 28 = 256 значений, при уровне квантования 10 получим 1024 допустимых значения и т. д. На рис 3.1 имеем 8 допустимых значений (от 0 до 7), соответственно, уровень квантования равен трем.
Параметры одного и того же видеоматериала могут оцифровываться с различной частотой и глубиной. Чем выше частота и глубина оцифровки, тем более качественным будет описание, но тем больше и объем данных.
Рис. 3.3 иллюстрирует двоичное представление сигнала, показанного на рис 3.1. Уровень квантования, как уже было сказано, равен трем. Сигнал принимает значения 3, 4, 5, 6, затем снижается до 5. Первое значение в двоичной форме примет вид 011. Значение 4 – 100 и т. д.
Рис. 3.3. Цифровое представление данных, показанных на рис. 3.1
Возможны два способа передачи оцифрованных данных: параллельный, когда каждый из разрядов передается по отдельной линии, и последовательный, когда данные передаются по одной линии с помощью определенной комбинации импульсов. Параллельная передача обычно быстрее, она используется, например, на шине SCSI.
Естественно, при последовательном кодировании и передаче возникают дополнительные проблемы: как обозначить переход к следующему слову, как своевременно обнаружить ошибку при передаче (ведь ошибка в старшем разряде может полностью исказить данные). Поэтому реально комбинация импульсов может быть достаточно сложной.
Процесс оцифровки – лишь одна из возможностей цифро-аналоговых преобразований. В цифровом виде хорошо хранить, модифицировать и копировать информацию. Но воспринимаем-то мы непрерывные, аналоговые процессы, следовательно, для вывода изображения на экран его необходимо перевести в прежний – аналоговый – формат. При этом в идеальном случае исходный сигнал должен был бы восстановиться в полном объеме. Понятно, что такого не бывает. Во-первых, глубина квантования не бесконечна, поэтому всегда происходит округление значений параметра, и при обратном преобразовании исходные значения уже не восстанавливаются в прежнем виде. Такие искажения называют шумом квантования. Во-вторых, невозможно производить замеры не только с бесконечной глубиной, но и с неограниченной частотой. А если частота дискретизации менее чем в два раза превосходит максимальную частоту в спектре сигнала, высокочастотная компонента не восстановится. Характеристики низкочастотных фильтров, используемых при цифро-аналоговых преобразованиях для сглаживания сигнала, также далеки от идеальных. Поэтому потери информации в процессе аналого-цифровых и цифроаналоговых преобразований неизбежны.
Однако при хороших параметрах оцифровки данных их искажения становятся практически незаметными и на первый план выступают достоинства цифрового описания. Это, прежде всего, возможность многократного копирования без искажений информации. Даже для формата Betacam SP число последовательных копий без ухудшения качества не превышает четырех. Для цифрового видео (если не применять многократную компрессию/декомпрессию) оно не ограничено. Цифровому видео присуща гораздо большая помехоустойчивость. В большинстве форматов существуют механизмы автоматического обнаружения и коррекции ошибок. Кроме того, появляются колоссальные возможности для преобразований изображения (например, для создания эффектов).
Итак, у цифрового описания масса преимуществ, поэтому оно стало популярным задолго до начала эры компьютерного мультимедиа.
Стандарты дискретизации видеосигналов
В большинстве форматов цифрового видео используется компонентная палитра. Весьма популярен стандарт 4:2:2 (YUV2). Речь идет о раздельной оцифровке значений Y, U и V-каналов. Для цифрового кодирования в качестве базовой принята частота 3,375 МГц. Это значение кратно частотам основных стандартов телевизионных изображений: 625/60 и 525/50. Частота дискретизации для конкретного канала вычисляется как произведение базовой частоты на соответствующий коэффициент: 4 для канала Y и 2 для цветоразностных каналов. Таким образом, частота оцифровки яркостного сигнала равна 13,5 МГц. Эта частота соответствует рекомендациям международного стандарта ITU (бывшего CCIR) 601. Схема дискретизации при данной частоте приведена на рис. 3.4.
Рис. 3.4. Дискретизация по стандарту 4:2:2 (YUV2)
Отсюда следует, что каждый пиксел строки имеет собственное значение яркости, но значения каждого из цветоразностных компонентов одинаковы для пары соседних пикселов. При 576 активных строках на кадр с сохранением стандартного для телевидения соотношения ширины изображения к высоте 4:3 получаем 720 активных элементов в строке для сигнала яркости и 360 – для цветоразностных сигналов. (Нарушение соотношения 4:3 приводит к искажению изображения, так что квадратные элементы становятся прямоугольными.) Это исходный, наиболее универсальный формат, такие кадры как раз и поступают на вход систем компрессии. Яркостный сигнал кодируется восемью битами, оба цветоразностных – по 8 бит на пару точек. В результате для описания каждой точки используется 16 бит, однако определяемое таким способом кодирования цветовое пространство соответствует 24-битной палитре – 16 миллионов цветов, где каждая отдельная точка может занимать любое положение в пределах цветового охвата данной палитры. Поэтому при перекодировании из YUV 4:2:2 в 16-битный RGB происходят необратимые потери информации.