Рис. 9.30. Временная шкала, показывающая периоды разработки различных стандартов сжатия и совместную работу ITU- T и ISO/IEC
У каждой из этих двух категорий сжатия есть свои преимущества, что зачастую очень затрудняет выбор в пользу какой-либо из них. Обычно в цифровых видеорегистраторах, которые записывают на жесткие диски несколько телекамер в режиме мультиплексирования, применяется сжатие изображения. Некоторые производители используют два различных стандарта сжатия в одном устройстве. В этом случае для локальной записи используется один стандарт сжатия, а для передачи по сети с низкой пропускной способностью — другой стандарт сжатия видеоизображения, который будет более эффективен для этих целей. Поэтому необходимо знать и понимать все стандарты сжатия и каждый раз оценивать достоинства и недостатки всех стандартов по отношению к проектируемой системе наблюдения.
Некоторые специалисты подразделяют стандарты сжатия на группы по принципу того, какая организация (ITU-T или ISO) предложила тот или иной стандарт. Но существует и много самостоятельных разработок отдельных производителей, что не позволяет нам принять такое деление. Более того, при разработке новых стандартов рабочие группы ITU-T и ISO/ЕС работают совместно. В частности новый стандарт сжатия Н.264, работа над которым была начата ITU-T, велась затем совместно с группой ISO/IEC JTC1.
Следующие стандарты сжатия изображения являются наиболее распространенными в видеонаблюдении. Расположены в порядке появления.
— JPEG — Широкораспространенный стандарт сжатия, который существует уже более 15 лет. Использует DCT-преобразование. Используется многими программами, такими, как графические редакторы и веб-броузеры.
— M-JPEG — Это вариант сжатия JPEG и на самом деле не является стандартом. M-JPEG — сокращение от Motion JPEG, где каждое изображение является независимо сжатым телевизионным кадром или полем.
— Wavelet — Очень популярное сжатие в видеонаблюдении. Отличается большей эффективностью при сжатии деталей, так как не делит все изображение на блоки 8x8 пикселов.
— JPEG-2000 — Стандартизованный вариант Wavelet-сжатия. Доступны дополнительные модули JPEG-2000 для различных графических редакторов и веб-броузеров.
— Motion JPEG-2000 — Принцип действия примерно такой же, как у M-JPEG, но в качестве основы используется JPEG-2000. Так выглядит эволюция стандартов сжатия видеоизображения:
— Н.261 — Стандарт для низкой скорости передачи данных, принятый в 1984 ITU для аудиовизуальных сервисов.
— MPEG-1 — Стандарт ISO, созданный как модификация Н.261 для записи видео на компакт-диски при низкой скорости передачи данных (около 1.5 Мбит/с).
— MPEG-2 — Разработан для вещательного телевидения. Использует низкий уровень сжатия для передачи, записи и воспроизведения видео высокого качества. Сейчас используется в большинстве телестудий, на DVD-дисках, на кабельном телевидении, а также в кабельном телевидении и многими производителями цифровых видеорегистраторов.
— Н.263 — Создавался как адаптация MPEG-2 для достижения более высоких уровней сжатия при сохранении высокого качества изображения. Был принят как международный стандарт в 1996 году и пересмотрен в 1998 году. Стандарты Н.263+ и Н.263++ представляют собой усовершенствованные версии Н.263.
— MPEG-4 — Стандарт разрабатывался как объектно-ориентированное сжатие. Существует несколько версий. Сжимает видео и аудио с широким выбором скорости передачи данных. Пригоден для различных областей применения, которые используют низкоскоростные каналы связи, от мобильной телефонии и Интернета до телевидения.
— MPEG-7 — Новый стандарт, предназначенный для описания аудиовизуального содержимого.
— MPEG-21 — Новый стандарт, описывающий общую структуру взаимодействия всех объектов MPEG и пользователей.
— Н.264 — Самый новый стандарт сжатия, который базируется на Н.263 и MPEG-4 (AVC), который предлагает широкий выбор качества, включая более эффективное сжатие для форматов телевидения высокой четкости (заявлено о втрое большей эффективности по сравнению с MPEG-2).
Теперь проанализируем их по отдельности.
JPEG
JPEG расшифровывается как объединенная группа экспертов по машинной обработке фотоизображений (Joint Photographic Experts Group), а это, в свою очередь, является первоначальным названием комитета ISO, который подготовил данный стандарт для цифровой фотографии.
JPEG — это стандартизированный принцип сжатия изображений, который использует DCT-преобразование для уменьшения избыточности изображения. Он ориентирован только на неподвижные цифровые изображения, при этом разрешение изображения в стандарте не прописано. Такими стоп-кадрами в телевидении могут служить либо телевизионные поля, либо телевизионные кадры.
Хотя JPEG широко используется в цифровой фотографии и веб-приложениях, этот стандарт применяется и в видеонаблюдении, где сжатие применяется к оцифрованному видео (телевизионным кадрам и полям), которые обрабатываются как независимые изображения.
Впрочем, JPEG содержит и раздел рекомендаций для сжатия без потерь (с коэффициентом сжатия примерно 2:1), но нас больше интересует способ сжатия JPEG с потерями, когда можно получить коэффициенты сжатия, превышающие 10:1, без заметного ухудшения качества. Работа JPEG основывается на преобразовании блоков, состоящих из 8x8 элементов изображения, на основе дискретного косинусного преобразования (Discrete Cosine Transformation — DCT).
Если изображение с высокой степенью сжатия увеличить, то четко проявляется его блочная структура. Можно достичь степени сжатия до 100 раз. JPEG известен как способ сжатия с потерями, означающий, что, если изображение подвергнется сжатию, то при декомпрессии нельзя получить изображение точно такого же качества, как оригинал. Тем не менее, коэффициенты сжатия, достигаемые с помощью сжатия JPEG, довольно высоки (превышают 10:1), и некоторая потеря качества изображения представляется несущественной для человеческого глаза. JPEG разработан с учетом известных ограничений человеческого глаза, таких, как невосприятие очень мелких деталей цветности, как и мелких деталей яркости в рассматриваемом изображении.
Рис. 9.31. Разбиение на блоки при сжатии JPEG
Для каждого отдельного компонента цвета изображение делится на блоки 8x8, из которых составляется все изображение. Над этими блоками выполняется дискретное косинусное преобразование. Обычно внутри блоков 8x8 значения пикселов изменяются мало. Поэтому энергия имеет низкую пространственную частоту. Преобразование, которое может быть использовано для представления энергии несколькими коэффициентами, является двумерным дискретным косинусным преобразованием блоков 8x8. Это преобразование, широко изучаемое с точки зрения применения его к сжатию изображений, явилось чрезвычайно эффективным для сильно коррелированных данных.
JPEG хранит полную цветовую информацию: 24 бита на пиксел (16 миллионов цветов); можно сравнить, например, с GIF (другая популярная среди пользователей ПК техника сжатия), который может хранить только 8 бит на пиксел (256 или меньшее количество цветов). Полутоновые изображения (в шкале серого) не могут быть сжаты с такими большими коэффициентами компрессии с помощью JPEG, поскольку человеческий глаз намного более чувствителен к изменениям яркости, чем к оттенкам цвета, и JPEG может сжимать данные о цвете в большей степени, чем данные о яркости.
Имеется довольно любопытное наблюдение, которое заключается в том, что JPEG-файл черно-белого изображения всего на 10–25 % меньше, чем полноцветный JPEG-файл визуально подобного качества.
Рис. 9.32. Изображение испытательной таблицы CCTV Labs при записи полями (сжатие JPEG, размер файла 49 кбайт). Увеличенный фрагмент (справа).
Рис. 9.33. Изображение испытательной таблицы CCTV Labs при записи полями (сжатие JPEG, размер файла 15 кбайт). Увеличенный фрагмент (справа).
Кроме того, следует отметить, что JPEG не подходит для штрихового рисунка или текста, поскольку дискретное косинусное преобразование непригодно для очень резких черно-белых переходов.
JPEG может быть использован для сжатия данных из различных цветовых пространств, таких, как RGB (видеосигнал основных цветов изображения), YCbCr (преобразованный видеосигнал) и CMYK (палитра, используемая в издательских системах), поскольку он обращается с цветами как с отдельными компонентами. Наилучшие результаты по сжатию достигаются, если компоненты цвета независимы (некоррелированны), как это имеет место в YCbCr, где большая часть информации сосредоточена в яркости, а меньшая — в цветности.