|
Автор: Скотт Морган (Scott Morgan)
Дата: 04.01.2001
Оригинал статьи на : ZDNet.ru
|
MPEG-4: стандарт интерактивного видео
Для тех, кто не в курсе, Moving Picture Experts Group (MPEG) — это рабочая группа, которая совместно с
Международной организацией по стандартизации (International Standards Organization, ISO/IEC)
трудится над стандартами кодирования цифрового аудио и видео. Она занимается созданием и внедрением нескольких аудио- и видеостандартов, включая алгоритмы
компрессии, схемы обработки данных и инструментальные платформы. Больше всего эту группу знают, наверное, как разработчика схемы компрессии MPEG-1 Audio Layer 3
(MP3), но она создала и ряд других технологических стандартов, которыми мы, сами того не подозревая, ежедневно пользуемся, когда смотрим телевизор и работаем с
компьютером.
MPEG движется поэтапно и к настоящему моменту выпустила стандарт хранения и воспроизведения видео и аудио MPEG-1; стандарт цифрового телевидения MPEG-2 и
стандарт мультимедиа-приложений MPEG-4. В стадии разработки находится стандарт представления контента MPEG-7, включающий в себя «интерфейс описания
мультимедийного контента».
Стандарт MPEG-4
Работа над стандартом MPEG-4 «Кодирование аудиовизуальных объектов» началась в 1993
году, а первый набор стандартов (версия 1) был утвержден в октябре 1998 года. Значительное расширение этого стандарта (версия 2) было утверждено в 1999 году. В
том же году MPEG-4 получил официальный статус стандарта ISO/IEC, несмотря на продолжающуюся разработку расширений по определенным разделам.
Целью MPEG-4 было создание стандарта кодирования на основе объектов, который обеспечил бы авторов, сервис-провайдеров и конечных пользователей гибкими
средствами работы с мультимедийным контентом. Кроме натурального аудио- и видеоконтента (аудио- и видеозаписей), стандарт MPEG-4 работает с синтезированными
(сгенерированными на компьютере) аудио- и видеообъектами.
MPEG-4 обеспечивает необходимые средства для описания взаимного расположения таких объектов в пространстве и времени с целью их интерактивной доставки.
Кроме того, при разработке стандарта MPEG-4 решались проблемы обеспечения воспроизведения таких объектов в различных условиях. Был разработан формат,
допускающий «универсальный доступ» к мультимедийной информации с учетом возможных ограничений полосы пропускания, возникающих в сетях при самых разных условиях.
Стандарт MPEG-4 подразделяется на три главных раздела: видео, аудио и системы. Первоначально стандарт предназначался для решения нескольких задач, возникших
в связи с быстрым развитием интерактивных технологий: универсальный доступ и распространение в ненадежной среде; широкие интерактивные функциональные
возможности; кодирование натуральных и синтезированных данных; эффективная компрессия и др. Системный раздел стандарта выполняет роль клея, на котором
держится композиция MPEG-4; в него входят инструкции по воспроизведению интерактивного контента и взаимному размещению объектов. Это существенное
развитие стандарта MPEG-4 по сравнению с предыдущими стандартами MPEG, представлявшими собой относительно линейные технологии, не решавшие проблем
интерактивности, характерных для CD-ROM, DVD-ROM, интернета и т.п.
Видеофункции MPEG-4
В основу видеофункций стандарта MPEG-4 была положена технология Apple Quicktime; эти функции
обслуживают широкий набор форматов и значений скорости передачи данных. Они охватывают методы прогрессивного и чересстрочного сканирования, произвольные значения
пространственного разрешения в диапазоне от 8*8 до 2048*2048 и скорости передачи данных в диапазоне от 5 Кбит/с до 10 Мбит/с. В MPEG-4 усовершенствована и
компрессия, качество и эффективность которой повышены при всех поддерживаемых значениях скорости передачи данных.
В принципе, MPEG-4 осуществляет компрессию обычных и видеоизображений теми же методами, что и MPEG-1/2. Эти методы заключаются в том, что сначала
осуществляется прогнозирование движения для следующего видеокадра, а затем выполняется кодирование текстуры. При реализации традиционных методов кодирования
в MPEG-4 поддерживается гораздо более широкий диапазон значений частоты кадров, а дальнейшие разработки направлены на полную замену методов, устанавливаемых
стандартом MPEG-2.
Кроме традиционного кодирования, основанного на прямоугольных кадрах, MPEG-4 обеспечивает возможность индивидуально кодировать специфические медиаэлементы
в рамках сюжета. Так как разные объекты, используемые в сюжете, могут иметь разную природу (текстурный фон, персонажи переднего плана), независимые инструменты
компрессии, используемые для разных типов контента, позволяют добиться более высокой ее эффективности.
Индивидуальные объекты
Основная задача MPEG-4 — не компрессия прямоугольных видеокадров, как у предыдущих стандартов MPEG. В отличие от линейных механизмов кодирования кадров
MPEG-1 и MPEG-2, стандарт MPEG-4 использует принцип кодирования индивидуальных объектов произвольной формы. Кодирование формы, или альфа-канала, означает,
что произвольная форма в сцене MPEG-4 может отслеживаться посредством двоичной альфа-карты, определяющей принадлежность данного пиксела к объекту. Это особенно
полезно для разработчиков интерактивного контента по нескольким причинам. Во-первых, видеоинформация необязательно должна быть оформлена в виде прямоугольных
кадров. Во-вторых, применяя раздел MPEG-4 Systems, индивидуально закодированные видеоформы можно интегрировать с другими объектами, такими как 2D-, 3D- или
естественный видеофон, образуя сцены. Наконец, особый интерес для разработчиков интерактивного контента представляет возможность использования отдельных
объектов в качестве элементов интерактивного действия. Примерами могут служить простые взаимосвязи в рамках сюжета или смоделированные персонажи, реагирующие
на действия пользователя.
Результатом такой объектной ориентации стала возможность интеграции естественных и синтетических видеоисточников. Стандарт MPEG-4 содержит средства интеграции
для кодирования растровых видеоизображений и средства создания и интеграции синтезированных 2D- и 3D-элементов, включая геометрические формы и объекты, текст и
синтезированную графику. Стандартизованные в MPEG-4 параметры физиономической анимации позволяют маркировать и анимировать синтезированные персонажи.
Интерактивность — главное преимущество, которого добивались разработчики MPEG-4. Интерактивное взаимодействие медиаобъектов в видеопотоке подчиняется параметрам,
устанавливаемым автором сюжета. Диапазон интерактивных возможностей в сюжете MPEG-4 охватывает такие действия, как навигация, зависящая от точки зрения (с
соответствующим изменением аудио- и видеопотоков); движение объектов в пределах сюжета; выбор национального языка и т.п.
По материалам www.3dnews.ru
|