Технология: Windows Media Описание:
A: Первая технология для обработки видео под Windows была представлена компанией Microsoft в ноябре 1992 года для Windows 3.1 и носила незатейливое название “Video for Windows” (VFW). С того времени аппаратные средства PC стремительно эволюционировали, вышли новые версии Windows. Технология VFW, имеющая ряд архитектурных ограничений, не могла предоставить приемлемых решений для организации видеоконференций, поддержки TV-тюнеров, работы с полями кадра, декодированием телетекстовых сообщений. Производителям видеооборудования для PC приходилось каждый раз «изобретать велосипед», что бы программное обеспечение могло в полной мере использовать особенности таких устройств как web-камера, TV-тюнер или плата видеозахвата.
Для преодоления этих трудностей Microsoft разработала новую мультимедийную технологию DirectShow, которая очень тесно связана с использованием драйверов нового типа – WDM (Windows drivers model). Помимо универсальности (WDM-драйвера могут работать как в Win98, так и Win2000), WDM-драйвера обладают рядом ценных особенностей, значительно расширяющими возможности по управлению видеоустройствами. В результате, приложения ориентированные на архитектуру WDM-драйверов и технологию DirectShow могут с легкостью работать с любыми устройствами, будь то веб-камера или TV-тюнер, ничего не зная об аппаратных особенностях этих устройств.
Несколько слов о Windows 2000. Для этой операционной системы и для следующей ее версии – Windows XP, использование WDM-драйверов является необходимостью, поскольку старые VFW-драйвера разработанные для семейства Win9x не работают под Windows 2000. В то же время использование Windows 2000 и WDM-драйверов имеет значительные преимущества при захвате и обработке видео: Во-первых, размер .avi-файла может быть совершенно любым, в то время как .avi-файл под Win9x не может быть размером более 4GB. Во-вторых под Win2000 более продвинутые управление памятью, кэширование диска и многозадачность позволяют избежать выпадений кадров на протяжении всего сеанса видеозаписи.
Формат AVI
Широкое распространение формат AVI получил после выхода Video for Windows для
Windows 3.1 в ноябре 1992 года. AVI является специальным случаем формата RIFF
( Resource Interchange File Format). RIFF - универсальный формат для обмена
мультимедиа данных, совместно разработанный Microsoft и IBM. Фактически, RIFF
- аналог формата IFF, созданного Electronic Arts в 1984 году.
Аудио и видео последовательности в AVI файле не содержат временных меток и не создают индексы. Данные упорядочиваются во времени
последовательно, согласно их порядку в AVI файле. Приложение (видеоплеер) должно отображать кадры видеопоследовательности и аудиопоток
согласно частоте кадров и частоте дискретизации соответственно, указанных в заголовках файла.
В связи с большим количеством ограничений базового стандарта AVI, консорциумом
Open Digital Media было разработано расширение формата AVI - OpenDML AVI с
учетом особенностей, требуемых для профессионального производства видео. Данные
расширения включают поддержку полей (не только кадров), размеры файлов больше 1
Гб, временной код и многие другие особенности. Microsoft включила поддержку
OpenDML AVI в DirectShow 5.1 (ActiveMovie 5.1). Это расширение также
используется в различных профессиональных приложениях для производства видео на
PC, в частности DigiSuite(Matrox). Начиная со 2 октября 1997г., спецификация
OpenDML AVI версии 1.02 (датированная 28 февраля 1996г.) доступна на веб-сайте
Matrox Electronic Systems, Ltd. : http://www.matrox.com/videoweb/odmlff2.htm
Технология: Apple QuickTime Описание:
Для популяризации своей технологии QuickTime компания Apple пошла по следующему пути: на своём сайте в специально созданном разделе
Trailers стала размещать рекламные ролики новых фильмов. Каждый клип был закодирован
с использованием кодека Sorenson.
Желающие посмотреть ролики были вынуждены устанавливать у себя пакет QuickTime, что соответственно способствовало его распространению
и популяризации. Значительно позже (в 2003 году) по этому пути пошла компания DivX, которая с 2004 года стала выкладывать ролики в HD
формате, для дальнейшей популяризации своего DivX кодека.
Cinepak - в своё время это был самый популярный кодек. Создавался в самом начале 90-ых годов
фирмой SuperMac для компьютеров с процессорами Motorola 68030 и Intel 386, и с односкоростными дисководами
CD-ROM. Вследствие этого он характеризуется чрезвычайно низкой нагрузкой на процессор. Использует алгоритм
векторного квантования (VQ - Vector Quantization). Всегда сжимает данные, как минимум, в 10 раз. Плохо подходит
для скоростей передачи данных ниже 30Кбайт/с. Включен в стандартную поставку QuickTime и Video for Windows. Файлы
AVI, в которых использован этот кодек, могут быть переведены в формат QuickTime и наоборот без переупаковки.
Позже, компанией CTI была выпущена предварительная версия CinepakPro, но на этом история этого кодека заканчивается
и на данный момент, судя по всему, этот проект уже не существует.
Кодек Sorenson Video - результат десятилетних исследований компании Sorenson Vision. Использует
усовершенствованные алгоритмы векторного квантования и компенсации движения, а также адаптивное управление потоком.
Оптимизирован для работы со скоростями от 2 до 100 Кбайт/с. Качество изображения значительно превышает Cinepak даже
при меньших (до четырёх раз!) размерах файла. Для потоков, характерных для дисков CD-ROM, рекомендуются процессоры
Pentium с частотой выше 120 МГц (а иногда даже Macintosh G3). Для сетевых потоков достаточно любой системы на
Pentium или PowerMac. Сжатие очень медленное.
Включён в стандартную поставку QuickTime 3.0. Может применяться для создания роликов QT VR.
Существует две версии кодировщика: базовая и "для разработчиков". Последняя, позволяет использовать двухпроходный
алгоритм сжатия с переменной скоростью потока (VBR - Variable Bitrate) и переключение на меньшую (кратную) частоту
кадров при воспроизведении на слабых компьютерах; автоматически вставляются ключевые кадры в начале сцены
(аналогично Cinepak). Кроме того, она обеспечивает защиту данных паролем с кодированием (в QuickTime 3.0) и показ
логотипа или знака на фоне видео (с прозрачностью, хранится без потерь, воспроизводится с высоким качеством).
Пока известна лишь одна коммерческая программа, обеспечивающая доступ к этим возможностям, - Media Cleaner
компании Terran Interactive.
Кодек Clear Video, известный также как RealVideo (Fractal), разработан компанией Iterated Systems.
Опирается, как видно из второго названия, на фрактальные методы анализа изображений (защищены патентами) с
межкадровой компрессией. Оптимизирован для использован6ия в Интернет при потоках от 2 до 30 Кбит/с. Требует
мощного компьютера (PowerMac или Pentium), лучше подходит для статичных сцен. Скорость упаковки ниже, чем у
Cinepak. В настоящее время больше не раcпространяется.
escape videostudio - кодек компании Eidos Technologies. Обеспечивает очень быстрое сжатие с
управлением параметрами пространственной и временной компрессии, хотя и требует осторожности из-за возможного
получения большой неоднородности потока. Отличная картинка, даже в очень динамичных сценах. Считается
альтернативой MPEG для CD-ROM (4x и выше) и DVD-ROM из-за более высоких требований к процессору (PowerMac или
Pentium 100 для ролика 320x240 при 15 кадрах/с). Поток больше чем MPEG.
Кодек доступен для QuickTime, Video for Windows, DirectShow (ActiveMovie) и собственной архитектуры Eidos. Текущая
версия для QuickTime имеет некоторые ограничения. В поставку включён модуль Xtra для Macromedia Director,
позволяющий воспроизводить видео на полный экран независимо от разрешения (с интерполяцией).
При воспроизведении с удвоением размера кадра наблюдается характерный эффект чёрных строк.
MPEG
В соответствии со стандартом в кодеках MPEG применяется дискретное косинусное преобразование
(DCT, или ДКП) с межкадровым предсказанием. Основной проблемой являются высокие требования к производительности
системы. MPEG-кодеки имеют высокую чувствительность к потерям пакетов в сетях из-за взаимозависимости кадров (типов
P и B). Данные, упакованные с применением MPEG, часто используются и в других форматах, например QuickTime.
MPEG-1 рассчитан на скорости потока 1-5 Мбит/с, характерные для CD-ROM. Обеспечивает VHS-качество
(352x288, 30 кадров в секунду). Использует сжатие, как видео, так и звука. Частота кадров и разрешение изменяться
не могут. Наиболее популярным было использование MPEG-1 в VideoCD, которые уже себя морально изжили. Для
воспроизведения обычно применяются специальные платы - MPEG-декодеры - или программные декодеры, работающие на
процессорах PowerMac с частотой не менее 120 МГц или на Pentium - не менее 166 МГц.
MPEG-2 рассчитан на поток данных 4-15 Мбит/с. Обеспечивает вещательное качество. Использует
переменную скорость потока данных (VBR - variable bit rate), частота кадров и разрешение могут изменяться.
Применяется в DVD и телевещании. При отличном качестве полноэкранной картинки MPEG-2, однако требует ещё больших
мощностей для воспроизведения. К тому же лицензионных отчислений (от 4 до 40 центов за единицу).
Для Интернета предполагается использовать стандарт MPEG-4, находящийся сейчас в стадии разработки.
Он будет включать интерактивные возможности и специальный язык MSDL (MPEG-4 Syntactic Description Language). Этот
язык позволяет конструировать кодеки из более простых компонентов, которые в свою очередь могут динамически
подгружаться через Интернет. Сжатие видео аналогично H.263. Есть сведения, что в качестве основы будет
использоваться формат файла QuickTime 3.0. Одна из реализаций включена в Microsoft NetShow.
Кодеки для видеоконференций
Симметричный кодек реального времени H.261 (также известный как Px64) - стандарт для
низкопотоковых приложений (видеоконференций). Полоса обычно кратна 64 Кбит/с. Картинка невысокого качества.
Аналогичен MPEG-1 (ДКП с компенсацией движения), но без двунаправленного предсказания (В-кадров). Требует
мощный процессор. Оптимизирован для статичных сцен, сильное межкадровое сжатие.
Кодек H.263 - самый последний стандарт для видеоконференций. Качество изображения улучшено
по сравнению с H.261. Ориентирован на скорость передачи модема 28,8 Кбит/с. Алгоритм аналогичен MPEG (включая
двунаправленное предсказание). Включён в состав QuickTime 3.0.
Новые стандарты приложений для видеоконференций - H.323/H.324 - предполагают использование
кодеков в виде подключаемого модуля.
Другие видеокодеки
Intel Indeo 3 - среднее качество видео для CD-ROM. Работает на старых компьютерах (от Intel
486). Несколько лучше, чем Cinepak, при сюжетах с "говорящей головой", быстрее сжимает. Для WEB не подходит.
Indeo Video Interactive (IVI) - качество видео для CD-ROM; требует компьютер класса Pentium.
Отличное качество изображения (аналогичное MPEG).
Indeo Video Interactive - кодек, основанный на wavelet-компрессии. Отличное качество картинки, но требуется
мощный компьютер. Дополнительно обеспечивает некоторые интерактивные возможности (так называемые горячие зоны)
и прозрачность (chromakey).
Для быстрого предварительного просмотра результатов сжатия включён специальный компрессор - Quick Compressor.
Версия 4 включена Quick Time 3 for Windows, версия 5 - только для Direct Show.
Запутанная ситуация с версиями Indeo для Macintosh привела к невозможности создания файлов, которые могут
воспроизводиться на двух платформах.
Photo-JPEG - фотоизображения. Хорошо подходит для слайд-шоу (очень низкая частота кадров).
Power!Video - качество видео для CD-ROM (4x) и DVD-ROM. Очень высокий поток. Не подходит для
2-скоростных CD-ROM дисководов и WEB.
Apple Video - очень быстрый кодек. Качество картинки обычно хуже, чем Cinepak.
Технологии
Quick Time 3.0 включает поддержку таких типов данных, как звук, видео, текст, поток MPEG,
расширенный набор команд MIDI, векторную графику, панорамы и объекты (QT VR) и 3D. Форматы файловВидео: AVR (Avid Video Resolution), DV, M-JPEG, MPEG-1, OpenDML, QuickTime Movie, AVI (Video
for Windows) Звук: AIFF/AIFC, AU, Audio CD Data, DV, MPEG уровня 1 и 2, Sound Designer II, System 7 Sound, Wave Изображения: BMP, GIF, JPEG/JIFF, MacPaint, PhotoShop, PNG, PICT, QuickDraw GX picture, QuickTime
Image File, Silicon, Graphics Image File, TGA, TIFF Анимация и 3D: 3DMF (3D Meta File), Animated GIF, FLC/FLI, PICS Другие: Text, Standard MIDI, General MIDI, Karaoke
Компания VDOnet создала архитектуру VDOLive специально для использования в Интернете. Она
основана на использовании клиентов и серверов, подстраивающихся под скорость соединения и обеспечивающих
воспроизведение по запросу в реальном времени.
Этот подход отличается от применяемой в Apple "загрузки в процессе" (progressive download), которая гарантирует
отсутствие пауз только в случае, если скорость подкачки по сети выше скорости исчерпания буфера при воспроизведении.
Для VDOPlayer нужен мощный компьютер (PowerMac или Pentium). Клиент постоянно обменивается с сервером информацией
о процессе воспроизведения, что позволяет оптимизировать поток через сеть. Для этого при сжатии файлов применяется
пирамидальная схема хранения данных. Файл в целом рассчитан на канал уровня T1, а на самых медленных линиях
передаются только "вершинки" пирамид, не содержащие подробностей картинки.
При наличии брандмауеров с VDOLive часто возникали сложности, связанные с использованием VDOnet нестандартных
Интернет-протоколов. Упрощённая версия Lite VDO обходится без этих проблем и без специального серевера, но
рассчитана исключительно на низко скоростные сети.
Архитектура RealMedia разработана компанией Progressive Networks, известной своей технологией
RealAudio. Она специально рассчитана на передачу информации по WEB-сетям.
Первая версия ориентирована на видео и звуковые данные (RealVideo). В дальнейшем должна быть обеспечена поддержка
MIDI, текста, векторной графики, анимации и т.п.
Подготовленные материалы могут размещаться на WEB страницах, как посредством специального сервера, так и без него.
В последнем случае теряется возможность оптимизации потока.
Просмотр информации осуществляется через клиента RealPlayer, распространяемого бесплатно, или через модуль plug-in
для браузеров Netscape. Воспроизведение требует достаточно мощного компьютера (PowerMac Pentium-100 Мгц).
Для видеоинформации используются кодеки RealVideo (Standard) или RealVideo (Fractal). Стандартный обеспечивает
переупаковку в реальном масштабе времени и лучше подходит для низких скоростей передачи (до 3 Кбайт/с) и сцен с
движением. Второй кодек является продолжением известного ClearVideo.
В последней версии, названной RealSystem G2, применяется технология SmartSteram. С её помощью
один и тот же компрессированный файл может быть использован для передачи по сети со скоростями от 11 до 32 Кбит/с.
Скорость будет автоматически настраиваться как при снижении качества линии, так и при его повышении.
Применение для видео специальных фильтров уменьшает заметность характерной для компрессированных изображений
блоковой структуры. При этом не возникает общей смазанности, не резкости или уменьшения контрастности мелких
деталей. Для использования этих возможностей, к тому же, не нужно пере компрессировать видео поток.
В дополнение к применяемым RealVideo, RealAudio, RealFlash (Flash) вводятся новые типы данных: RealText (бегущие
строки, новости, курсы акций и т.д.) и RealPix. Предполагается, что RealPix в основном будет использоваться для
создания слайд-шоу, on-line каталогов, альбомов и т.п. в низкоскоростных сетях (показ графики, включая стандартный
JPEG, синхронно со звуком).
Основой RealSystem G2 является язык SMIL.
SMIL
Ещё один стандарт (точнее, рекомендации W3C, разработанные соответствующей рабочей группой, в которую входят
Lucent/Dell Labs, DEC, Microsoft, Netscape, Philips, RealNetworks и Sun) для мультимедиа в Интернете - SMIL
(Synchronized Mutimedia Integrated Language). Этот язык определяет механизмы создания презентаций с использованием
графики, текста, видео и звука ( оцифрованного и MIDI). Все данные синхронизируются по времени, как видно из
названия, и, естественно, предполагается интерактивность.
Основным преимуществом SMIL является его совместимость с XML - будущим стандартом расширяемого языка для Web.
Тэги языка определяют сценарий использования объектов в презентации. Легко изменить, например, время начала
исполнения звукового фрагмента, не меняя собственно содержащий его файл. При этом данные остаются в их собственных
форматах, что облегчает их редактирование. Предусмотрена возможность выбора варианта сценария в зависимости от
скорости канала, настроек браузера пользователя и даже переключение национального языка презентации.
Поддержку новой технологии уже оказали такие разработчики программных средств, как компании Allaire, Digital
Renaissance, Ephyx, LivePicture и Macromedia.
По материалам журнала Мультимедиа
3rd Generation Partnership Project (3GPP) и 3rd Generation Partnership Project 2 (3GPP2) файлы - это стандарт индустриального формата
мультимедия файлов, наиболее часто используемый в беспроводных сетях. Установка этого компонента позволит вам просматривать файлы в
этом формате, включая переданные или присланные по электронной почте с беспроводных устройств.
http://helpqt.apple.com/qthelpwr3/english/QuickTimeHelp/pgs2/qt3gfile.html
3GPP is for GSM networks. With this format, you can use:
MPEG-4 or H.263 video
AAC or AMR audio
3G timed text
3GPP2 is for CDMA 2000 networks. With this format, you can use:
MPEG-4 or H.263 video
AAC, AMR, or QCELP audio
3G timed text
Movie fragments (enables playback to start sooner for longer movies, since only the fragment, not the whole movie, must fit on the handset)
The remaining formats are provided for specific networks. With these formats, you can restrict distribution so that a file can't be transferred from a particular phone (set this option in the Advanced pane). These formats may limit the acceptable file size or data rate; check with the service provider for more information.
3GPP (Mobile MP4) is for NTT DoCoMo's "i-motion" 3G service. With this format, you can use the 3GPP options described above.
3GPP2 (EZmovie) is for KDDI's new 3G network service. This format provides the same options as 3GPP2 (described above), except for QCELP support.
AMC (EZmovie) is for KDDI subscribers with AMC-capable phones. With this format, you can use:
MPEG-4 video
QCELP audio
KDDI's text format
http://helpqt.apple.com/qthelpwr3/english/QuickTimeHelp/pgs2/qt3gadv.html
3G Advanced Options
If your file is in Mobile MP4 or EZmovie format, you can restrict distribution so that once the file is on a handset it can't be sent or copied anywhere else. You can specify how many times the file can play back on the handset once downloaded, or make the file expire after a certain number of days or on a certain date.
With either of the two EZmovie formats, you can further define transfer options.
To current handset: The file can be copied to external memory (such as a flash card), but the file can play only on the same phone.
To current or replacement handset: Allows a user to copy the file to external memory and play the file even if he or she gets a new phone.
"Fragment movie" enables the file to download via HTTP in small pieces so that playback can start faster and so that larger files can be played on the handset (only the fragment, not the entire movie, must fit on the handset at one time).
MJPEG-кодирование (Motion JPEG) - это последовательность кадров, обработанная JPEG-кодеком. Идея JPEG-кодирования проста - изображение по специальному алгоритму разбивается на блоки 16х16, к которым в дальнейшем применяется дискретно-косинусное преобразование. При этом, в зависимости от выбранного качества, наименее значимые с точки зрения алгоритма цвета убираются (или подменяются более значительными в этом блоке), что позволяет значительно уменьшить объём хранимой информации.
Данный алгоритм хорошо себя проявляет на красочных многоцветных фотографиях и очень плохо на картинках, использующих небольшой набор цветов. Цифровая запись в DV-формате основана на аналогичном алгоритме, что и MJPEG.
При использовании MJPEG-кодека средний коэффициент сжатия видеосигнала получается порядка 1:5, видеопоток для стандарта S-VHS составляет 4 Мб/с, в то время как для DV - 3,6 Мб/с.
Алгоритм MJPEG зачастую реализован аппаратно - этим могут похвастаться полупрофессиональные видеокарты и устройства нелинейного монтажа.
MPEG-1 кодирование. Формат MPEG-1 вышел в свет в 1933 году. Поскольку в качестве носителя информации был выбран CD-диск, а на момент выхода стандарта CD-ROM приводы были односкоростными, получилось, что скорость видеопотока в формате MPEG-1 ограничена 150 Кб/с. В реальной жизни это вылилось в формат NTSC 352x240, 30 кадров в секунду и формат PAL/SECAM 352x288, 25 кадров в секунду.
MPEG-2 кодирование. На возникновение и массовое распространение MPEG-2 повлияло три вещи - DVD, цифровое спутниковое телевидение и телевидение высокого разрешения - HDTV. MPEG-2 - это дальнейшее развитие стандарта MPEG-1.
Помимо выросшего разрешения видеоизображения появилась возможность работать с блоками 8х8, 16х8 и 16х16, новые алгоритмы сжатия и удаления избыточной информации, изменяемая точность квантования сигнала.
MPEG-4 кодирование. Стандарт MPEG-4 является, так сказать, шагом в сторону. Его основное предназначение (по мнению разработчиков) - передача достаточно качественного видео в средах (сетях) с относительно малой пропускной способностью.
Основное нововведение в стандарте MPEG-4: в отличие от предыдущих стандартов, которые делили изображение при обработке на прямоугольники, MPEG-4 оперирует объектами произвольной формы. Это позволяет достичь большей степени компрессии при сопоставимом качестве, однако взамен требует заведомо более мощного процессора (от 400 Мгц и выше). Самая популярная на сегодняшний момент разновидность кодека - DivX.
Выбираем интерфейс.
При захвате аналогового видеосигнала на качество полученного изображения влияют многие факторы, в том числе и тип интерфейса, с помощью которого соединяются источник и приёмник видеосигнала. Таких интерфейсов существует несколько:
1. Композит, или RCA, - данный интерфейс используется для соединения видеоустройств стандартов VHS, VHS-C, Video-8. В композитном сигнале совмещены яркостной сигнал , оба цветоразностных и синхроимпульсы. Для подачи такого сигнала необходимо всего два провода (информационный и общий, в качестве последнего используется экранирующая оплётка кабеля).
Из плюсов этого подключения можно отметить его дешевизну, распространённость (реализован в любой модели платы захвата), а так же минимальные требования к пропускной способности канала по сравнению с другими типами сигналов. Отрицательная сторона - наихудшее качество изображения из всех типов интерфейсов, поскольку составляющие, из которых складывается композитный сигнал, ограничиваются по ширине полосы пропускания. В результате реальное разрешение изображения получается порядка 230-280 телевизионных строк, в зависимости от аппаратуры и соединительных кабелей. Этот интерфейс использует разъёмы типа "тюльпан" либо BNC.
2. S-Video - используется в аппаратуре S-VHS, S-VHS-C и Hi-8. Здесь применяются два раздельных канала: яркостной, который так же содержит синхроимпульсы, и сигнал цветности, который содержит оба цветоразностных сигнала. Реальное разрешение изображения получается порядка 400-500 телевизионных строк, в зависимости от аппаратуры и соединительных кабелей. В качестве разъёма используются четырёхштырьковые miniDIN-4.
3. Разъём SCART (RGB+Sync) имеется во многих моделях бытовых видеомагнитофонов и телевизоров. Здесь каждая составляющая видеосигнала передаётся по отдельному проводу, что позволяет достичь максимального качества изображения. Также встречаются интерфейсы с разъёмами miniDIN-9. Если имеющиеся в наличии соединительные шнуры не соответствуют разъёмам на аппаратуре, необходимо приобрести соответствующий переходник или сделать его самостоятельно (см. рис.).
Для подключения цифровых видеозаписывающих устройств используется интерфейс IEEE-1394 FireWire (иногда и USB 2.0), поэтому здесь просто потребуется соответствующий кабель и порт.
http://helpqt.apple.com/qthelpwr2/english/QuickTimeHelp/pgs2/ovFmSet.htm
QuickTime Player Help Overview
With the free version of QuickTime, you can play and create many kinds of files, including video, audio, graphics, and virtual (VR) movies. The free version of QuickTime includes QuickTime Player, which you can use to play media located on your computer's hard disk, a CD, or the Internet.
With the full-featured version, called QuickTime Pro, you can do such things as play movies full screen, save files from the Internet, edit audio and video, add special effects, create slideshows, and convert and save video, audio, and images to more than a dozen standard file formats. You can purchase a registration key to upgrade to QuickTime Pro at www.apple.com/quicktime.