русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Алгоритм сжатия звукоданных кодерами третьего уровня


Дата добавления: 2014-11-27; просмотров: 826; Нарушение авторских прав


 

Кодер Уровня III использует усовершенствованный алгоритм кодирования с дополнительным ДКП. Структурная схема кодера показана на рис. 3.1.

Основной недостаток кодеров второго уровня - неэффективная обработка быстро изменяющихся переходов и скачков уровня звука - устраняется благодаря введению двух видов блоков ДКП - «длинного» с 18 отсчетами и «короткого» с 6 отсчетами.

 

 

Рисунок 3.1 Структурная схема звукового кодера третьего уровня

 

Выбор режима осуществляется адаптивно путем переключения оконных функций в каждой из 32 частотных полос. Длинные блоки обеспечивают лучшее частотное разрешение сигнала со стандартными характеристиками, в то время как короткие блоки улучшают обработку быстрых переходов. В одном кадре могут быть как длинные, так и короткие блоки, однако общее число коэффициентов ДКП не изменяется, так как вместо одного длинного передаются три коротких блока.

Для улучшения кодирования применяются также следующие усовершенствования:

1. Неравномерное квантование (квантователь возводит отсчеты в степень 3/4 перед квантованием для улучшения отношения сигнал-шум; соответственно, декодер возводит их в степень 4/3 для обратной линеаризации).

2. В отличие от кодеров первого и второго уровней, на третьем уровне масштабирующие множители присваиваются не каждой из 32 частотных полос БФ, а полосам масштабирования - участкам спектра, не связанным с этими полосами и примерно соответствующим критическим полосам.

3. Энтропийное кодирование квантованных коэффициентов кодом Хаффмана.

4. Наличие «резервуара битов» - запаса, который кодер создает в периоды стационарного входного сигнала.

Улучшение частотного разрешения при введении дополнительного ДКП влечет за собой значительное ухудшение временного разрешения, проявляющееся в виде предэхо. В кодере имеются средства для борьбы с этим явлением. Во-первых, ПАМ модифицирована для обнаружения условий возникновения предэхо, во-вторых, имеется резервуар неиспользованных битов, из которого кодер может занять на короткое время необходимые ему биты для снижения шумов квантования, в-третьих, кодер может переключаться в режим коротких блоков.



Существенное отличие кодера третьего уровня от кодеров нижних уровней сложный адаптивный алгоритм распределения битов. Он включает две вложенные одна в другую итерационные петли: внутреннюю - петлю скорости потока, и внешнюю петлю управления шумами квантования. Расчет параметров кодирования начинается со значения масштабирующего множителя, равного 1. Если в первый момент скорость потока на выходе кодера Хаффмана превышает заданную, увеличивается шаг квантования до тех пор, пока скорость не войдет в заданные пределы. Далее рассчитывается шум квантования в данной частотной полосе и сравнивается с порогом маскирования, сообщенным психоакустической моделью. Масштабирующий множитель изменяется таким образом, чтобы сблизить эти значения. Однако новое значение масштабирующего множителя означает изменение шага квантования и, следовательно, скорости потока, а потому внутренняя петля должна каждый раз отрабатывать и вычислять новое значение коэффициента усиления и шага квантования. Если итерационный процесс во внутренней петле всегда сходится, то во внешней петле он может расходиться. Итерационный процесс заканчивается в одном из трех случаев:

1. Шумы квантования во всех полосах масштабирования не превышают допустимых.

2. Следующая итерация приведет к возрастанию усиления в одной из полос выше допустимого.

3. Следующая итерация требует увеличения усиления во всех полосах масштабирования.

В реальных кодерах накладывается еще и временное ограничение.

Кодер третьего уровня более полно обрабатывает стереосигнал в формате joint stereo. Если кодеры нижележащих уровней работают только в режиме кодирования по интенсивности, когда левый и правый каналы в полосах выше 2 кГц кодируются как один сигнал (но с независимыми масштабирующими множителями), кодер третьего уровня может работать и в режиме «сумма-разность», обеспечивая более высокую степень сжатия разностного канала.

Структура элементарных потоков звукоданных несколько различается для разных уровней. На рис. 3.2 показана последовательность звукоданных Уровня I. Пакет начинается с заголовка длиной 32 бита, имеющего одинаковую структуру для всех уровней, который включает синхрослово из 12 единиц и более десятка указателей и флагов. Флаг ID указывает принадлежность потока («1» - МРЕG-1, «0» - МРЕG-2), флаг уровня идентифицирует уровень кодирования («01» = 1, «10» = 2, «11» = 3), четырехбитовый указатель скорости потока ссылается на стандартизованную таблицу, где перечислены возможные скорости потока, табулированы также значения частоты дискретизации, которые сообщает соответствующий указатель (для МРЕG-1 только 48, 44,1 и 32 кГц), флаг режима определяет число каналов звука (не более двух для МРЕG-1).

 

Рисунок 3.2 Структура потока звукового кодера I и II уровней

 

 

Рисунок 3.3 Структура потока звукового кодера III уровня

 

Следующее поле после заголовка занимают коды распределения битов, затем в потоке передаются 32 масштабирующих множителя и 384 отсчета звукового кадра, группами по 32 отсчета (по одному отсчету из каждого поддиапазона). Замыкает пакет поле дополнительных данных переменной длины, используемое в стандарте МРЕG-2 для передачи многоканальных сигналов, отсчетов с пониженной частотой дискретизации и других данных, не совместимых с синтаксисом МРЕG-1.

Отличие формата Уровня II от Уровня I незначительно и заключается в передаче дополнительной информации о выборе шкалы квантования для каждой из 32 полос, т.к. не все масштабирующие множители могут передаваться в потоке. Более сложная структура пакета у кодера третьего уровня. Здесь для каждого звукового кадра передаются заголовок, дополнительная информация и основные данные, причем неиспользованная часть области основных данных предшествующих кадров (резервуар битов) может быть заимствована последующим кадром, испытывающим нехватку битов (рис. 3.3).

 

 

ЛИТЕРАТУРА

 

Основная

 

1. Телевидение: Учеб. для студ. вузов, обучающихся по направлению "Телекоммуникации", спец. "Радиосвязь, радиовещание и телевидение"/ ред. Джакония В.Е.. - 2-е изд.. - М.: Горячая линия - Телеком, 2002. - 639с.

2. Основы электроники, радиотехники и связи: учеб. пособие/ А.Д. Гуменюк [и др.]; под ред. Г.Д. Петрухина. - М.: Горячая линия - Телеком, 2008. - 480 с.

3. Мамчев Г.В. Основы радиосвязи и телевидения: учеб. пособие для студ. вузов/ Г.В. Мамчев. - М.: Горячая линия - Телеком, 2007. - 414 с.

4. Телекоммуникационные системы и сети: в 3-х т.: учеб. пособие для студ. вузов связи и колледжей. - 3-е изд., испр. и доп. - М.: Горячая линия - Телеком. - 2005. - Т.1: Крук Б.И. Современные технологии/ Б.И. Крук, В.Н. Попантонопуло, В.П. Шу-валов. - 2005. - 647 с.

5. Телекоммуникационные системы и сети: учеб. пособие для студентов вузов связи и колледжей: в 3 т./ Г.П. Катунин, Г.В. Мамчев, В.Н. Попантонопуло, В.П. Шувалов. - 2-е изд., испр. и доп.. - М.: Горячая линия -Телеком. - 2004. Т. 2: Радиосвязь, радиовещание, телевидение. - 2004. - 672 с.

6. Птачек М. Цифровое телевидение. Теория и техника: научное издание/ Птачек М. - М.: Радио и связь, 1990. - 528с.

7. Амочаева Г.Г. Электронный конспект лекций.

 

Дополнительная

 

1. Андердал К. Цифровое видео для "чайников": пер. с англ./ К. Андердал. - 3-е изд. - М.: Вильямс: Диалектика, 2005. - 346 с.

2. Блейк Б. 50 эффективных приемов создания и обработки цифрового видео: научное издание/ Б. Блейк, Д. Сахлин. - М.: Вильямс: Диалектика, 2006. - 399 с.

3. Быков Р.Е. Телевидение: Учеб. пособ. для студ. радиотехн. спец. вузов/ Быков Р.Е., Сигалов В.М., Эйссенгардт Г.А.. - М.: Высш. шк., 1988. - 248с.

4. Внедрение цифрового телерадиовещания: проблемы, ключевые факторы успеха: научное издание/ под ред.: Ш. Ж. Сеилова, Ш. Ж. Бутенко. - Астана: Елорда, 2009. - 359 с.

5. Гусятинский И. А. Радиосвязь и радиовещание: научное издание/ Гусятинский И.А., Пирогов А.А.. - М.: Сов. радио, 1974. - 174с.

 




<== предыдущая лекция | следующая лекция ==>
Алгоритмы сжатия звукоданных кодерами первого и второго уровней | Общие сведения


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 2.521 сек.