Кодек речи RPE-LTP

Кодек речи RPE-LTP (Regular Pulse Excited Long Term Predictor – линейное пред-сказание с возбуждением регулярной последовательностью импульсов и долговремен-ным предсказанием) используется в стандарте GSM и позволяет уменьшить скорость цифрового потока при передаче речи с 64 кбит/с до 13 кбит/с (почти в пять раз) и во столько же раз увеличить число абонентов, пользующихся мобильной связью в выделенной для неё полосе частот. (Распространено и другое обозначение: RPE-LPС).

Упрощённая структурная схема кодека RPE-LTP приведена на рисунке 4.10.

На вход кодера c аналогово-цифрового преобразователя АЦП поступают восьмираз-рядные отсчёты речевого сигнала S(n) с частотой повторения 8 кГц.

В блоке предварительной обработки кодера осуществляются: предварительные искажения входного сигналас подъемом на верхних частотах; разделение речи на фрагменты по 160 отсчетов (20 мс); взвешивание фрагментов окном Хэмминга (косинус на пьедестале, приподнятый косинус).

Длительность фрагментов выбрана из следующих соображений. При длительности фрагментов речи, равной 20-30 мс, сохраняется корреляция между началом и концом фрагмента, говоря проще, подобие, похожесть. Через 20-30 мс в речи появится пауза или начнётся другое слово, поэтому подобие будет нарушено и предсказать по началу фрагмента его окончание нельзя.

Предварительные искажения улучшают разборчивость речи. На рисунке 4.11 приведён график спектральной плотности речевых сигналов. По графику видно, что составляющие спектра с частотой выше 1 кГц имеют значительно меньший уровень, чем на частотах основного тона (300-500 Гц). Следовательно, они будут маскировать-ся шумами дискретизации и квантования при аналого-цифровом преобразовании. Предварительные искажения, вводимые фильтром верхних частот ФВЧ, увеличивают уровень слабых высокочастотных составляющих входного сигнала, за счёт чего улучшается их различимость на фоне шумов квантования.

Применение окна Хэмминга и вообще оконных функций уменьшает уровень боковых лепестков спектра оцифрованного речевого сигнала, что также улучшает отношение сигнал – шум и разборчивость речи.

Рисунок 4.10 – Упрощённая структурная схема речевого кодека RPE-LTP

Рисунок 4.11 - Спектральная плотность речевых сигналов

Далее каждый фрагмент поступает в блок, содержащий цифровой фильтр кратко-временного предсказания ФКП восьмого порядка и устройство оценки параметров фильтра кратковременного предсказания БОП ФКП. В БОП ФКП определяются пара-метры (8 коэффициентов a_i) ФКП, при которых его выходной сигнал (остаток предва-рительного предсказания e(t_n)) будет минимальным. Коэффициенты ФКП передаются по каналу связи в декодер. Структурная схема ФКП приведена на рисунке 4.12

Рисунок 4.12 – Структурная схема фильтра кратковременного предсказания

ФКП отличается от ЦФ КИХ (см. рисунок 4.7) наличием сумматора 2. В нём из от-счётов входного сигнала, прошедших ЦЛЗ, S(n), вычитаются выходные отсчёты у(t_n) ЦФ КИХ и формируется остаток кратковременного предсказания e(t_n).

Остаток кратковременного предсказания e(t_n) разделяется на субфрагменты по 40 отсчётов (5 мс), которые поступают поступает в блок, содержащий цифровой фильтр долговременного предсказания ФДП первого порядка и устройство оценки парамет-ров фильтра долговременного предсказания БОП ФДП.

В БОП ФДП определяются параметры (масштабный коэффициент g и период ос-новного тона d) ФДП, при которых остаток долговременного предсказания f(t_n) будет минимальным. Коэффициенты g и d передаются по каналу связи в декодер.

Из остатка долговременного предсказания формируется сигнал возбуждения, передаваемый по каналу связи, в виде 13 отсчётов для каждого субфрагмента. Для этого сороковой, отсчёт субфрагмента отбрасывается, а первые 39 разбиваются на три последовательности: в первой последовательности - отсчёты с номерами 1, 4…37, во второй - 2, 5…38, в третьей - 3, 6…39.

В качестве сигнала возбуждения выбирается та из последовательностей, энергия которой больше. Эта последовательность и её номер передаются по каналу связи.

Скорость входного цифрового потока 64 кбит/с, а выходного – 13 кбит/с. Таким образом, речевой кодер, устраняя избыточность, сжимает информацию в 4,92 раза.

В блоке формирования сигнала возбуждения декодера восстанавливается последовательность из 13 импульсов возбуждения для каждого из субфрагментов речи, включая амплитуды импульсов и их расположение. Сформированный сигнал возбуждения последовательно проходит синтезирующие фильтры долговременного и кратковременного предсказания и формируются отсчёты выходного цифрового сигала речи со скоростью 64 кбит/с.

В блоке постфильтрации восстановленный цифровой сигнал речи S(t_n) подаётся на цифро-аналоговый преобразователь ЦАП, компенсируются предварительные иска-жения, внесенные блоком предварительной обработки входного сигнала кодера и после усиления поступают в телефон.