Кодек речи RPE-LTP (Regular Pulse Excited Long Term Predictor – линейное пред-сказание с возбуждением регулярной последовательностью импульсов и долговремен-ным предсказанием) используется в стандарте GSM и позволяет уменьшить скорость цифрового потока при передаче речи с 64 кбит/с до 13 кбит/с (почти в пять раз) и во столько же раз увеличить число абонентов, пользующихся мобильной связью в выделенной для неё полосе частот. (Распространено и другое обозначение: RPE-LPС).
Упрощённая структурная схема кодека RPE-LTP приведена на рисунке 4.10.
На вход кодера c аналогово-цифрового преобразователя АЦП поступают восьмираз-рядные отсчёты речевого сигнала S(n) с частотой повторения 8 кГц.
В блоке предварительной обработки кодера осуществляются: предварительные искажения входного сигналас подъемом на верхних частотах; разделение речи на фрагменты по 160 отсчетов (20 мс); взвешивание фрагментов окном Хэмминга (косинус на пьедестале, приподнятый косинус).
Длительность фрагментов выбрана из следующих соображений. При длительности фрагментов речи, равной 20-30 мс, сохраняется корреляция между началом и концом фрагмента, говоря проще, подобие, похожесть. Через 20-30 мс в речи появится пауза или начнётся другое слово, поэтому подобие будет нарушено и предсказать по началу фрагмента его окончание нельзя.
Предварительные искажения улучшают разборчивость речи. На рисунке 4.11 приведён график спектральной плотности речевых сигналов. По графику видно, что составляющие спектра с частотой выше 1 кГц имеют значительно меньший уровень, чем на частотах основного тона (300-500 Гц). Следовательно, они будут маскировать-ся шумами дискретизации и квантования при аналого-цифровом преобразовании. Предварительные искажения, вводимые фильтром верхних частот ФВЧ, увеличивают уровень слабых высокочастотных составляющих входного сигнала, за счёт чего улучшается их различимость на фоне шумов квантования.
Применение окна Хэмминга и вообще оконных функций уменьшает уровень боковых лепестков спектра оцифрованного речевого сигнала, что также улучшает отношение сигнал – шум и разборчивость речи.
Рисунок 4.11 - Спектральная плотность речевых сигналов
Далее каждый фрагмент поступает в блок, содержащий цифровой фильтр кратко-временного предсказания ФКП восьмого порядка и устройство оценки параметров фильтра кратковременного предсказания БОП ФКП. В БОП ФКП определяются пара-метры (8 коэффициентов ai) ФКП, при которых его выходной сигнал (остаток предва-рительного предсказания e(tn)) будет минимальным. Коэффициенты ФКП передаются по каналу связи в декодер. Структурная схема ФКП приведена на рисунке 4.12
ФКП отличается от ЦФ КИХ (см. рисунок 4.7) наличием сумматора 2. В нём из от-счётов входного сигнала, прошедших ЦЛЗ, S(n), вычитаются выходные отсчёты у(tn) ЦФ КИХ и формируется остаток кратковременного предсказания e(tn).
Остаток кратковременного предсказания e(tn) разделяется на субфрагменты по 40 отсчётов (5 мс), которые поступают поступает в блок, содержащий цифровой фильтр долговременного предсказания ФДП первого порядка и устройство оценки парамет-ров фильтра долговременного предсказания БОП ФДП.
В БОП ФДП определяются параметры (масштабный коэффициент g и период ос-новного тона d) ФДП, при которых остаток долговременного предсказания f(tn) будет минимальным. Коэффициенты g и d передаются по каналу связи в декодер.
Из остатка долговременного предсказания формируется сигнал возбуждения, передаваемый по каналу связи, в виде 13 отсчётов для каждого субфрагмента. Для этого сороковой, отсчёт субфрагмента отбрасывается, а первые 39 разбиваются на три последовательности: в первой последовательности - отсчёты с номерами 1, 4…37, во второй - 2, 5…38, в третьей - 3, 6…39.
В качестве сигнала возбуждения выбирается та из последовательностей, энергия которой больше. Эта последовательность и её номер передаются по каналу связи.
Скорость входного цифрового потока 64 кбит/с, а выходного – 13 кбит/с. Таким образом, речевой кодер, устраняя избыточность, сжимает информацию в 4,92 раза.
В блоке формирования сигнала возбуждения декодера восстанавливается последовательность из 13 импульсов возбуждения для каждого из субфрагментов речи, включая амплитуды импульсов и их расположение. Сформированный сигнал возбуждения последовательно проходит синтезирующие фильтры долговременного и кратковременного предсказания и формируются отсчёты выходного цифрового сигала речи со скоростью 64 кбит/с.
В блоке постфильтрации восстановленный цифровой сигнал речи S(tn) подаётся на цифро-аналоговый преобразователь ЦАП, компенсируются предварительные иска-жения, внесенные блоком предварительной обработки входного сигнала кодера и после усиления поступают в телефон.