English version

Вокодер LPC2400 на 2.4 кбит/с

Разработчики для скорости 2400 бит/с выбрали вокодер с линейным предсказанием.

Структурно вокодер состоит из двух частей. Первая часть - анализатор, функции которого заключаются в выделении текущих параметров речевого сигнала и их упаковке в кадр соответствующего формата.

Вторая часть - синтезатор по принятому кадру восстанавливает с некоторой ошибкой параметры текущего фрагмента сигнала и с их помощью воспроизводит синтетическую речь.

Цифровой сигнал поступает на предыскажающий фильтр (1-0.9375*z-1) и далее из него посредством полусинхронной с основным тоном процедуры выделяется фрагмент анализа. Предыскажение, кроме компенсации высокочастотной части спектра речевого сигнала, служит для снижения необходимой точности вычислений.

Полусинхронная с основным тоном процедура выделения фрагмента анализа заключается во взвешивании фрагмента треугольным окном переменной длины, зависящей от текущего основного тона. Треугольное окно в данном варианте алгоритма располагается в центре фрагмента. После получения фрагмента анализа коэффициенты линейного предсказания вычисляются путем использовани ковариационного метода. Выбор ковариационного метода (среди двух возможных: автокорреляционного и ковариационного) обусловлен тем, что длина фрагмента анализа определяется основным тоном, а при возможных малых значениях длины фрагмента автокорреляционный метод даст значительные искажения текущего спектра сигнала.

Оценка периода основного тона производится по алгоритму, основанному на базе метода Голда-Рабинера.

В канал связи передаются квантованные логарифмы отношени площадей (LAR). При этом квантование производится по неравномерным квантователям. Значение LAR1 на вокализованных и шумовых фрагментах квантуются различными квантователями.

В синтезаторе производится задержка на 1 кадр, поэтому сглаживание канальных ошибок производится на основе принятых параметров из трех текущих кадров - прошлого, настоящего и будущего. Степень сглаживани параметров зависит от числа детектированных канальных ошибок. При увеличении числа ошибок в канале степень сглаженности возрастает.

Сглаженные параметры после интерполяции поступают на синтезирующий фильтр. В настоящем алгоритме приняты следующие правила для интерполяции:

  • LAR на вокализованных фрагментах интерполируются на каждом периоде основного тона;

  • Основной тон линейно интерполируется на каждом периоде сигнала;

  • LAR не интерполируются на невокализованных фрагментах.

В качестве возбуждения на невокализованных фрагментах используется белый шум, а на вокализованных - импульсный отклик фазового звена.

Синтезирующий фильтр реализуется в прямом виде. Его коэффициенты представлены с 16-разрядной точностью. Выходной сигнал пропускается через фильтр, обратный предыскажающему, и после цифро-аналогового преобразовани синтетический сигнал поступает на выход.


Более подробное описание алгоритма речевого кодирования LPC2400 на скорости 2400 бит/с можно найти в:

  • Linear-Rrediction Vocoder for Speech Transmission with 2.4(1.2) kbit/sec rate, St.Petersburg State University of Telecommunication DSP Center, St.Petersburg, 1994

  • Implementation of HF Modem for Digital Data Transmission, St.Petersburg Bonch-Bruevich State University of Telecommunication DSP Center, St.Petersburg, 1996

[наверх] [на главную]


Реализация для ЦПОС семейства TMS320C3x

Алгоритм реализован для ЦПОС семейства TMS320C3x фирмы Texas Instruments.

Реализация удовлетворяет следующим требованиям:

  • функционирует в режиме реального времени;
  • совместима со всеми ЦПОС в рамках семейства TMS320C3x

Ресурсоемкость реализации для TMS320C3x

Загрузка процессора

 

Кодер

Декодер

Вычислительный ресурс (пиковая загрузка на один канал), млн.оп./с.

7.45

3.16

10.61

Память

программа, К слов

6.00

таблицы, К слов

0.92

данные, К слов

4.26

Всего, К слов

11.18

[наверх] [на главную]

Звук

По следующим звуковым файлам вы сможете оценить качество алгоритма LPC2400:

Исходная речь

fspeech.wav

Речь, упакованная кодером LPC2400 и восстановленная декодером LPC2400 при нулевых потерях

fspeech_lpc2400.wav

[наверх] [на главную]

Документация

Можно получить подробную документацию по представленным реализациям алгоритма LPC2400, описание API реализации, подробные инструкции по встраиванию алгоритма в систему обработки речевых сигналов:
LPC2400 для TMS320C3x (формат Word)

[наверх] [на главную]


Навигация

Описание рекомендации

Реализация для TMS320C3x

Звук

Документация


По вопросам приобретения библиотек, исходных текстов программ или реализаций готовых устройств на основе малогабаритных DSP модулей обращайтесь по e-mail:

e-mail в графическом файле

Подробная контактная информация представлена в разделе "О Центре"

Copyright © 1999-2009, Центр ЦОС СПб ГУТ