English version

ТЕСТОВЫЕ ФАЙЛЫ ДЛЯ ОЦЕНКИ ПОМЕХОУСТОЙЧИВОСТИ ВЫДЕЛИТЕЛЕЙ ОСНОВНОГО ТОНА РЕЧИ

Внимание! Часть материалов доступна в электронном виде и может быть загружена на данной странице.

Тестовые файлы предназначены для проверки работы выделителей основного тона (ОТ) речи и оценки их помехоустойчивости при работе в шумах. Используютс две группы тестов - первая группа представляет собой набор протяженных гласных звуков, вторая - фрагменты реальной речи. В качестве помехи используетс белый шум.

Файлы без расширения содержат речевые сигналы и подаются на вход выделител ОТ. Частота дискретизации сигналов равна 8 кГц, формат представления - 16 бит на отсчет, порядок байт - "интел", т.е. младший байт идет первым. Цифра в названии файла указывает на отношение сигнал/шум, суффикс "_CH" обозначает, что речевой файл пропущен через модель телефонного канала связи с полосой пропускания 300-3400 Гц.

Файлы с расширением "pch" содержат синхронную с речевыми файлами опорную разметку траектории периода ОТ для вокализованных фрагментов речи в виде величины равной текущему периоду ОТ, выраженному в отсчетах периода частоты дискретизации, умноженному на 100. Для невокализованных звуков и неопределенных переходных фрагментов речи величина ОТ равна 0. Данные файлы отредактированы вручную и используются для контроля экспериментальных оценок периода ОТ, получаемых на выходе тестируемых выделителей ОТ.

Данные тестовые файлы были разработаны в ходе работы над кандидатской диссертацией для оценки помехоустойчивости выделителей ОТ, предназначенных для использования в низкоскоростных вокодерах и цифровых слуховых аппаратах [1]. По просьбе коллег эти файлы размещены в интернете на странице Центра ЦОС СПб ГУТ (www.dsp.sut.ru, www.dsp-sut.spb.ru) для бесплатного некоммерческого использования с целью унификации способа тестирования выделителей ОТ и сравнения результатов работы алгоритмов выделения ОТ, разработанных различными авторами.

При использовании материалов ссылка на автора обязательна.

Все вопросы и замечания, пожалуйста, направляйте по e-mail, приведенному ниже, подробная контактная информация представлена в разделе "О Центре" .

С уважением,

Владимир Бабкин

Центр ЦОС, СПб ГУТ

23 марта 2005 г.


Документация

Тестовые файлы содержащие речь дикторов

 Имя файла 

 Тип шума 

 Отношение сигнал/шум, дБ 

 Полоса частот, Гц 

 Размер (zip), Мбайт 

 Примечание 

S

 - 

 без шума 

 60-3800 

 2.6 

 Звуковой файл 

S_CH

 - 

 без шума 

 300-3400 

 4 

 Звуковой файл 

S0

 белый 

 0 

 60-3800 

 4.5 

 Звуковой файл 

S0_CH

 белый 

 0 

 300-3400 

 4.5 

 Звуковой файл 

S3

 белый 

 -3 

 60-3800 

 4.6 

 Звуковой файл 

S3_CH

 белый 

 -3 

 300-3400 

 4.6 

 Звуковой файл 

S.PCH

 - 

 - 

 - 

 0.03 

 Файл разметки траектории ОТ 

Тестовые файлы содержащие протяженные гласные звуки

 Имя файла 

 Тип шума 

 Отношение сигнал/шум, дБ 

 Полоса частот, Гц 

 Размер (zip), Мбайт 

 Примечание 

V

 - 

 без шума 

 60-3800 

 1.2 

 Звуковой файл 

V_CH

 - 

 без шума 

 300-3400 

 1.2 

 Звуковой файл 

V0

 белый 

 0 

 60-3800 

 1.2 

 Звуковой файл 

V0_CH

 белый 

 0 

 300-3400 

 1.2 

 Звуковой файл 

V3

 белый 

 -3 

 60-3800 

 1.2 

 Звуковой файл 

V3_CH

 белый 

 -3 

 300-3400 

 1.2 

 Звуковой файл 

V.PCH

 - 

 - 

 - 

 0.008 

 Файл разметки траектории ОТ 



По всем вопросам, пожалуйста, обращайтесь по e-mail:

e-mail в графическом файле

Подробная контактная информация представлена в разделе "О Центре"

Copyright © 1999-2009, Центр ЦОС СПб ГУТ