Препроцессинг речевых данных с целью обучения нейронной сети
Аннотация
Дата поступления статьи: 09.08.2023В данной статье рассматриваются проблемы препроцессинга аудиоданных для дальнейшего применения при обучении нейронной сети. В качестве решения ряда проблем выбран метод с мел-частотными кепстральными коэффициентами, что позволило уменьшить входные данные для обучения, увеличить производительность, улучшить четкость распознавания.
Ключевые слова: машинное обучение, препроцессинг данных, аудиоанализ, мел-кепстральные коэффициенты, извлечение признаков, спектр голосового сигнала, преобразование Фурье, окно Ханна, дискретное косинусное преобразование, короткое преобразование Фурье
1.2.2 - Математическое моделирование, численные методы и комплексы программ
.