В НовГУ придумали, как обучить нейросети распознавать эмоции по голосу
В НовГУ придумали, как обучить нейросети распознавать эмоции по голосу
В Новгородском государственном университете имени Ярослава Мудрого разработали методику по созданию датасета для нейросетей. Это набор практических инструкций и рекомендаций, которые объясняют, где и какие данные для создания датасета лучше всего брать. С помощью этой базы данных можно будет обучить нейросети распознавать эмоции по голосу.
Сегодня нейросети активно входят в нашу жизнь и применяются в медицине, финансах, креативных индустриях и других сферах экономики и общества. Они распознают объекты, генерируют контент, делают прогнозы и выполняют много других умных функций.
В отличие от обычных программ им не надо прописывать реакцию на все отдельно взятые ситуации. Используя методы машинного обучения, нейросети анализируют ранее полученные данные, выявляют общие закономерности и делают выводы по каждому новому случаю.
Чтобы программа правильно обучилась этому, ей нужна четко структурированная база данных, которой она будет оперировать. Сейчас в бум нейросетей многие энтузиасты делают хорошие продукты в сфере ИИ и распознавания. Однако они допускают ошибки на стадии формирования датасета для таких программ.Ведь в этом деле много нюансов: технических (например, как соблюсти разные требования к исходным файлам, чтобы сеть верно по ним обучилась), финансовых (можно ли сэкономить при сборе данных из разных источников), юридических (как соблюсти авторские права, обеспечить конфиденциальность данных) и так далее.
Разработанные нами инструкции помогут избежать этих проблем и повысить качество разработок в сфере распознавания эмоций по голосу, рассказал один из авторов инструкций, студент НовГУ направления Информационные системы и технологии Владислав Билев.
Инструкции будут полезны разработчикам русскоязычных программ. Они уже используются в качестве обучающих пособий в университете. Как отметили разработчики, основное преимущество их методических материалов в том, что они универсальны:
С помощью наших методичек можно разработать датасет под конкретные запросы. Например, для узкоспециализированных программ по распознаванию эмоций у людей с дефектами речи. Или, напротив, максимально объемный датасет для улучшения работы голосовых помощников. Это очень удобно, так как из готовых датасетов, что сейчас представлены на рынке, большинство представлено либо на зарубежных языках, либо имеют какие-то недоработки, добавил Владислав Билев.
По информации пресс-службы Новгородского университета.