• 237 мемориалов отреставрируют в Иркутской области в этом году
  • В Иркутске зальют 27 катков для массового и спортивного катания
  • Иркутянина осудили за незаконную прослушку чужих разговоров

Главная > Новости > Общество 10.06.2020 19:37

«Вконтакте» научилась превращать голосовые сообщения в текст. Пока получается не очень

Андрей Блинов

Андрей Блинов

0 Читать комментарии
«Вконтакте» научилась превращать голосовые сообщения в текст. Пока получается не очень - Верблюд в огне

Stroganova/Pixabay.com

«Вконтакте» запустила функцию распознавания голосовых сообщений в мобильном приложении. Она уже доступна у части пользователей, а у всех появится в ближайшую неделю, сообщила пресс-служба соцсети.

По нажатию одной кнопки можно превратить аудио в текст, за это отвечают специально созданные нейросети. Распознавать можно как полученные, так и отправленные сообщения длительностью до 30 секунд — это 90% от всех аудио, которые записывают при общении в соцсети. Позднее функция должна появиться в версии для ПК, а расшифровывать можно будет как более длинные, так и пересланные сообщения.

«Нейросеть должна не просто понять речь, но и сформулировать связный текст. Поэтому на самом деле мы сделали три нейросети: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания», — заявил директор по исследованиям в области ИИ «Вконтакте».

«Верблюд» проверил, как работает функция, и оказалось, что чаще всего нейросеть неверно распознает слова.

Некоторые пользователи предложили разработчикам добавить возможность запрещать присылать им голосовые сообщения.

Почему не всем нравится получать голосовые сообщения?

  • Записывать такие сообщения легко, но для прослушивания требуются определенные условия — например, во время рабочего совещания удобнее прочитать сообщение, а не прослушать. Часто окружающий шум мешает понять, о чем идет речь. «Думаю, мы считаем это препятствием. Нужно искать наушники, чтобы прослушать сообщение», — сказал доктор Бенджамин Кован с факультета информации и коммуникации Университетского колледжа Дублина.
  • По текстовому сообщению можно быстрее понять, какую информацию пытается сказать собеседник, чем при прослушивании голосового. Внешний вид аудиофайла не говорит о его содержании, поэтому получатель не может определить, нужно ли откладывать дела, или его можно прослушать позже. Это можно считать дисбалансом власти — отправитель экономит свое время за счет времени получателя.
  • Многим сложнее воспринимать информацию на слух, что подтверждают исследования, в которых сравнивали восприятие аудиокниг и письменных текстов. 

Еще интересное: Иркутяне очистили от мусора одну из городских рек и сдали отходы на переработку

Наш канал в телеграме — «Верблюд в огне», подпишись! И присылай свои новости.

Комментариев 0

Ничего не нашлось

Попробуйте как-нибудь по-другому