Поиск на сайте: Расширенный поиск


Новые программы oszone.net Читать ленту новостей RSS
CheckBootSpeed - это диагностический пакет на основе скриптов PowerShell, создающий отчет о скорости загрузки Windows 7 ...
Вы когда-нибудь хотели создать установочный диск Windows, который бы автоматически установил систему, не задавая вопросо...
Если после установки Windows XP у вас перестала загружаться Windows Vista или Windows 7, вам необходимо восстановить заг...
Программа подготовки документов и ведения учетных и отчетных данных по командировкам. Используются формы, утвержденные п...
Red Button – это мощная утилита для оптимизации и очистки всех актуальных клиентских версий операционной системы Windows...
OSzone.net Новости Hardware Google DeepMind превосходит экспертов чтения по губам RSS

Google DeepMind превосходит экспертов чтения по губам

Текущий рейтинг: 5 (проголосовало 5)
 Посетителей: 437 | Просмотров: 481 (сегодня 1)  Шрифт: - +

Система искусственного интеллекта Google DeepMind известна главным образом благодаря созданию программы AplhaGO, сумевшей превзойти одного из лучших игроков мира в Go. Эта же технология имеет множество других применений, в том числе способна помочь людям с проблемами со слухом.

Исследователи из Оксфордского Университета и разработчики DeepMind объединили усилия для создания системы искусственного интеллекта, используя для тренировки 5600 видео компании BBC, содержащие 118 тысяч предложений. В результате система смогла опередить профессионалов в области чтения по губам, которые работают в судах Великобритании.

При просмотре 200 случайно выбранных видео от компании BBC специалисты по чтению по губам смогли распознать менее четверти произнесённых слов. Система искусственного интеллекта распознала почти половину слов и могла разбирать целые сложные фразы. Также система смогла безошибочно прокомментировать 46% слов, тогда как у людей этот результат составил 12%. Большинство ошибок искусственного интеллекта были небольшими, вроде пропуска буквы s на конце слов во множественном числе.

Двумя неделями ранее в Оксфордском Университете была разработана другая система глубокого обучения, умеющая читать по губам. Система LipNet также превосходит людей в точности чтения, хотя набор данных под названием GRID состоял только из 51 уникального слова, тогда как данные BBC содержали почти 17500 слов.

В GRID используют видео с хорошим освещением и глядящими в камеру людьми, читающими слова на протяжении не менее 3 секунд. После показа системе 29 тысяч видео уровень ошибок составил всего 6,6%, тогда как людей тестировали с применением 300 похожих видео и уровень ошибок составил 47,7%.

Исследователи считают, что данные системы могут найти применение в мобильных устройствах, виртуальных ассистентах, приложениях распознавания речи и преобразования речи в текст. Они же могут оказаться бесценными для людей с проблемами со слухом, помогая им общаться и понимать других людей. ИИ может слышать пользователя в шумном окружении, помогать восстанавливать архивные немые фильмы, решать проблемы с распознаванием речи при одновременном разговоре множества людей и улучшать системы автоматического распознавания речи в целом.

Автор: Алексей Алтухов  •  Иcточник: techspot.com  •  Опубликована: 24.11.2016
Нашли ошибку в тексте? Сообщите о ней автору: выделите мышкой и нажмите CTRL + ENTER


Оценить статью:
Вверх
Комментарии посетителей
Комментарии отключены. С вопросами по статьям обращайтесь в форум.