Группа IT-разработчиков из Оксфорда создала искусственный интеллект, который позволяет интерпретировать речь индивида по движению его губ. Отмечается, что разработка во много раз превосходит возможности человека.

Технология под названием Watch, Attend and Spell является методикой, созданной на основании нейросетей. Помощь авторам оказала корпорация Google и компания DeepMind.

Система WAS умеет считывать информацию по губам, используя специальное компьютерное зрение и некоторые особенности машинного обучения при сканировании ТВ-передач, длительность которых превышает 5 тыс. часов.

Эксперимент показал, что способности устройства превышают возможности человека-эксперта считывать информацию, основываясь на движениях губ. Человек был способен распознать лишь 12% речи, в то время как машина улавливала 50%. Ошибка искусственного интеллекта заключалась лишь в потере буквы «с» в конце слов.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Вам может понравиться

National Interest: Новый российский стратегический бомбардировщик-невидимка – это «путинский B-21»?

Военные обозреватели National Interest все более склонны считать, что «загадочный проект бомбардировщика нового поколения России» станет в большей степени некоторым аналогом новейшего американского B-21, чем устаревающего B-2, как это ранее

Sony планирует добавить поддержку виртуальной реальности в крупные проекты для PS 5

В Сети появились подробности о гарнитуре виртуальной реальности Sony PS WR 2. Как сообщается, эта гарнитура предназначена для консоли PlayStation 5. До релиза устройства, согласно имеющейся информации, ещё более года,

Специалисты Ростеха разработали навигатор для точного приземления парашютистов

Концерн «Радиоэлектронные технологии», входящий в Ростех, разработал прибор навигации, предназначенный для парашютистов. Использоваться эта система, как заявила пресс-служба Ростеха, может в ВДВ и МЧС, а также для тушения лесных пожаров.
Погода в России: