
Apple приобрела компанию по разработке технологий преобразования речи в текст Q.ai. Преобразование это необычно: вместо звука учитываются движения мышц, отвечающих за речь, поэтому пользователю не нужно даже шептать, достаточно беззвучно проговаривать слова. Сумма сделки, по слухам, составила $1,6 млрд (₽123 млрд), что было бы рекордом известных купертинских сделок, если бы не покупка производителя наушников Beats.
С момента своего основания в 2022 году Q.ai работала скрытно. Но биография соучредителей, а также патентная заявка дают веские основания полагать, чем занимался стартап.
Авиад Майзельс, генеральный директор, ранее основал PrimeSense, компанию, которую Apple приобрела в 2013 году для создания Face ID. PrimeSense также продавала лицензии на часть своих технологий Microsoft для оригинального модуля отслеживания движения тела Kinect.
Доктор Йонатан Векслер, технический директор, — эксперт мирового класса в области компьютерного зрения, ранее занимавший должность вице-президента по исследованиям и разработкам в компании OrCam, которая миниатюризировала высококлассные системы компьютерного зрения до крошечного устройства, которое помещается на очки.
Идея «безмолвной речи» заключается в том, чтобы беззвучно диктовать текст, пока устройство следить за движениями мышц под кожей с помощью миниатюрной камеры. Таким образом, теоретически, можно отправлять сообщения в людном месте или управлять устройством, не сообщая об этом окружающим (если они не умеют читать по губам).
Фундаментальная идея не нова, и другой стартап, Alterego, работает над подобным устройством с использованием датчиков на челюсти. Но подход Q.ai отличается бесконтактным компьютерным зрением.
Например, в патенте «Обнаружение беззвучной речи» упоминается «оптическая сенсорная головка», расположенная «в непосредственной близости от лица пользователя», которая «чувствует свет, отражённый от лица, и выдаёт сигнал в ответ» на него.
Apple может интегрировать технологию Q.ai в будущие умные очки, очки дополненной реальности и наушники. Тем временем Meta* делает ставку на возможность ввода букв на поверхности, например, на ноге, с помощью браслета на технологии поверхностной электромиографии. Последняя технология уже работает в серийном устройстве.
Независимо от того, какая технология победит, возможность вводить текст конфиденциально в электронных очках на публике будет иметь решающее значение, если этим устройствам суждено вытеснять смартфоны. Возможно, главный вопрос в массовом проникновении — что выглядит менее странно: люди, которые водят пальцами по собственным телам, или любители другого бренда рядом, беззвучно говорящие с нейросетями?
*В России признана экстремистской
Не пропускайте важнейшие новости о дополненной и виртуальной реальности — подписывайтесь на Голографику в Telegram, ВК и Twitter! Поддержите проект на Boosty.
Далее: Xreal научила нейросеть на лету делать 3D из 2D прямо на очках



