
Главный научный сотрудник Meta* Майкл Абраш поделился прогнозом, переходящим в план. По его словам, инженеры компании оснастят очки постоянно работающим «контекстным ИИ». Марк Цукерберг считает, что на это нужно меньше пяти лет.
Слова Абраша можно воспринимать как задачу его организации. Но в них кроется изрядная неопределённость. Например, в 2016 году на конференции Oculus Connect 3 он назвал разрешение и угол обзора, которых должна была достичь виртуальная реальность к 2021 году, и сказал, что это будет сделано с переменным фокусом.
Теперь Абраш начал с размышлений над старыми прогнозами. В 2024 году высококлассные потребительские очки дошли до 4K, но неискажённое широкое поле зрения, признаёт исследователь, остаётся уделом корпоративных устройств ценой от $10 000 и лабораторных прототипов.
«Девять лет, прошедших с тех пор, стали новым подтверждением закона Хофштадтера», — пошутил Абраш. Закон звучит так: всё всегда занимает больше времени, чем вы ожидаете, даже с учётом закона Хофштадтера.
Спикер не стал говорить о технических характеристиках систем отображения или каких-либо деталях аппаратного обеспечения. Вместо этого он описал, каким будет нейросетевой помощник в умных очках.
Сегодня Meta AI в очках функционирует реактивно и прерывисто. Вы отдаёте ему команды, например, включаете песню, устанавливаете таймер или задаёте вопросы. Если вопрос связан с тем, что вы видите, очки используют камеру и анализируют изображение.

В США и Канаде доступна функция Live AI, которая позволяет вести непрерывный диалог с Meta AI без необходимости говорить «Привет, Мета». Нейросетевой комплекс постоянно получает информацию о том, что вы видите. Но есть ограничение контекстным окном базовой большой языковой модели и миниатюрным аккумулятором.
Эволюция умных очков, по версии Meta, заключается в попытке достижения постоянной работы искусственного интеллекта в фоновом режиме. Речь идёт о многомодальных моделях, которые представляют собой интегрированные контекстуальные слабые ИИ. Нечто среднее между отдельной специализированной нейросетью и самостоятельной многозадачной машиной.

Очки, говорит Абраш, будут непрерывно создавать динамическую 3D-карту окружения, считывать и анализировать действия и события, отслеживать объекты, с которыми вы взаимодействуете, а также хранить историю происходящего, чтобы делать более полные выводы.
Трекинг и семантика в реальном времени потребуют значительного повышения энергоэффективности микросхем и алгоритмов. Отдел Reality Labs работает в этом направлении, проектируя вычислительное оборудование. В интересах практичности очки также могут получить собственную связь с сотовыми сетями, без смартфона.

Марк Цукерберг также отметил идею непрерывного контекстного ИИ. Но, если Абраш не называл сроки, Цукерберг назвал:
Не уверен, сколько времени потребуется, чтобы достичь этого. Не думаю, что это займёт пять лет. Думаю, это произойдёт быстрее.
Создать такую технологию — полдела. Её надо продать, а этому может помешать настороженность пользователей и правительств в отношении информации, которую собирают производитель устройства, поставщик операционной системы и разработчики отдельных приложений. Опасения могут породить новые законы, ограничивающие работу алгоритмов искусственного интеллекта и целых продуктов.
*В России признана экстремистской
Не пропускайте важнейшие новости о дополненной и виртуальной реальности — подписывайтесь на Голографику в Telegram, ВК и Twitter! Поддержите проект на Boosty.
Далее: Приложение SpatialML Capture делает из Pico 4 Ultra сборщик пространственных датасетов



