back to top

Тег: ИИ

В MyWebAR появилось генерирование 3D-моделей по текстовому описанию

Devar запускает генеративное нейросетевое решение, которое объединяет ИИ и другие решения для создания контента дополненной реальности, включая MyWebAR. Алгоритмы здесь создают 2D- и 3D-объекты по текстовым описаниям. Лёгкие модели можно сразу применять в иммерсивных проектах даже на недорогих смартфонах, причём как в качестве основного содержимого, так и в качестве маркеров. 

Российский разработчик показал клиент ChatGPT для Apple Vision Pro со сменными аватарами и голосовым вводом

Всего через несколько дней после открытия компанией Apple SDK для visionOS российский разработчик Дмитрий Кудрявцев представил демо-версию соответствующего клиента ChatGPT. Прототип понимает голосовой ввод, пишет тексты, зачитывает их и показывает анимацию при обработке запросов. Ранее Дмитрий появлялся в наших новостях с фотограмметрическим приложением для оцифровки предметов реального мира Metaport.

Создатели ИИ-монокля с дополненной реальностью привлекли $3 миллиона

Monocle представляет собой компьютеризированный аксессуар, который крепится на обычные очки и показывает информацию через единственный волноводный прозрачный дисплей. Компактное устройство может работать до шести часов, а затем его можно зарядить в специальном кейсе, подобно беспроводным наушникам. 

Исследователи Meta* показали ИИ-определение поз сидящих людей в проекте QuestEnvSim

В новой статье под названием QuestEnvSim три исследователя из проекта QuestSim с коллегами из Национального университета Сеула представили обновлённый набор моделей с использованием подхода к обучению с подкреплением из прошлогодней работы с учётом мебели и других реальных объектов.

Инженеры Intel Labs создали ИИ-модель для генерации панорамных изображений с картами глубины

Intel Labs, исследовательское подразделение Intel, в сотрудничестве с Blockade Labs представило Latent Diffusion Model for 3D (LDM3D), диффузионную нейросетевую модель для создания 3D-контента. Авторы утверждают, что это первая подобная модель, объединяющая RGB-изображение с картой глубины для создания трёхмерных изображений с 360-градусным обзором.

Нейросетевая модель ARGoL может оказаться будущим трекинга ног в Quest

AGRoL — это диффузионная (вероятностная генеративная) модель, как и известные системы генерации изображений, такие как Stable Diffusion и DALL·E 2 от OpenAI. Однако, в отличие от них, AGRoL «может работать в режиме реального времени» на одном ускорителе NVIDIA V100 со скоростью около 41 кадра в секунду.

WebAR-платформа Geenee подключилась к нейросетевым аватарам Inworld

У NPC настраиваются триггеры, знания, черты характера, голоса и другие аспекты «личности». Inworld использует более 20 моделей машинного обучения, чтобы имитировать человеческие выражения лица, поддерживать разговор, воспроизводить жесты, эмоции и действия.

Сегментируй что угодно: ИИ-модель SAM от Meta открывает новую страницу визуального поиска в реальном времени

Создание точной модели сегментации для конкретных задач обычно требует узконаправленной работы технических экспертов с доступом к инфраструктуре обучения ИИ и большим объёмам аннотированных данных по предметной области. Но не в этот раз.

Деловая ВР-платформа Foretell Reality повысила интеллект виртуальных персонажей с помощью GPT-3

Модные чат-боты на нейросетевых моделях быстро заинтересовали разработчиков виртуальной реальности возможностью создавать реалистичных виртуальных персонажей. Такие NPC меньше подрывают доверие окружению, чем заскриптованные, а значит и слабее снижают ценность главного козыря виара.

Стартап Matrix хочет бесконечно генерировать ВР-миры из фотографий от нейросети

Matrix, дочерняя компания MetaReal Group, специализирующейся на создании виртуальных туров на основе панорамных фотографий, объявила об успешном эксперименте по автоматическому преобразованию фото и видео в виртуальные комнаты с поддержкой шести степеней свободы.