Новые открытые нейромодели Hunyuan могут создавать и декомпозировать точные 3D-объекты


Китайский техногигант Tencent расширил семейство нейросетевых моделей Hunyuan двумя моделями для генерации трёхмерных ресурсов с открытым исходным кодом: Hunyuan 3D-Omni представляет собой платформу для точного создания объектов с многомодальным вводом, а Hunyuan 3D-Part помогает создавать составные части сложных объектов, как блоки конструктора.

Hunyuan 3D-Omni

3D-Omni поддерживает разные данных на входе и даёт точно контролировать геометрию, топологию и положение объекта. Разработчики говорят о ней как о  «ControlNet 3D-мира».

В основе новинки лежит модель Hunyuan 3D 2.1 с открытым исходным кодом, а сверху организовано многомодальное управление с четырьмя типами условий:

  • Скелет — можно точно корректировать позу создаваемых ресурсов, что помогает в создания анимации или дизайне виртуальных персонажей
  • Облако точек — внедрение полного или частичного облака точек, спроецированного из карты глубины; позволяет устранить визуальную неоднозначность и улучшает детализацию геометрии
  • Ограничивающая рамка — настройка соотношения сторон
  • Воксели — точная настройка структуры объекта

Управление можно гибко комбинировать для поддержки таких источников входных данных, как камеры глубины, лидары или реконструированные модели. Разработчики вольны расширять модель новыми параметрами — например, для управления позами персонажей.

Подробнее с моделью можно познакомиться на GitHub, Hugging Face и в техническом отчёте.

Hunyuan 3D-Part

В отличие от прецизионной генерации 3D-Omni, эта новинка фокусируется на решении проблемы декомпозиции, разбора на утилитарные компоненты.

В разработке игр, к примеру, иногда нужны сложные объекты, такие как здания, автомобили, различные устройства. Их модели можно делить на внешние и внутренние детали, чтобы иметь возможность настраивать логику взаимодействия составных частей. Это полезно и в трёхмерной печати.

Hunyuan 3D-Part включает модели сегментации P3-SAM и генерации компонентов «промышленного уровня» X-Part. Комплекс поддерживает автоматическую генерацию более 50 компонентов с относительно высоким геометрическим качеством, возможностью редактирования и рациональной структурой.

Разобраться в этой модели также помогут ссылки на GitHub и Hugging Face.

Не пропускайте важнейшие новости о дополненной и виртуальной реальности — подписывайтесь на Голографику в Telegram, ВК и Twitter! Поддержите проект на Boosty.

Далее: Новый редактор Horizon Worlds объединит нейрофункции в чате