Инженеры Meta представили новый набор данных для обучения моделей компьютерного зрения тому, как люди взаимодействуют с физическим окружением при помощи рук. В основе концепции датасета HOT3D (Hand and object tracking 3D) отслеживание очками, то есть в положении наблюдения своих рук собственными глазами.
Создание точной модели сегментации для конкретных задач обычно требует узконаправленной работы технических экспертов с доступом к инфраструктуре обучения ИИ и большим объёмам аннотированных данных по предметной области. Но не в этот раз.