Unity представила синтетические датасеты для машинного обучения

408

Unity выпустила синтетические наборы данных для машинного обучения Unity AI Datasets. Они должны снижать затраты на разработку приложений с компьютерным зрением и ускорять совершенствование нейронных сетей в областях производства, розничной торговли и безопасности.

Синтетические данные могут задавать алгоритмам условия, которых нет в «естественных» данных. Это может быть полезно, например, когда требования к конфиденциальности ограничивают доступность данных или их использование. Одним из распространённых способов использования синтетических датасетов является тестирование ранних версий продуктов, когда данные либо отсутствуют, либо недоступны для тестировщиков. Синтетическая информация также экономит ресурсы, когда получение данных в реальности становится очень дорогим, как в случае с беспилотными автомобилями.

Наборы синтетики позволяют компаниям планировать и моделировать сценарии, с которыми они ещё не сталкивались, при значительном расширении датасетов. Для формирования различных наборов под разные потребности клиентов Unity использовала метод рандомизации предметной области (domain randomization). Он меняет расположение, ориентацию и окружение объектов, включая освещение и углы камеры, и добавляет другие конфигурации из среды Unity. Конфиденциальность не страдает, поскольку речь идёт о расширении уже имеющегося набора, а не о его дополнении данными из Сети.

Наборы данных для покупки доступны в многоуровневой модели ценообразования, согласно которой цена за одно изображение уменьшается пропорционально увеличению объёма заказа. От типа аугментации цена не зависит.

Подробная информация о Unity AI Datasets доступна на странице https://unity.com/products/computer-vision.

Не пропускайте важнейшие новости о дополненной и виртуальной реальности — подписывайтесь на Голографику в TelegramВКTwitter и Facebook!

Далее: Обновление Quest 2 v28 принесёт беспроводное соединение с компьютером, настоящие стол с клавиатурой и 120 Гц