ИИ-агент создает 3D-модели из эскизов в CAD

Разработка современных физических продуктов немыслима без систем автоматизированного проектирования (CAD). Инженеры используют CAD для преобразования двумерных эскизов в трехмерные модели, которые затем тестируются и дорабатываются перед запуском в производство. Однако освоение CAD-софта — задача непростая, требующая обширных знаний и многолетней практики из-за наличия тысяч команд.

Инженеры из Массачусетского технологического института (MIT) работают над упрощением этого процесса с помощью новой модели ИИ, которая взаимодействует с CAD-программой подобно человеку. Получая на вход двумерный эскиз, модель быстро генерирует трехмерную версию, имитируя действия инженера: клики, выбор опций и команд.

Команда MIT представила набор данных VideoCAD, включающий более 41 000 примеров создания 3D-моделей в CAD. Обучившись на этих видео, демонстрирующих пошаговое построение различных объектов, новая система ИИ научилась управлять CAD-программой, воспроизводя пользовательские действия.

Разработка VideoCAD нацелена на создание «второго пилота» на базе ИИ для CAD. Предполагается, что такой инструмент не только сможет создавать 3D-версии проектов, но и будет предлагать человеку следующие шаги, либо автоматически выполнять рутинные последовательности действий, которые вручную занимают много времени.

«ИИ способен повысить продуктивность инженеров, а также сделать CAD более доступным для широкого круга пользователей», — отмечает Гади Неме, аспирант кафедры машиностроения MIT.

«Это значительно снижает порог входа в проектирование, помогая людям без многолетнего опыта работы с CAD создавать 3D-модели проще и раскрывать свой творческий потенциал», — добавляет Фаез Ахмед, доцент кафедры машиностроения MIT.

Исследователи представят свою работу на конференции NeurIPS 2025 в Сан-Диего в декабре. Статья также доступна на сервере препринтов arXiv.

Пошаговое создание

Новая разработка расширяет возможности современных ИИ-агентов, управляющих пользовательскими интерфейсами (UI). Эти агенты обучаются работе с программным обеспечением для выполнения задач, например, автоматического сбора информации из интернета и ее организации в таблицах Excel. Исследователи задались вопросом, могут ли подобные UI-агенты быть адаптированы для работы с CAD, учитывая значительно большее количество функций и сложность задач.

Команда стремилась создать ИИ-агента, который возьмет на себя управление CAD-программой для создания 3D-модели из 2D-эскиза, выполняя все действия по кликам.

Изначально исследователи использовали существующий набор данных объектов, разработанных в CAD человеком. Каждый объект сопровождался последовательностью высокоуровневых команд, таких как «нарисовать линию», «круг», «выдавливание», использованных при его создании.

Однако стало очевидно, что этих команд недостаточно для обучения ИИ-агента. Реальному агенту необходимо понимать детали каждого действия: какую область эскиза выбрать, когда увеличивать масштаб, какую часть эскиза выдавливать.

Чтобы решить эту проблему, исследователи разработали систему, которая преобразует высокоуровневые команды в конкретные взаимодействия с пользовательским интерфейсом.

«Например, если мы рисуем линию от точки 1 до точки 2, — поясняет Неме, — мы преобразуем эти действия в действия с пользовательским интерфейсом. Это означает: перейти к таким-то пиксельным координатам, кликнуть, затем перейти к другим пиксельным координатам и снова кликнуть, при этом будучи в режиме операции 'линия'.»

В итоге было сгенерировано более 41 000 видеороликов создания 3D-объектов в CAD людьми. Каждое видео детально описывало конкретные клики, движения мыши и другие действия, выполненные пользователем.

Эти данные были использованы для обучения разработанной модели, которая выявила закономерности между действиями UI и процессом создания CAD-объектов.

Обученная модель VideoCAD теперь способна принимать 2D-эскиз и напрямую управлять CAD-программой, выполняя необходимые клики, перетаскивания и выбор инструментов для построения полной 3D-формы.

Объекты варьировались от простых кронштейнов до сложных проектов зданий. Команда продолжает обучать модель на более сложных формах, предполагая, что в будущем эта модель и набор данных позволят создавать CAD-ассистентов для дизайнеров в различных областях.

«VideoCAD — это ценный первый шаг к созданию ИИ-помощников, которые помогут новым пользователям освоиться и автоматизировать повторяющиеся задачи моделирования, соответствующие известным паттернам», — комментирует Мехди Атаи, старший научный сотрудник Autodesk Research, не принимавший участия в исследовании.

«Это только начало, и я с нетерпением жду развития этой идеи: охвата нескольких CAD-систем, более сложных операций, таких как сборки и ограничения, а также более реалистичных, неидеальных рабочих процессов человека», — добавил он.

Комментарии

Кот 04.12.2025 20:27
Ну наконец-то, теперь даже ленивые инженеры смогут создать 3D-модель, не шевеля пальцами! 😂😂😂😂😂