2026年5月21日 周四晚上19:30,报名腾讯会议了解“从个人提效到构建企业AI生产力”(限30人)
免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


我要投稿

麻省理工团队开源GenCAD,用一张图片生成完整CAD模型与参数化程序

发布日期:2026-05-21 12:38:47 浏览次数: 1523
作者:OSC开源社区

微信搜一搜,关注“OSC开源社区”

推荐语

麻省理工开源GenCAD,一张图片即可生成可编辑的CAD模型与程序,革新自动化设计流程。

核心内容:
1. GenCAD如何解决传统AI生成模型在CAD领域的痛点
2. 系统核心架构与直接学习CAD程序表征的创新
3. 在逆向工程与设计空间探索中的实际应用价值

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

麻省理工学院的 Md Ferdous Alam 和 Faez Ahmed 近日发布了 GenCAD,一款从图片直接生成参数化 CAD 模型的开源系统。与以往只输出 3D 网格或点云的生成模型不同,GenCAD 不仅能生成可编辑的 3D 实体模型,还能同时输出完整的 CAD 命令序列——也就是可直接在 OpenSCAD 等建模软件中执行的参数化程序。这对于自动化设计、工程制造和设计空间探索等场景来说,是一个值得关注的技术突破。

CAD 数据的复杂性长期困扰着 AI 模型训练。与常见的网格、体素或点云表示不同,CAD 采用边界表示(B-rep)数据结构,这种高精度、可参数化的表达方式虽然对工程设计至关重要,但因其结构复杂且缺乏大规模公开数据集,导致 AI 模型难以直接在上面训练。业界常见的妥协方案是先生成中间表示(如网格),再逆向转换为 CAD 模型,但这个转换过程会损失精度,且生成的结果无法直接编辑和参数化修改。

GenCAD 架构包含四个核心步骤。首先,自回归 Transformer 编码器负责学习 CAD 命令序列的潜在表示;其次,基于对比学习的模型建立 CAD 命令序列与图片之间的联合表征空间;第三,潜在扩散模型在图片条件约束下生成 CAD 命令序列的潜在表示;最后,解码器将这些潜在表示转换为具体的参数化 CAD 命令序列。整套架构的创新之处在于:它直接学习 CAD 程序层面的表征,而不仅仅是几何外观。

从实际效果看,GenCAD 展示了一个从图片渲染图生成 CAD 模型的工作流。用户输入一张产品渲染图,模型会输出一组可选的 CAD 程序,每个程序对应一种生成结果。这解决了以往生成模型"输出不确定、不可控"的问题——同一个输入图片可以对应多种合理的 CAD 建模方案,GenCAD 能够并行生成多个候选结果供设计师选择。论文中展示了从约 7000 个 CAD 程序库中进行图片条件检索的实验,给定一张输入图片,系统能够返回最匹配的 Top-3 CAD 程序。

这种能力在工业场景中有明确的应用价值。产品的逆向工程是一个典型场景:工程师手中有产品实物或渲染图,需要快速重建出可参数化修改的 CAD 模型。传统方式依赖手工建模,耗时数小时甚至数天;GenCAD 可以作为初始草案生成工具,大幅缩短重建周期。设计空间探索是另一个场景:给定一个设计概念图,设计师希望快速生成多种变体来评估不同方案的优劣,GenCAD 的多样本生成能力可以支持这一工作流。

从技术发展角度看,GenCAD 代表了一个值得关注的方向:生成式 AI 正在从"生成图片/视频"向"生成可执行程序/模型"演进。代码生成模型(如 GitHub Copilot)已经在软件开发领域产生了深远影响,而 CAD 程序生成的价值链条更长——它直接影响制造、采购和供应链。一个能够读图并输出参数化 CAD 模型的 AI 系统,实际上是在缩短从设计意图到物理产品之间的认知到实物的转化路径。

项目代码已在 GitHub 开源,论文发表于 arXiv(编号 2409.16294),提供了视频演示和交互式 3D 模型展示。对 CAD 自动化、设计智能化有兴趣的开发者可以访问项目页面深入了解。

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询