TRELLIS.2 – 微软开源的40亿参数3D生成模型
TRELLIS.2是什么
TRELLIS.2是微软开源的40亿参数3D生成模型,专为从单张图片高效生成高保真3D资产设计。核心创新在于采用O-Voxel稀疏体素架构,能处理复杂拓扑结构(如开放表面、非流形几何),支持完整PBR材质建模。在NVIDIA H100上生成512³分辨率模型仅需3秒,最高支持1536³超高清渲染。相比传统方法,通过16倍空间下采样显著提升效率,同时提供GLB格式导出功能,适用于游戏、影视和工业设计等领域。

TRELLIS.2的主要功能
- 图像到3D生成:能根据输入的图像快速生成高质量的3D模型,适用于从2D图像创建3D资产的场景。
- 文本到3D生成:支持基于文本描述生成3D模型,用户可以通过文字指令生成所需的3D对象。
- 复杂拓扑处理:可以处理复杂的3D结构,包括开放表面、非流形几何和内部封闭结构,生成具有复杂形状的3D模型。
- 材质与纹理生成:生成的3D模型支持多种材质属性(如基础颜色、粗糙度、金属度、不透明度等),并支持透明度和逼真渲染。
- 多分辨率支持:支持从512³到1536³等多种分辨率的3D模型生成,用户可以根据需求选择合适的分辨率。
- 快速渲染与导出:生成的3D模型可以直接用于渲染,并支持导出为GLB等标准3D文件格式,便于在其他软件中使用。
- 模型编辑与变体生成:用户可以对生成的3D模型进行编辑,生成同一对象的不同变体,满足多样化的设计需求。
TRELLIS.2的技术原理
- O-Voxel表示:采用“O-Voxel”稀疏体素结构,这是一种创新的3D表示方法,能高效处理复杂拓扑和锐利特征,突破传统等值面场的限制,支持开放表面、非流形几何和内部封闭结构。
- 稀疏3D VAE编码:通过稀疏3D变分自编码器(VAE)将3D资产编码到紧凑的潜在空间中,实现高效的压缩和生成,支持16倍的空间下采样,显著提升处理效率。
- 全纹理建模:不仅处理基础颜色,还能模拟粗糙度、金属度和不透明度等PBR材质属性,支持透明度和逼真渲染,生成的3D模型具有丰富的纹理细节。
- 极简数据处理流程:数据处理无需复杂的渲染或优化步骤,可在短时间内完成纹理网格与O-Voxel之间的转换,大大简化了处理流程,提升了生成速度。
- 高效渲染与后处理:结合CUDA加速的网格处理工具(如CuMesh)和高效的渲染技术,快速生成高质量的3D模型,并支持实时渲染和后处理操作。
- 大规模预训练:在大规模数据集上进行预训练,模型学习了丰富的3D形状和纹理特征,能根据输入的图像或文本生成多样化的3D资产。
TRELLIS.2的项目地址
项目官网:https://microsoft.github.io/TRELLIS.2/
Github仓库:https://github.com/microsoft/TRELLIS.2
HuggingFace模型库:https://huggingface.co/microsoft/TRELLIS.2-4B
arXiv技术论文:https://arxiv.org/pdf/2512.14692
在线体验Demo:https://huggingface.co/spaces/microsoft/TRELLIS.2
TRELLIS.2的应用场景
- 游戏开发:快速生成高质量的3D游戏资产,如角色、道具、场景等,提升开发效率,降低制作成本。
- 影视制作:用于创建逼真的3D特效和虚拟场景,支持复杂的材质和纹理,满足影视行业对视觉效果的高要求。
- 虚拟现实(VR)和增强现实(AR):生成沉浸式的3D环境和物体,增强用户体验,适用于VR/AR应用开发。
- 建筑设计与可视化:快速生成建筑模型和室内设计的3D可视化,帮助设计师和客户更好地理解和评估设计方案。
- 工业设计与产品开发:创建产品原型的3D模型,加速设计迭代过程,便于进行虚拟展示和功能测试。
- 教育与培训:作为教学工具,帮助学生和受训者更好地理解和掌握3D建模、渲染和设计的相关知识和技能。
-
VibeVoice-ASR – 微软开源的长音频语音识别模型
VibeVoice-ASR是什么VibeVoice-ASR 是微软开源的先进语音识别模型,专为处理长达60分钟的长音频设计。模型能一次性处理整段音频,保持全局上下文,避免传统模型分段处理导致的上下文丢
-
json-render – Vercel开源的AI生成UI渲染可控方案
json-render是什么json-render是 Vercel 开源的项目,解决 AI 生成 UI 的不可控问题。json-render通过定义一个 Catalog,约束 AI 只能生成符合特定
-
EmbodiChain – 跨维智能开源的具身智能学习平台
EmbodiChain是什么EmbodiChain 是跨维智能开源的具身智能学习平台,通过生成式仿真数据推动具身智能的发展。自动创建符合物理规律的 3D 场景和任务,结合在线数据流和自我修复机制,高效
[广告]赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注KnowSafe微信公众号随时掌握互联网精彩
- TiDB开源分布式关系型数据库
- 【直播预约】聊聊不传统的SSL证书——国密证书
- 刚自愿降薪 40% 的库克,要被“踢出”苹果董事会了?
- 低代码是开发的未来吗?浅谈低代码平台
- 在看 | 国家网信办修订《移动互联网应用程序信息服务管理规定》发布施行
- 惊喜不断,福利多多,云盲盒的快乐等你来开!
- 致大湾区的一封情书
- 倒计时1天!2021 KCTF秋季赛火热来袭!无需报名,直接开战!
- 百家智库 | 诸子云 · 分享汇:线上直播(第2季)预告
- Qualcomm招聘|本月热招职位,点燃夏日激情探索未来
- Objective-C 之父 Brad Cox 逝世,创建过乐队、推动苹果软件生态
- 看雪社区招募版主,We need you !



