Trellis 2: Microsoft의 오픈소스 이미지-3D를 온라인으로
TRELLIS.2는 사진 한 장을 투명까지 포함한 PBR 머티리얼의 풀 텍스처 3D 에셋으로 바꿉니다. Linux와 24GB GPU 셋업은 건너뛰고 브라우저에서 바로 쓰세요.
TRELLIS.2(통칭 Trellis 2)는 2025년 12월 Microsoft Research, 칭화대, 중국과학기술대 연구진이 공개한 40억 파라미터의 이미지-3D 모델입니다. 핵심 발명인 O-Voxel(필드 프리 희소 복셀 표현) 덕분에, 3D 생성의 세계가 역사적으로 "거절"해 온 것들을 모델 하나가 생성합니다. 천과 잎 같은 열린 표면, 논매니폴드 지오메트리, 닫힌 내부 구조, 그리고 진짜 투명을 포함한 풀 PBR 머티리얼까지. 이 페이지에서는 Trellis 2를 온라인으로 돌려 사진 한 장에서 GLB를 내보낼 수 있습니다. Linux 머신 없이, 24GB GPU 없이, 셋업 없이.
Trellis 2가 거의 하룻밤에 3D 판을 휩쓴 이유
이 급의 오픈 릴리스는 드물고, 숫자가 즉시 그것을 증명했습니다. 공개 몇 달 만에 TRELLIS.2-4B 가중치는 Hugging Face에서 월 100만 회를 넘는 속도로 다운로드됐고, 100개 안팎의 공개 Space가 그 위에 세워졌으며, ComfyUI 생태계는 며칠 만에 노드 워크플로우에 넣었습니다. 커뮤니티의 평가도 곧 두 가지 이유로 수렴합니다. MIT 라이선스가 진짜 의미의 "자유롭게 쓴다"를 실현했다는 것, 그리고 출력 품질이 그때까지 클로즈드 상용 모델의 전유물이던 선을 넘었다는 것.
다만 이 다운로드 수에는 아이러니가 숨어 있습니다. 공식 요건(Linux, 24GB 이상 NVIDIA GPU, CUDA 12.4) 탓에 Trellis 2에 열광한 사람 대부분은 자기 머신에서 그것을 못 돌립니다. "누구에게나 열려 있다"와 "돌릴 수 있는 건 소수"의 간극. 그것이 호스팅 접근이 메우는 것이고, 이 페이지가 존재하는 이유입니다.
1세대 TRELLIS에서 무엇이 바뀌었나
1세대 TRELLIS는 Microsoft의 CVPR Spotlight 논문으로, 물체를 필드 기반 3D 표현에 묶인 구조화 잠재변수로 인코딩했습니다. 획기적이긴 했지만 천장이 내장돼 있었습니다. 필드 기반 기법은 닫힌 표면을 전제하기에 천, 식물, 빈 내부, 논매니폴드 전부가 실패하거나 변환 때 몰래 "메워지거나" 둘 중 하나였습니다.
Trellis 2는 그 천장을 올린 게 아니라 치웠습니다.
- O-Voxel이 필드에 묶인 잠재변수를 대체. 지오메트리와 외관은 약 16배 공간 압축의 희소 복셀 구조에 직접 저장됩니다. 손실 있는 "필드에서 메시로" 변환은 루프에서 사라졌습니다.
- 생성기는 40억 파라미터로. 플로 매칭 Transformer로, 1세대에서 대폭의 용량 점프입니다.
- 외관은 풀 PBR로. 베이스 컬러, 러프니스, 메탈릭, 그리고 주요 생성기 중 유일하게 불투명도까지. 투명은 "그려지는" 게 아니라 "모델링되는" 것이 됐습니다.
- 해상도는 다이얼식으로: 512³·1024³·1536³ 세 단계가 획일적 출력을 대체했습니다.
포럼에 널리 도는 오해 하나를 여기서 분명히 바로잡습니다. 멀티 이미지 조건은 1세대 TRELLIS의 기능이고, 많은 글이 넘겨짚어 속편에 옮겨 적었습니다. 공개된 Trellis 2 파이프라인은 단일 이미지입니다. 오브젝트의 가려진 면이 최우선이라면 이 사이트의 Hunyuan 3D 3.1이 적임입니다. 한 장의 입력을 내부 8뷰 재구성 파이프라인에 통과시켜 찍히지 않은 면의 복원이 더 안정적입니다.
다른 생성기가 "거절"하는 지오메트리
Trellis 2의 가장 정직한 세일즈 포인트는 "다른 모델이 망치는 걸 본 적 있을 물건"의 목록입니다. 재킷(겉과 안을 가진 열린 표면). 관엽식물(알파 컷의 얇은 잎 수십 장). 유리병(투명과 내부 구조의 세트). 카메라엔 안 찍히지만 구조적으로는 존재하는 내부 공동을 가진 기계 어셈블리.
워터타이트 우선 모델은 이것들을 "닫는" 것으로 처리합니다. 재킷은 재킷 모양 껍데기로, 잎은 초록 덩어리로, 병은 불투명으로. Trellis 2의 표현은 애초에 표면이 부피를 감싸기를 요구하지 않습니다. 그래서 물체를 "있는 그대로" 재현합니다. 에셋 라이브러리가 유기물, 식물, 패션, 투명체 쪽이라면 이 한 가지가 스펙표의 다른 모든 숫자를 합친 것보다 무겁습니다.
해상도 3단계, 그리고 "빠르다"의 정직한 내역
Microsoft가 공표한 벤치마크는 눈길을 끕니다. H100에서 순수 추론은 512³ 약 3초, 1024³ 약 17초, 1536³ 약 60초(형상·머티리얼 두 단계 포함). 이 숫자는 진짜지만 플래그십 데이터센터 GPU의 베어메탈 값이지, 대기열·디코딩·내보내기를 포함한 호스팅 서비스의 엔드투엔드가 아닙니다. AI 3D에서 Trellis 2의 일반적인 작업은 2~6분 구간에 끝납니다. 두 숫자를 다 알아야 사는 것이 정확히 보입니다. 정직한 잣대로 재도 현행 최속급 3D 생성기입니다.
단계제는 2패스 습관에 보상합니다. 512³로 초안을 잡아 이미지가 제대로 재구성되는지 확인하고, 채택할 1체를 1536³ + 텍스처 4096 쪽으로 재실행. 주연 에셋을 만드는 법입니다. 폴리곤 감산 컨트롤이 다이얼의 마지막 조각으로, 웹 뷰어의 가벼운 예산부터 스컬프팅 밀도까지 겨눌 수 있습니다.
계획에 넣어 둘 한계
작은 구멍은 생깁니다. 공식 모델 카드가 명기합니다. 메시에 작은 구멍이 남을 수 있고 워터타이트가 필요하면 후처리를 권한다고요. 가끔의 프린트라면 메시 수리 한 공정이면 됩니다. 프린트가 주업이라면 워터타이트 출력이 설계 목표(수리가 "공정"이 아니라 "불필요")인 Hunyuan 3D 3.1로 생성하세요.
한 장의 이미지는 한 시점의 진실입니다. 사진이 보여 주지 않는 모든 것을 모델은 학습된 사전 지식에서 추측합니다. 추측은 능숙하지만, 물체 뒷면의 특징적인 로고가 저절로 자라나진 않습니다. 가장 중요한 것이 찍히는 앵글을 고르거나 Hunyuan의 멀티뷰 워크플로우로 갈아타세요.
텍스트 모드는 없습니다. Trellis 2는 프롬프트를 받지 않습니다. 실용적인 다리는 이렇습니다. 이미지 생성 AI로 참조를 한 장 만들고, 눈으로 확인한 뒤, 여기서 3D로 변환. 길이 약간 길어진 만큼 통제력은 확실히 늘어납니다.
Trellis 2 vs 1세대 TRELLIS vs Hunyuan 3D 3.1
| TRELLIS(1세대) | Trellis 2 | Hunyuan 3D 3.1 | |
|---|---|---|---|
| 표현 | 필드 위 구조화 잠재변수 | O-Voxel, 필드 프리 | 다단계 재구성 |
| 토폴로지 | 닫힌 표면 | 임의 — 열림·논매니폴드·내부 | 설계부터 워터타이트 |
| 머티리얼 | 색 중심 | 불투명도 포함 풀 PBR | 최대 4K PBR |
| 입력 | 이미지(멀티 이미지 포함) | 단일 이미지 | 텍스트 또는 단일 이미지 |
| 라이선스/접근 | MIT, 오픈 | MIT, 오픈 — 문턱은 높음 | 호스팅 플랫폼 모델 |
전작 대비 Trellis 2는 군말 없는 세대교체입니다. 토폴로지는 자유로워지고, 머티리얼 채널은 늘고, 해상도는 올랐습니다. Hunyuan 3D 3.1과는 진짜 노선 분기입니다. 표현의 자유와 속도가 한쪽에, 파이프라인 대응의 워터타이트 규율과 가려진 면의 충실도가 다른 쪽에. 다행히 둘 다 생성기 페이지의 같은 드롭다운에서 돌아가니, 이 비교는 "무엇을 살까"가 아니라 "에셋마다 무엇을 쓸까"의 이야기가 됩니다.
입력 가이드: 사진 한 장이 전부를 정한다
단일 이미지 모델에게 입력 품질은 변수 중 하나가 아니라 상한 그 자체입니다. 평범과 출중의 차이 대부분은 다섯 규칙으로 설명됩니다. 가진 것 중 최고 해상도의 이미지를 쓸 것. 사진에 없는 디테일은 3D에 자라나지 않습니다. 조명은 고르게. 이미지에 박힌 짙은 그림자는 지오메트리로 읽혀 부조처럼 표면에 새겨집니다. 배경은 단색으로. 세그먼테이션의 정밀도를 전부 오브젝트에 쓰게 하세요. 물체는 온전히 프레임 안에. 잘린 가장자리는 절단된 지오메트리가 됩니다. 그리고 정보량이 최대인 앵글을 고를 것. 대개는 정면과 측면이 동시에 보이는 쿼터뷰이지, 납작한 정면이 아닙니다.
파라미터 쪽은 이렇습니다. 반복 중엔 512³, 확정되면 1536³. 텍스처 크기는 카메라 거리에 맞춰(배경 소품이면 1024, 클로즈업이면 4096), 폴리곤 감산은 최대값이 아니라 엔진 예산에 맞춰 설정하세요.
사진에서 GLB까지, 3단계
생성기를 열어 Trellis 2를 선택하세요. 이미지를 업로드하고(JPG나 PNG, 최대 10MB) 해상도·텍스처 크기·폴리곤 목표를 설정합니다. 생성하고, 인터랙티브 뷰어에서 결과를 검수하고, 풀 PBR 머티리얼(투명 포함)의 GLB로 내보내세요. Blender, Unity, Unreal, 웹 어디로든.