Trellis 2: o imagem-para-3D open source da Microsoft, online
O TRELLIS.2 transforma uma foto num asset 3D totalmente texturizado, com materiais PBR — transparência incluída. Pule o setup de Linux e GPU de 24 GB e use direto no navegador.
O TRELLIS.2 — popularmente grafado Trellis 2 — é um modelo imagem-para-3D de 4 bilhões de parâmetros publicado em dezembro de 2025 por pesquisadores da Microsoft Research, da Tsinghua e da Universidade de Ciência e Tecnologia da China. Sua invenção central, o O-Voxel (representação esparsa de voxels livre de campos), permite que um único modelo gere o que o mundo da geração 3D historicamente recusou: superfícies abertas como tecido e folhas, geometria não-manifold, estruturas internas fechadas e materiais PBR completos com transparência de verdade. Nesta página, o Trellis 2 roda online e exporta GLB a partir de uma única foto — sem máquina Linux, sem GPU de 24 GB, sem setup.
Por que o Trellis 2 tomou o mundo 3D quase da noite para o dia
Lançamentos abertos desse calibre são raros, e os números contaram a história na hora: meses após a publicação, os pesos do TRELLIS.2-4B ultrapassavam um milhão de downloads mensais no Hugging Face, uma centena de Spaces públicos surgia em cima e o ecossistema ComfyUI o incorporou aos fluxos de nós em dias. A avaliação da comunidade convergiu rápido para duas razões: a licença MIT entregou o "livre de verdade", e a qualidade de saída cruzou uma linha que até então era exclusividade dos modelos comerciais fechados.
Mas há uma ironia nesses downloads: pelos requisitos oficiais — Linux, NVIDIA de 24 GB ou mais, CUDA 12.4 —, a maioria de quem se empolgou com o Trellis 2 não consegue rodá-lo na própria máquina. O vão entre "aberto a todos" e "executável por poucos" é exatamente o que o acesso hospedado preenche — e a razão desta página existir.
O que mudou desde o TRELLIS original
O TRELLIS original, paper Spotlight da CVPR pela Microsoft, codificava objetos como latentes estruturados amarrados a uma representação 3D baseada em campos. Revolucionário — e com teto embutido: métodos baseados em campos pressupõem superfícies fechadas, então tecido, plantas, interiores ocos e não-manifold ou falhavam, ou eram silenciosamente "lacrados" na conversão.
O Trellis 2 não levantou o teto: removeu.
- O O-Voxel substitui os latentes presos a campos. Geometria e aparência são armazenadas diretamente numa estrutura esparsa de voxels com ~16x de compressão espacial — a conversão com perdas de "campo para malha" saiu do circuito.
- O gerador foi a 4 bilhões de parâmetros — um Transformer de flow matching, salto considerável de capacidade sobre a primeira geração.
- A aparência virou PBR completo. Cor base, roughness, metallic e — único entre os grandes geradores — opacidade. Transparência agora é modelada, não pintada.
- A resolução virou dial: três degraus — 512³, 1024³ e 1536³ — no lugar da saída de tamanho único.
E um esclarecimento que circula errado pelos fóruns: condicionamento multi-imagem era recurso do TRELLIS original, e muitos artigos o transplantaram por suposição para o sucessor. O pipeline público do Trellis 2 é de imagem única. Se as faces ocultas do objeto são o que mais importa, o Hunyuan 3D 3.1 deste site serve melhor — ele passa a única imagem de entrada por um pipeline interno de reconstrução em 8 vistas, com recuperação mais estável do que não aparece na foto.
A geometria que os outros geradores "recusam"
O argumento de venda mais honesto do Trellis 2 é a lista de objetos que você provavelmente já viu outros modelos estragarem. A jaqueta — superfície aberta com dentro e fora. A planta de casa — dezenas de folhas finas em alpha. A garrafa de vidro — transparência mais estrutura interna. O conjunto mecânico com cavidades que a câmera não vê, mas que existem estruturalmente.
Modelos estanque-primeiro processam tudo isso "fechando": a jaqueta vira casca em formato de jaqueta, as folhas viram bloco verde, a garrafa fica opaca. A representação do Trellis 2 não exige que superfícies envolvam volume — então reproduz o objeto como ele é. Se a sua biblioteca de assets pende para orgânicos, plantas, moda e transparentes, esse único ponto pesa mais que todos os outros números da ficha técnica somados.
Três degraus de resolução — e a anatomia honesta do "rápido"
Os benchmarks publicados pela Microsoft impressionam: numa H100, a inferência bruta leva cerca de 3 segundos em 512³, 17 em 1024³ e 60 em 1536³ — com as etapas de forma e material incluídas. Os números são reais, mas são valores bare-metal de uma GPU de datacenter de ponta, não o fim-a-fim de um serviço hospedado com fila, decodificação e exportação. No AI 3D, o trabalho típico do Trellis 2 fecha na janela de 2 a 6 minutos. Conhecendo os dois números, você sabe exatamente o que está comprando: mesmo na régua honesta, um dos geradores 3D mais rápidos da atualidade.
O sistema de degraus premia o hábito das duas passadas: rascunhe em 512³ para confirmar que a imagem reconstrói direito, e reexecute a peça escolhida em 1536³ com textura perto de 4096 — é assim que se faz o asset protagonista. O controle de redução de polígonos é a última peça do dial, mirando do orçamento leve de um visualizador web à densidade de escultura.
Limites para colocar no planejamento
Furos pequenos acontecem. O model card oficial registra: as malhas podem trazer furos pequenos, e pós-processamento é recomendado quando estanqueidade é necessária. Para impressão ocasional, uma etapa de reparo resolve. Se imprimir é o seu ofício, gere no Hunyuan 3D 3.1 — onde estanque é meta de projeto e o reparo deixa de ser etapa.
Uma imagem é a verdade de um ponto de vista. Tudo o que a foto não mostra, o modelo deduz do conhecimento aprendido. Deduz bem, mas o logotipo característico nas costas do objeto não vai brotar sozinho — escolha o ângulo que mostre o que mais importa, ou troque para o fluxo multi-vistas do Hunyuan.
Não existe modo texto. O Trellis 2 não aceita prompt. A ponte prática: crie uma referência no gerador de imagens, aprove com os olhos e converta aqui para 3D. O caminho fica um pouco mais longo — e o controle, certamente maior.
Trellis 2 vs TRELLIS original vs Hunyuan 3D 3.1
| TRELLIS (original) | Trellis 2 | Hunyuan 3D 3.1 | |
|---|---|---|---|
| Representação | Latentes estruturados sobre campos | O-Voxel, livre de campos | Reconstrução multietapas |
| Topologia | Superfícies fechadas | Arbitrária — aberta, não-manifold, interna | Estanque por projeto |
| Materiais | Centrado em cor | PBR completo com opacidade | PBR até 4K |
| Entrada | Imagem (inclusive múltiplas) | Imagem única | Texto ou imagem única |
| Licença / acesso | MIT, aberto | MIT, aberto — com barreira alta | Modelo hospedado |
Contra o antecessor, o Trellis 2 é troca de geração sem ressalvas: topologia livre, mais canais de material, resolução maior. Contra o Hunyuan 3D 3.1, é uma bifurcação de verdade: liberdade de expressão e velocidade de um lado, disciplina estanque pronta para pipeline e fidelidade de faces ocultas do outro. Por sorte, os dois moram no mesmo dropdown da página do gerador — então a comparação deixa de ser "qual comprar" e vira "qual usar em cada asset".
Guia de entrada: uma foto decide tudo
Para um modelo de imagem única, a qualidade da entrada não é uma variável — é o teto. A diferença entre o mediano e o excepcional se explica quase toda em cinco regras. Use a maior resolução que tiver: detalhe que não está na foto não brota no 3D. Ilumine por igual: sombra dura assada na imagem é lida como geometria e entalhada na superfície como relevo. Fundo liso: deixe toda a precisão da segmentação trabalhar no objeto. Objeto inteiro no quadro: borda cortada vira geometria amputada. E escolha o ângulo com mais informação — quase sempre a vista em três quartos, que mostra frente e lateral juntas, nunca a frontal achatada.
Nos parâmetros: 512³ enquanto itera, 1536³ ao fechar. Textura conforme a distância da câmera — 1024 para prop de fundo, 4096 para close — e a redução de polígonos ajustada ao orçamento da engine, não ao máximo.
Da foto ao GLB em 3 passos
Abra o gerador e selecione o Trellis 2. Envie a imagem — JPG ou PNG, até 10 MB — e ajuste resolução, tamanho de textura e meta de polígonos. Gere, inspecione no visualizador interativo e exporte o GLB com materiais PBR completos — transparência incluída. Para o Blender, Unity, Unreal ou a web.
Frequently Asked Questions
Comece a criar com o Trellis 2 hoje
Transforme ideias criativas em peças que chamam atenção. Sem precisar de conhecimento técnico.
Converter imagem em 3D