Trellis 2: el imagen a 3D open source de Microsoft, online
TRELLIS.2 convierte una foto en un asset 3D totalmente texturizado, con materiales PBR y transparencia incluida. Sáltate el setup de Linux y la GPU de 24 GB y úsalo directo en el navegador.
TRELLIS.2 —popularmente escrito Trellis 2— es un modelo de imagen a 3D de 4 mil millones de parámetros publicado en diciembre de 2025 por investigadores de Microsoft Research, Tsinghua y la Universidad de Ciencia y Tecnología de China. Su invención central, el O-Voxel (representación dispersa de vóxeles libre de campos), permite que un solo modelo genere lo que el mundo de la generación 3D históricamente rechazó: superficies abiertas como la tela y las hojas, geometría no-manifold, estructuras internas cerradas y materiales PBR completos con transparencia de verdad. En esta página, Trellis 2 funciona online y exporta GLB desde una sola foto. Sin máquina Linux, sin GPU de 24 GB, sin setup.
Por qué Trellis 2 conquistó el mundo 3D casi de la noche a la mañana
Los lanzamientos abiertos de este calibre son raros, y los números contaron la historia al instante: meses después de la publicación, los pesos de TRELLIS.2-4B superaban el millón de descargas mensuales en Hugging Face, un centenar de Spaces públicos crecía encima y el ecosistema de ComfyUI lo incorporó a los flujos de nodos en días. La valoración de la comunidad convergió rápido en dos razones: la licencia MIT entregó el «libre de verdad», y la calidad de salida cruzó una línea que hasta entonces era exclusiva de los modelos comerciales cerrados.
Pero hay una ironía en esas descargas: por los requisitos oficiales —Linux, NVIDIA de 24 GB o más, CUDA 12.4—, la mayoría de quienes se entusiasmaron con Trellis 2 no puede ejecutarlo en su propia máquina. El hueco entre «abierto a todos» y «ejecutable por pocos» es exactamente lo que llena el acceso alojado, y la razón de que esta página exista.
Qué cambió desde el TRELLIS original
El TRELLIS original, paper Spotlight de la CVPR por Microsoft, codificaba los objetos como latentes estructurados amarrados a una representación 3D basada en campos. Revolucionario, y con techo incorporado: los métodos basados en campos presuponen superficies cerradas, así que la tela, las plantas, los interiores huecos y lo no-manifold o fallaban, o quedaban «sellados» en silencio durante la conversión.
Trellis 2 no levantó el techo: lo quitó.
- El O-Voxel sustituye a los latentes atados a campos. La geometría y la apariencia se almacenan directamente en una estructura dispersa de vóxeles con ~16x de compresión espacial: la conversión con pérdidas de «campo a malla» salió del circuito.
- El generador pasó a 4 mil millones de parámetros: un Transformer de flow matching, un salto considerable de capacidad sobre la primera generación.
- La apariencia pasó a PBR completo. Color base, roughness, metallic y —único entre los grandes generadores— opacidad. La transparencia ahora se modela, no se pinta.
- La resolución se volvió un dial: tres escalones —512³, 1024³ y 1536³— en lugar de la salida de talla única.
Y una aclaración que circula mal por los foros: el condicionamiento multiimagen era función del TRELLIS original, y muchos artículos lo trasplantaron por suposición al sucesor. El pipeline público de Trellis 2 es de imagen única. Si las caras ocultas del objeto son lo que más importa, Hunyuan 3D 3.1 de este sitio sirve mejor: pasa la única imagen de entrada por un pipeline interno de reconstrucción de 8 vistas, con una recuperación más estable de lo que no aparece en la foto.
La geometría que los demás generadores «rechazan»
El argumento de venta más honesto de Trellis 2 es la lista de objetos que probablemente ya viste estropear a otros modelos. La chaqueta: superficie abierta con dentro y fuera. La planta de interior: decenas de hojas finas en alfa. La botella de vidrio: transparencia más estructura interna. El ensamblaje mecánico con cavidades que la cámara no ve, pero que existen estructuralmente.
Los modelos estanco-primero procesan todo eso «cerrándolo»: la chaqueta se vuelve un caparazón con forma de chaqueta, las hojas un bloque verde, la botella opaca. La representación de Trellis 2 no exige que las superficies envuelvan un volumen: por eso reproduce el objeto tal como es. Si tu biblioteca de assets tira a lo orgánico, las plantas, la moda y lo transparente, ese único punto pesa más que todos los demás números de la ficha técnica juntos.
Tres escalones de resolución, y la anatomía honesta de lo «rápido»
Los benchmarks publicados por Microsoft impresionan: en una H100, la inferencia bruta tarda unos 3 segundos en 512³, 17 en 1024³ y 60 en 1536³, con las etapas de forma y material incluidas. Los números son reales, pero son valores bare-metal de una GPU de centro de datos de gama alta, no el extremo a extremo de un servicio alojado con cola, decodificación y exportación. En AI 3D, el trabajo típico de Trellis 2 cierra en la ventana de 2 a 6 minutos. Conociendo ambos números, sabes exactamente lo que compras: incluso con la vara honesta, uno de los generadores 3D más rápidos de la actualidad.
El sistema de escalones premia el hábito de las dos pasadas: borradorea en 512³ para confirmar que la imagen se reconstruye bien, y reejecuta la pieza elegida en 1536³ con la textura cerca de 4096: así se hace el asset protagonista. El control de reducción de polígonos es la última pieza del dial, apuntando del presupuesto ligero de un visor web a la densidad de escultura.
Límites para meter en el plan
Los agujeros pequeños pasan. La model card oficial lo registra: las mallas pueden traer agujeros pequeños, y se recomienda posprocesado cuando se necesita estanqueidad. Para la impresión ocasional, una etapa de reparación basta. Si imprimir es tu oficio, genera en Hunyuan 3D 3.1, donde lo estanco es meta de diseño y la reparación deja de ser una etapa.
Una imagen es la verdad de un punto de vista. Todo lo que la foto no muestra, el modelo lo deduce del conocimiento aprendido. Deduce bien, pero el logotipo característico en la espalda del objeto no va a brotar solo: elige el ángulo que muestre lo más importante, o cambia al flujo multivistas de Hunyuan.
No existe el modo texto. Trellis 2 no acepta prompts. El puente práctico: crea una referencia en el generador de imágenes, apruébala con los ojos y conviértela aquí a 3D. El camino se alarga un poco, y el control, seguro, aumenta.
Trellis 2 vs TRELLIS original vs Hunyuan 3D 3.1
| TRELLIS (original) | Trellis 2 | Hunyuan 3D 3.1 | |
|---|---|---|---|
| Representación | Latentes estructurados sobre campos | O-Voxel, libre de campos | Reconstrucción multietapa |
| Topología | Superficies cerradas | Arbitraria: abierta, no-manifold, interna | Estanca por diseño |
| Materiales | Centrado en el color | PBR completo con opacidad | PBR hasta 4K |
| Entrada | Imagen (incluso múltiples) | Imagen única | Texto o imagen única |
| Licencia / acceso | MIT, abierto | MIT, abierto, con barrera alta | Modelo alojado |
Frente al antecesor, Trellis 2 es un relevo generacional sin reservas: topología libre, más canales de material, mayor resolución. Frente a Hunyuan 3D 3.1, es una bifurcación de verdad: la libertad de expresión y la velocidad de un lado, la disciplina estanca lista para pipeline y la fidelidad de las caras ocultas del otro. Por suerte, los dos viven en el mismo desplegable de la página del generador, así que la comparación deja de ser «cuál comprar» y se convierte en «cuál usar para cada asset».
Guía de entrada: una foto lo decide todo
Para un modelo de imagen única, la calidad de la entrada no es una variable: es el techo. La diferencia entre lo mediocre y lo excepcional se explica casi entera con cinco reglas. Usa la mayor resolución que tengas: el detalle que no está en la foto no brota en el 3D. Ilumina parejo: la sombra dura horneada en la imagen se lee como geometría y se talla en la superficie como relieve. Fondo liso: deja que toda la precisión de la segmentación trabaje en el objeto. El objeto entero en el encuadre: un borde cortado se vuelve geometría amputada. Y elige el ángulo con más información: casi siempre la vista en tres cuartos, que muestra el frente y el lateral juntos, nunca la frontal plana.
En los parámetros: 512³ mientras iteras, 1536³ al cerrar. La textura según la distancia de la cámara —1024 para un prop de fondo, 4096 para el primer plano— y la reducción de polígonos ajustada al presupuesto del motor, no al máximo.
De la foto al GLB en 3 pasos
Abre el generador y selecciona Trellis 2. Sube la imagen —JPG o PNG, hasta 10 MB— y ajusta la resolución, el tamaño de textura y la meta de polígonos. Genera, inspecciona el resultado en el visor interactivo y exporta el GLB con materiales PBR completos, transparencia incluida. Para Blender, Unity, Unreal o la web.
Frequently Asked Questions
Empieza a crear con Trellis 2 hoy
Convierte tus ideas creativas en piezas que llaman la atención. Sin conocimientos técnicos.
Convertir imagen a 3D