Trellis 2 : le modèle image vers 3D open source de Microsoft, en ligne
TRELLIS.2 transforme une seule photo en asset 3D entièrement texturisé avec matériaux PBR — transparence comprise. Oubliez l'installation Linux plus GPU de 24 Go : il tourne directement dans votre navigateur.
TRELLIS.2 — généralement écrit Trellis 2 — est un modèle image vers 3D de 4 milliards de paramètres, publié en décembre 2025 par des chercheurs de Microsoft Research, de l'université Tsinghua et de l'USTC. Son invention centrale, une représentation en voxels épars sans champ baptisée O-Voxel, permet à un seul modèle de générer ce que les générateurs 3D ont historiquement refusé : des surfaces ouvertes comme le tissu et les feuilles, de la géométrie non-manifold, des structures intérieures closes, et des matériaux PBR complets incluant une vraie transparence. Sur cette page, vous pouvez utiliser Trellis 2 en ligne et exporter des fichiers GLB depuis une seule photo — sans machine Linux, sans GPU de 24 Go, sans installation.
Pourquoi Trellis 2 a conquis la génération 3D presque du jour au lendemain
Les publications ouvertes de ce calibre sont rares, et les chiffres l'ont montré immédiatement : quelques mois après la sortie, les poids TRELLIS.2-4B se téléchargeaient depuis Hugging Face à un rythme de plus d'un million par mois, avec une centaine de Spaces publics construits dessus et l'écosystème ComfyUI qui l'a câblé dans ses workflows de nœuds en quelques jours. Le sentiment communautaire a vite convergé vers les deux mêmes raisons — la licence MIT le rendait réellement libre d'usage, et la qualité de sortie franchissait une ligne jusque-là réservée aux modèles commerciaux fermés.
Il y a pourtant une ironie dans ces chiffres de téléchargement. Les prérequis officiels — Linux, un GPU NVIDIA de 24 Go ou plus, CUDA 12.4 — signifient que la plupart des gens enthousiasmés par Trellis 2 ne peuvent pas le faire tourner sur leur propre machine. Cet écart entre « ouvert à tous » et « exécutable par peu » est exactement ce que l'accès hébergé referme — et c'est la raison d'être de cette page.
Les nouveautés face au TRELLIS d'origine
Le premier TRELLIS, un article CVPR Spotlight de Microsoft, encodait les objets en latents structurés liés à des représentations 3D par champs. C'était une percée avec un plafond intégré : les approches par champs supposent des surfaces fermées — le tissu, le feuillage, les intérieurs creux et tout ce qui est non-manifold échouait, ou se faisait « solidifier » en silence à la conversion.
Trellis 2 ne relève pas ce plafond : il le supprime.
- O-Voxel remplace les latents liés aux champs. La géométrie et l'apparence sont stockées directement dans une structure de voxels épars, avec environ 16 fois de compression spatiale — aucune conversion champ-vers-maillage destructrice dans la boucle.
- Le générateur passe à 4 milliards de paramètres avec un transformer flow-matching — un bond de capacité significatif sur l'original.
- L'apparence devient du PBR complet. Couleur de base, roughness, metallic et — fait unique parmi les générateurs grand public — l'opacité : la transparence est modélisée, pas truquée.
- La résolution devient un curseur, avec des paliers de génération 512³, 1024³ et 1536³ à la place d'une sortie taille unique.
Une correction mérite d'être faite explicitement, car elle circule largement sur les forums : le conditionnement multi-images était une fonctionnalité du TRELLIS d'origine, et beaucoup d'articles l'ont reportée sur la suite par supposition. Le pipeline Trellis 2 publié est mono-image. Si les faces cachées de votre objet sont l'enjeu principal, Hunyuan 3D 3.1 sur ce site est plus adapté — il envoie son unique image d'entrée dans un pipeline interne de reconstruction à 8 vues.
La géométrie que les autres générateurs refusent
Le pitch honnête le plus court pour Trellis 2, c'est la liste des objets que vous avez probablement vu d'autres modèles massacrer. Une veste — des surfaces ouvertes à deux faces distinctes. Une plante d'intérieur — des dizaines de feuilles fines en alpha. Une bouteille en verre — de la transparence plus un intérieur. Un assemblage mécanique avec des cavités internes que l'objectif n'a jamais vues mais que la structure implique.
Les modèles étanches d'abord traitent tout cela en le refermant : la veste devient une coque en forme de veste, les feuilles fusionnent en masses vertes, la bouteille devient opaque. La représentation de Trellis 2, elle, n'exige tout simplement pas que les surfaces enferment un volume — elle reproduit l'objet tel qu'il est. Si votre bibliothèque d'assets penche vers l'organique, le végétal, la mode ou le transparent, cette seule propriété pèse plus lourd que toutes les autres specs de la fiche.
Les paliers de résolution — et les chiffres honnêtes derrière « rapide »
Les benchmarks publiés par Microsoft sont frappants : sur un H100, l'inférence brute prend environ 3 secondes en 512³, autour de 17 secondes en 1024³ et près de 60 secondes en 1536³, étapes de forme et de matériaux comprises. Ces chiffres sont réels — mais ce sont des mesures à nu sur un GPU de datacenter haut de gamme, pas ce qu'un service hébergé livre de bout en bout une fois la file d'attente, le décodage et l'export comptés. Sur AI 3D, une tâche Trellis 2 typique se termine dans une fenêtre de 2 à 6 minutes. Connaître les deux chiffres vous dit ce que vous achetez vraiment : l'un des générateurs 3D les plus rapides du moment, mesuré honnêtement.
Le système de paliers récompense une habitude en deux passes : brouillonner en 512³ pour confirmer que l'image se reconstruit bien, puis relancer la version retenue en 1536³ avec la taille de texture montée vers 4096 pour les assets de premier plan. Un contrôle de réduction de polygones complète les curseurs, pour viser aussi bien un budget de visionneuse web qu'un maillage en densité de sculpture.
Les limites à anticiper
Les petits trous existent. La fiche officielle du modèle l'écrit noir sur blanc : les maillages peuvent contenir de petits trous, et un post-traitement est recommandé quand l'étanchéité est requise. Pour des impressions occasionnelles, une passe de réparation de maillage suffit ; si l'impression est votre charge principale, générez plutôt sur Hunyuan 3D 3.1, où la sortie étanche est un objectif de conception, pas une étape de réparation.
Une image, un seul point de vue de vérité. Tout ce que la photo ne montre pas, le modèle le déduit de ses a priori appris. Il déduit bien — mais un logo distinctif au dos d'un objet ne s'inventera pas. Choisissez l'angle qui montre l'essentiel, ou passez par Hunyuan 3D 3.1, dont le pipeline interne à 8 vues restitue plus fidèlement les faces cachées.
Pas de mode texte. Trellis 2 n'accepte pas de prompts. Le pont pratique : générez une référence avec le générateur d'images IA, validez-la visuellement, puis convertissez-la ici. Un chemin légèrement plus long, un contrôle strictement supérieur.
Trellis 2 vs TRELLIS 1 vs Hunyuan 3D 3.1
| TRELLIS (original) | Trellis 2 | Hunyuan 3D 3.1 | |
|---|---|---|---|
| Représentation | Latents structurés sur champs | O-Voxel, sans champ | Reconstruction multi-étapes |
| Topologie | Surfaces fermées | Libre — ouverte, non-manifold, intérieurs | Étanche par conception |
| Matériaux | Centrés couleur | PBR complet, opacité comprise | PBR jusqu'en 4K |
| Entrées | Image, multi-images comprise | Image unique | Texte ou image unique |
| Licence / accès | MIT, ouvert | MIT, ouvert — matériel lourd | Modèle de plateforme hébergé |
Face à son prédécesseur, Trellis 2 est une victoire générationnelle nette — plus de topologies, plus de canaux de matériaux, plus de résolution. Face à Hunyuan 3D 3.1, c'est une vraie bifurcation de priorités : liberté de représentation et vitesse d'un côté, discipline étanche prête pour le pipeline et fidélité des faces cachées de l'autre. Les deux tournent depuis le même menu déroulant sur la page de génération — la comparaison cesse d'être une décision d'achat pour devenir un choix par asset.
Le manuel d'entrée : une photo décide de tout
Avec un modèle mono-image, la qualité d'entrée n'est pas un facteur — c'est le plafond. Cinq règles capturent l'essentiel de l'écart entre résultats médiocres et excellents. Utilisez l'image la plus haute résolution disponible : le détail absent de la photo ne réapparaîtra pas en 3D. Éclairez uniformément — les ombres dures cuites dans l'image sont lues comme de la géométrie et s'embossent dans la surface. Gardez un fond uni, pour que la segmentation dépense sa précision sur l'objet. Cadrez l'objet entier — un bord coupé devient une géométrie amputée. Et choisissez l'angle le plus riche en information, typiquement une vue de trois quarts montrant la face et le côté à la fois, plutôt qu'une vue frontale plate.
Côté paramètres : 512³ pendant l'itération, 1536³ pour le final, taille de texture accordée à la distance de caméra — 1024 pour les props d'arrière-plan, 4096 pour les gros plans — et réduction de polygones réglée sur le budget de votre moteur plutôt qu'au maximum.
De la photo au GLB en trois étapes
Ouvrez le générateur et sélectionnez Trellis 2. Importez votre image — JPG ou PNG jusqu'à 10 Mo — et réglez résolution, taille de texture et cible de polygones. Générez, inspectez le résultat dans la visionneuse interactive, et exportez un GLB avec matériaux PBR complets, transparence comprise, prêt pour Blender, Unity, Unreal ou le web.
Frequently Asked Questions
Créez avec Trellis 2 dès aujourd'hui
Transformez vos idées créatives en contenus aboutis — aucune expertise technique requise.
Convertir une image en 3D