Trellis 2: Microsofts Open-Source-Bild-zu-3D, online
TRELLIS.2 verwandelt ein Foto in ein voll texturiertes 3D-Asset, mit PBR-Materialien und Transparenz inklusive. Überspringen Sie das Linux-Setup und die 24-GB-GPU und nutzen Sie es direkt im Browser.
TRELLIS.2 – populär als Trellis 2 geschrieben – ist ein Bild-zu-3D-Modell mit 4 Milliarden Parametern, veröffentlicht im Dezember 2025 von Forschern von Microsoft Research, Tsinghua und der Universität für Wissenschaft und Technik Chinas. Seine zentrale Erfindung, das O-Voxel (eine feldfreie, dünnbesetzte Voxel-Repräsentation), erlaubt einem einzigen Modell, was die Welt der 3D-Generierung historisch verweigerte: offene Oberflächen wie Stoff und Blätter, Non-Manifold-Geometrie, geschlossene Innenstrukturen und volle PBR-Materialien mit echter Transparenz. Auf dieser Seite läuft Trellis 2 online und exportiert GLB aus einem einzigen Foto. Ohne Linux-Maschine, ohne 24-GB-GPU, ohne Setup.
Warum Trellis 2 die 3D-Welt fast über Nacht eroberte
Offene Releases dieses Kalibers sind selten, und die Zahlen erzählten die Geschichte sofort: Monate nach der Veröffentlichung überschritten die Gewichte von TRELLIS.2-4B die Million monatlicher Downloads auf Hugging Face, rund hundert öffentliche Spaces wuchsen darauf, und das ComfyUI-Ökosystem nahm es binnen Tagen in die Node-Workflows auf. Die Bewertung der Community lief schnell auf zwei Gründe zusammen: Die MIT-Lizenz lieferte das „wirklich frei“, und die Ausgabequalität überschritt eine Linie, die bis dahin den geschlossenen kommerziellen Modellen vorbehalten war.
Doch in diesen Downloads steckt eine Ironie: Wegen der offiziellen Anforderungen – Linux, NVIDIA mit 24 GB oder mehr, CUDA 12.4 – kann die Mehrheit derer, die sich für Trellis 2 begeisterten, es nicht auf der eigenen Maschine ausführen. Die Lücke zwischen „offen für alle“ und „ausführbar für wenige“ ist genau das, was der gehostete Zugang füllt, und der Grund, warum es diese Seite gibt.
Was sich seit dem originalen TRELLIS änderte
Das originale TRELLIS, ein CVPR-Spotlight-Paper von Microsoft, kodierte Objekte als strukturierte Latents, gefesselt an eine feldbasierte 3D-Repräsentation. Revolutionär, und mit eingebauter Decke: Feldbasierte Methoden setzen geschlossene Oberflächen voraus, also scheiterten Stoff, Pflanzen, hohle Innenräume und Non-Manifold entweder, oder sie wurden bei der Konvertierung leise „versiegelt“.
Trellis 2 hob die Decke nicht an: Es entfernte sie.
- Das O-Voxel ersetzt die feldgebundenen Latents. Geometrie und Aussehen liegen direkt in einer dünnbesetzten Voxel-Struktur mit ~16-facher räumlicher Kompression: Die verlustbehaftete „Feld-zu-Mesh“-Konvertierung verschwand aus dem Kreislauf.
- Der Generator wuchs auf 4 Milliarden Parameter: ein Flow-Matching-Transformer, ein erheblicher Kapazitätssprung gegenüber der ersten Generation.
- Das Aussehen wurde volles PBR. Grundfarbe, Roughness, Metallic und – einzigartig unter den großen Generatoren – Opazität. Transparenz wird jetzt modelliert, nicht gemalt.
- Die Auflösung wurde zum Drehregler: drei Stufen – 512³, 1024³ und 1536³ – statt der Einheitsausgabe.
Und eine Klarstellung, die falsch durch die Foren geistert: Die Multi-Bild-Konditionierung war eine Funktion des originalen TRELLIS, und viele Artikel übertrugen sie aus Annahme auf den Nachfolger. Die öffentliche Trellis-2-Pipeline arbeitet mit Einzelbildern. Sind die verdeckten Flächen des Objekts das Wichtigste, dient Hunyuan 3D 3.1 auf dieser Seite besser: Es schickt das eine Eingabebild durch eine interne 8-Ansichten-Rekonstruktion, mit stabilerer Wiederherstellung dessen, was im Foto fehlt.
Die Geometrie, die andere Generatoren „verweigern“
Das ehrlichste Verkaufsargument von Trellis 2 ist die Liste der Objekte, die Sie andere Modelle vermutlich schon haben ruinieren sehen. Die Jacke: offene Oberfläche mit Innen und Außen. Die Zimmerpflanze: Dutzende dünne Alpha-Blätter. Die Glasflasche: Transparenz plus Innenstruktur. Die mechanische Baugruppe mit Hohlräumen, die die Kamera nicht sieht, die aber strukturell existieren.
Wasserdicht-zuerst-Modelle verarbeiten all das durch „Schließen“: Die Jacke wird zur jackenförmigen Schale, die Blätter zum grünen Block, die Flasche deckend. Die Repräsentation von Trellis 2 verlangt nicht, dass Oberflächen ein Volumen umhüllen: Deshalb gibt es das Objekt wieder, wie es ist. Tendiert Ihre Asset-Bibliothek zu Organischem, Pflanzen, Mode und Transparentem, wiegt dieser eine Punkt schwerer als alle anderen Zahlen des Datenblatts zusammen.
Drei Auflösungsstufen, und die ehrliche Anatomie des „Schnellen“
Die von Microsoft veröffentlichten Benchmarks beeindrucken: Auf einer H100 dauert die rohe Inferenz etwa 3 Sekunden in 512³, 17 in 1024³ und 60 in 1536³, mit Form- und Materialstufe inklusive. Die Zahlen sind echt, aber es sind Bare-Metal-Werte einer High-End-Rechenzentrums-GPU, nicht das Ende-zu-Ende eines gehosteten Dienstes mit Warteschlange, Dekodierung und Export. Auf AI 3D schließt der typische Trellis-2-Auftrag im Fenster von 2 bis 6 Minuten. Mit beiden Zahlen wissen Sie genau, was Sie kaufen: Auch am ehrlichen Maßstab gemessen einer der schnellsten 3D-Generatoren der Gegenwart.
Das Stufensystem belohnt die Zwei-Pass-Gewohnheit: in 512³ entwerfen, um zu bestätigen, dass sich das Bild gut rekonstruiert, und das gewählte Stück in 1536³ mit Textur nahe 4096 neu starten: So entsteht das Hauptdarsteller-Asset. Die Polygonreduktion ist das letzte Stück des Reglers, vom leichten Budget eines Web-Viewers bis zur Skulpturdichte.
Grenzen für die Planung
Kleine Löcher passieren. Die offizielle Model Card hält fest: Meshes können kleine Löcher enthalten, und bei Bedarf an Wasserdichtigkeit wird Nachbearbeitung empfohlen. Für den Gelegenheitsdruck genügt eine Reparaturstufe. Ist Drucken Ihr Handwerk, generieren Sie in Hunyuan 3D 3.1, wo wasserdicht Designziel ist und die Reparatur als Schritt entfällt.
Ein Bild ist die Wahrheit eines Blickwinkels. Alles, was das Foto nicht zeigt, leitet das Modell aus gelerntem Wissen ab. Es leitet gut ab, aber das markante Logo auf der Rückseite des Objekts wächst nicht von allein: den Winkel wählen, der das Wichtigste zeigt, oder zum Multi-Ansichten-Workflow von Hunyuan wechseln.
Es gibt keinen Textmodus. Trellis 2 akzeptiert keine Prompts. Die praktische Brücke: eine Referenz im Bildgenerator erstellen, mit den Augen abnehmen und hier in 3D umwandeln. Der Weg wird etwas länger, und die Kontrolle sicher größer.
Trellis 2 vs. originales TRELLIS vs. Hunyuan 3D 3.1
| TRELLIS (Original) | Trellis 2 | Hunyuan 3D 3.1 | |
|---|---|---|---|
| Repräsentation | Strukturierte Latents auf Feldern | O-Voxel, feldfrei | Mehrstufige Rekonstruktion |
| Topologie | Geschlossene Oberflächen | Beliebig: offen, Non-Manifold, innen | Wasserdicht per Design |
| Materialien | Farbzentriert | Volles PBR mit Opazität | PBR bis 4K |
| Eingabe | Bild (auch mehrere) | Einzelbild | Text oder Einzelbild |
| Lizenz / Zugang | MIT, offen | MIT, offen, mit hoher Hürde | Gehostetes Modell |
Gegenüber dem Vorgänger ist Trellis 2 ein Generationswechsel ohne Vorbehalte: freie Topologie, mehr Materialkanäle, höhere Auflösung. Gegenüber Hunyuan 3D 3.1 ist es eine echte Weggabelung: Ausdrucksfreiheit und Tempo auf der einen Seite, pipelinefertige wasserdichte Disziplin und Treue verdeckter Flächen auf der anderen. Zum Glück wohnen beide im selben Dropdown der Generatorseite, also wird aus dem Vergleich kein „Welches kaufen“ mehr, sondern ein „Welches für welches Asset“.
Eingabe-Leitfaden: ein Foto entscheidet alles
Für ein Einzelbildmodell ist die Eingabequalität keine Variable: Sie ist die Decke. Der Unterschied zwischen mittelmäßig und herausragend erklärt sich fast vollständig mit fünf Regeln. Die höchste Auflösung nehmen, die Sie haben: Detail, das nicht im Foto ist, wächst nicht im 3D. Gleichmäßig ausleuchten: Ein harter, ins Bild gebackener Schatten wird als Geometrie gelesen und wie ein Relief in die Oberfläche geschnitten. Einfarbiger Hintergrund: die ganze Präzision der Segmentierung dem Objekt überlassen. Das Objekt vollständig im Bild: Ein beschnittener Rand wird zu amputierter Geometrie. Und den informationsreichsten Winkel wählen: fast immer die Dreiviertelansicht, die Front und Seite zugleich zeigt, nie die flache Frontale.
Bei den Parametern: 512³ beim Iterieren, 1536³ beim Abschluss. Die Textur nach Kameradistanz – 1024 für die Hintergrundrequisite, 4096 fürs Close-up – und die Polygonreduktion ans Engine-Budget angepasst, nicht ans Maximum.
Vom Foto zum GLB in 3 Schritten
Öffnen Sie den Generator und wählen Sie Trellis 2. Bild hochladen – JPG oder PNG, bis 10 MB – und Auflösung, Texturgröße und Polygonziel einstellen. Generieren, das Ergebnis im interaktiven Viewer inspizieren und das GLB mit vollen PBR-Materialien exportieren, Transparenz inklusive. Für Blender, Unity, Unreal oder das Web.
Frequently Asked Questions
Starten Sie noch heute mit Trellis 2
Verwandeln Sie kreative Ideen in Werke, die Aufmerksamkeit fangen. Ohne Fachwissen.
Bild in 3D umwandeln