Lyra 2.0 (Nvidia)

Generazione di mondi 3D persistenti da una semplice foto, in open source.

💰Gratuito (open source) ★★★★½ 4,8/5 (89 voto)

Creazione Video

#B-roll & stock video #Open source #Storyboards #Text-to-video

Prova Lyra 2.0 (Nvidia) →

Anteprima di Lyra 2.0 (Nvidia)

https://research.nvidia.com/labs/sil/projects/lyra2/

Visita Lyra 2.0 (Nvidia) →

Presentazione dettagliata

Lyra 2.0 è un __framework open source__ sviluppato da Nvidia Spatial Intelligence Lab che trasforma una singola immagine in un __mondo 3D persistente ed esplorabile__. Il sistema si basa su un modello di diffusione video, genera un percorso di camera controllato e poi ricostruisce il risultato in __3D Gaussian Splats__ e mesh. Distribuito sotto licenza Apache 2.0 con pesi e codice disponibili su Hugging Face e GitHub, è utilizzabile per la simulazione robotica, lo storyboarding e la creazione immersiva.

Cos’è Lyra 2.0 (Nvidia)?

Lyra 2.0 è un framework di ricerca open source dedicato alla generazione di mondi 3D persistenti dalle immagini. Dove altri approcci producono sequenze video limitate nel tempo, Lyra 2.0 punta sulla coerenza spaziale e temporale per offrire un ambiente esplorabile in tempo reale, esportabile verso motori come NVIDIA Isaac Sim. Il progetto è guidato da Nvidia Spatial Intelligence Lab ed è pubblicato sotto licenza Apache 2.0, con tutto il codice e i pesi disponibili su Hugging Face e GitHub. Questa apertura lo rende un riferimento sia per la ricerca accademica che per l’industria che desideri integrare la generazione 3D nei prodotti.

Funzioni principali

Lyra 2.0 propone diverse innovazioni tecniche. La pipeline parte da una singola immagine sorgente e genera un video di percorso di camera utilizzando un modello di diffusione video basato su Wan 2.1-14B. Questo video viene poi ricostruito in 3D Gaussian Splats e mesh, il che consente un’esplorazione in tempo reale e l’esportazione verso motori fisici. Per risolvere i problemi classici di coerenza, Lyra 2.0 introduce due idee forti: una geometria per immagine per il routing delle informazioni, che riduce la perdita spaziale, e un addestramento auto-aumentato che insegna al modello a correggere le sue derivazioni temporali. Il risultato è un ambiente più stabile, più coerente e più utilizzabile rispetto agli approcci precedenti. Il framework integra strumenti per esportare facilmente le scene verso Isaac Sim, il che apre la strada agli addestramenti robotici basati su ambienti generati. Lyra 2.0 si basa su una pipeline modulare che i ricercatori possono estendere, modificare o combinare con altri modelli. La distribuzione open source si accompagna a script di inferenza, modelli pre-addestrati e notebook di esempio per facilitare l’adozione.

Casi d’uso

Lyra 2.0 si rivolge a diversi profili di creatori e ricercatori. I laboratori di robotica lo utilizzano per addestrare i loro agenti in ambienti 3D generati su larga scala, il che riduce la dipendenza da scansioni fisiche costose. Gli studi di videogiochi e realtà virtuale lo sfruttano per produrre scenari preliminari o ambienti sperimentali. I team di produzione cinematografica lo utilizzano per lo storyboarding immersivo, trasformando i concetti in scene esplorabili prima delle riprese. I ricercatori di computer vision integrano il framework nei loro stessi pipeline per studiare la coerenza spaziale e temporale. I creatori in realtà aumentata infine esplorano la possibilità di generare ambienti personalizzati da immagini di riferimento.

Vantaggi

L’adozione di Lyra 2.0 apporta diversi benefici per gli utenti avanzati. La velocità di produzione di scene 3D esplorabili è radicalmente superiore alle pipeline tradizionali, che richiedono modellazione, texturing e illuminazione manuali. La licenza Apache 2.0 autorizza un uso commerciale senza vincoli, il che rende il framework attraente per le startup e gli editori. La compatibilità con gli strumenti Nvidia come Isaac Sim semplifica l’integrazione nelle catene esistenti. La qualità spaziale e temporale migliora l’affidabilità degli ambienti per la simulazione e l’addestramento degli agenti IA. Infine, l’apertura del codice e dei pesi favorisce una comunità attiva che contribuisce all’evoluzione del framework e propone ottimizzazioni adatte a diverse apparecchiature.

Prezzi

Lyra 2.0 è un progetto open source distribuito gratuitamente sotto licenza Apache 2.0. Il codice è disponibile su GitHub, i pesi su Hugging Face, e l’utilizzo locale o cloud del framework non richiede licenze commerciali aggiuntive. I costi associati riguardano essenzialmente le risorse GPU necessarie per l’inferenza o l’addestramento, che possono essere significativi a seconda dei casi d’uso. Per i team che non dispongono della propria infrastruttura, i fornitori cloud come AWS, GCP o le piattaforme specializzate propongono GPU H100 o equivalenti adatti a questi carichi.

Conclusione

Lyra 2.0 è un progresso importante per la generazione di mondi 3D dalle immagini. La sua apertura, qualità e integrazione nella pipeline Nvidia lo rendono un framework di riferimento per la ricerca e alcuni usi industriali. Per gli utenti del grande pubblico, lo strumento rimane troppo tecnico, ma per gli studi, i laboratori e i team ML ambiziosi, è un must-have.

❓ DOMANDE FREQUENTI

FAQ — Lyra 2.0 (Nvidia)

Cos'è Lyra 2.0?

Lyra 2.0 è un framework open source di Nvidia che trasforma una singola immagine in un mondo 3D persistente ed esplorabile, esportabile in Gaussian Splats.

Lyra 2.0 è gratuito?

Sì, Lyra 2.0 è distribuito sotto licenza Apache 2.0 con pesi del modello disponibili su Hugging Face e codice su GitHub.

A cosa serve Lyra 2.0?

Lyra 2.0 è utilizzato per la simulazione robotica, la creazione VR, lo storyboarding 3D e la ricerca in computer vision.

È necessaria una GPU per utilizzare Lyra 2.0?

Sì, l’utilizzo locale del framework richiede GPU performanti, come è il caso per i moderni modelli di diffusione video.

Lyra 2.0 può essere utilizzato commercialmente?

Sì, la licenza Apache 2.0 autorizza un uso commerciale, il che apre la strada alle integrazioni nei prodotti e servizi.

★★★★½ 4.8/5 (89 recensioni)

✅ Verificato da Comparateur-IA

Creazione Video

Generazione di mondi 3D persistenti da una semplice foto, in open source.