Nvidia revela “Neuralangelo”, um modelo de inteligência artificial que converte vídeo 2D em 3D


O novo LaLangelo (vídeo = Nvidia)


Surge um novo modelo de IA que reconstrói vídeos 2D em 3D, assim como Michelangelo esculpiu Tabitha em mármore.


A Nvidia revelou o Neuralangelo, um modelo de IA que pode transformar vídeos 2D em estruturas 3D detalhadas usando redes neurais e replicar edifícios, esculturas ou outros objetos ou espaços do mundo real. Foi postado no blog.


Neuralangelo seleciona vários quadros de um vídeo 2D que mostra o assunto de diferentes ângulos, como um artista olhando o assunto de diferentes ângulos.


Depois que a câmera é posicionada para cada quadro, a inteligência artificial de Neuralangelo cria uma representação 3D aproximada da cena, assim como um escultor começa a esculpir a forma de um objeto.


O modelo então refina a renderização, aprimorando detalhes como o relevo minucioso do escultor de pedra para imitar a textura da tela ou das figuras.


O resultado final é um objeto ou cena 3D em grande escala que pode ser usado para aplicativos de realidade virtual, gêmeos digitais ou desenvolvimento de robôs.


O conceito do Neuralangelo é semelhante ao do “3D MoMa”, uma nova ferramenta desenvolvida por pesquisadores da NVIDIA no ano passado que transforma facilmente imagens em objetos 3D, mas, da mesma forma, o Neuralangelo oferecerá áreas e objetos muito maiores e mais detalhados.


O que torna o Neuralangelo especial é sua capacidade de capturar com precisão as áreas em que os modelos anteriores de IA tiveram dificuldades: repetir padrões de textura, cores uniformes e fortes diferenças de cores.


NeRF instantâneo (vídeo = Nvidia)


READ  ´º½ºÅÇ ¸ð¹ »çÀÌÆ®, ¾Æ½ºÅ© ÅØ, separar × ÀÌÅ© CTE C750 ½Ã¸®Áî â½Ã

A Nvidia explicou que Neuralangelo usa Instant Neural Graphics Primitives, a principal tecnologia por trás de seus Instant Neural Radiation Fields (NeRF) autodesenvolvidos, para ajudar a capturar esses detalhes finos.


O Instant NeRF é a tecnologia NeRF mais rápida disponível, aprendendo dezenas de imagens estáticas e dados sobre a posição da câmera que você tirou em segundos e transformando-os em uma cena 3D em dezenas de milissegundos.


Esta ferramenta pode converter vídeo de drone de grande área em enormes objetos 3D.


A capacidade de Neuralangelo de transformar as texturas de materiais complexos, como telhas, janelas de vidro e mármore liso de vídeo 2D para 3D, supera em muito os métodos anteriores.


A resolução mais alta também facilita a reconstrução 3D, permitindo que desenvolvedores e profissionais criativos criem rapidamente objetos virtuais que podem ser usados ​​em seus projetos usando imagens capturadas em um smartphone.


Repórter Park Chan cpark@aitimes.com



Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *