O novo LaLangelo (vídeo = Nvidia)
Surge um novo modelo de IA que reconstrói vídeos 2D em 3D, assim como Michelangelo esculpiu Tabitha em mármore.
A Nvidia revelou o Neuralangelo, um modelo de IA que pode transformar vídeos 2D em estruturas 3D detalhadas usando redes neurais e replicar edifícios, esculturas ou outros objetos ou espaços do mundo real. Foi postado no blog.
Neuralangelo seleciona vários quadros de um vídeo 2D que mostra o assunto de diferentes ângulos, como um artista olhando o assunto de diferentes ângulos.
Depois que a câmera é posicionada para cada quadro, a inteligência artificial de Neuralangelo cria uma representação 3D aproximada da cena, assim como um escultor começa a esculpir a forma de um objeto.
O modelo então refina a renderização, aprimorando detalhes como o relevo minucioso do escultor de pedra para imitar a textura da tela ou das figuras.
O resultado final é um objeto ou cena 3D em grande escala que pode ser usado para aplicativos de realidade virtual, gêmeos digitais ou desenvolvimento de robôs.
O conceito do Neuralangelo é semelhante ao do “3D MoMa”, uma nova ferramenta desenvolvida por pesquisadores da NVIDIA no ano passado que transforma facilmente imagens em objetos 3D, mas, da mesma forma, o Neuralangelo oferecerá áreas e objetos muito maiores e mais detalhados.
O que torna o Neuralangelo especial é sua capacidade de capturar com precisão as áreas em que os modelos anteriores de IA tiveram dificuldades: repetir padrões de textura, cores uniformes e fortes diferenças de cores.
NeRF instantâneo (vídeo = Nvidia)
A Nvidia explicou que Neuralangelo usa Instant Neural Graphics Primitives, a principal tecnologia por trás de seus Instant Neural Radiation Fields (NeRF) autodesenvolvidos, para ajudar a capturar esses detalhes finos.
O Instant NeRF é a tecnologia NeRF mais rápida disponível, aprendendo dezenas de imagens estáticas e dados sobre a posição da câmera que você tirou em segundos e transformando-os em uma cena 3D em dezenas de milissegundos.
Esta ferramenta pode converter vídeo de drone de grande área em enormes objetos 3D.
A capacidade de Neuralangelo de transformar as texturas de materiais complexos, como telhas, janelas de vidro e mármore liso de vídeo 2D para 3D, supera em muito os métodos anteriores.
A resolução mais alta também facilita a reconstrução 3D, permitindo que desenvolvedores e profissionais criativos criem rapidamente objetos virtuais que podem ser usados em seus projetos usando imagens capturadas em um smartphone.
Repórter Park Chan cpark@aitimes.com
“Pensador. Aspirante a amante do Twitter. Empreendedor. Fã de comida. Comunicador total. Especialista em café. Evangelista da web. Fanático por viagens. Jogador.”