DeepMind AI Alpha Zero escreve um novo recorde inquebrável de ciência da computação por mais de 50 anos

Alfabeto afiliado mente profundaGA jogo de tabuleiro Inteligência Artificial (AI) Alfa ZeroEncontrei uma maneira mais rápida de resolver problemas básicos de matemática em ciência da computação com Alpha Zero Alpha Zero já quebrou recordes que existem há mais de 50 anos e tem mostrado resultados notáveis.

O problema com o qual AlphaZero está lidando desta vez é a “multiplicação de matrizes”, que desempenha um papel fundamental em tarefas que vão desde a exibição de imagens em uma tela até a simulação de física complexa. A multiplicação de matrizes também é essencial para o aprendizado de máquina. Portanto, acelerar o processo de multiplicação de matrizes terá um impacto significativo em muitas tarefas diárias de computação, resultando em economia de custos e economia de energia.

François Le Gall, professor de matemática da Universidade de Nagoya, no Japão, expressou sua admiração pelas conquistas do AlphaZero, dizendo: “É um resultado incrível”. Ele disse: “A multiplicação de matrizes é usada em todas as partes da geometria, se você quiser resolver algo numericamente, geralmente usa uma matriz”.

Como tal, a aritmética matricial é usada universalmente, mas a compreensão da aritmética ainda não é alta. Um array é um número organizado em uma grade com colunas e linhas, que podem representar o que você quiser. A multiplicação de duas matrizes geralmente se refere à multiplicação das linhas de uma matriz pelas colunas da outra matriz. O método básico para resolver problemas de multiplicação de matrizes é aprendido no ensino médio. “A Matrix é como o alfabeto básico da computação”, disse Pushmeet Kohli, líder da equipe de AI for Science da DeepMind.

No entanto, as coisas ficam complicadas quando você tenta encontrar uma maneira mais rápida de resolver o problema da multiplicação de matrizes. “Ninguém conhece o melhor algoritmo para resolver problemas de multiplicação de matrizes”, disse Le Gall.

READ  O "fim do universo" onde a humanidade não pode chegar

Isso ocorre porque há mais maneiras de multiplicar duas matrizes do que átomos no universo. “As possibilidades são quase ilimitadas”, disse o engenheiro da DeepMind, Thomas Hubert.

A abordagem adotada pela DeepMind foi transformar o problema em um tipo de jogo de tabuleiro 3D chamado TensorGame. O quadro representa o problema de multiplicação a ser resolvido, e cada passo representa o próximo passo no processo de resolução do problema. Assim, a sequência de movimentos que são feitos neste jogo torna-se um algoritmo.

Os pesquisadores treinaram uma nova versão do AlphaZero chamada AlphaTensor para jogar o jogo. Em vez de aprender os melhores movimentos em Go ou Chess, o Alphatensor aprendeu os melhores movimentos para usar na multiplicação de matrizes. Ganhar o jogo com o menor número de movimentos foi recompensado.

“Transformamos o problema da multiplicação de matrizes em nossa estrutura de jogo favorita”, disse Herbert, um dos pesquisadores que liderou o estudo AlphaZero.

Em um trabalho de pesquisa publicado em <الطبيعة> No quinto (horário local), os pesquisadores detalharam a solução de multiplicação de matrizes usando alfa-zero. O resultado mais importante do artigo é que quando o tensor alfa multiplica duas matrizes 4×4, elas encontram um caminho mais rápido do que o método desenvolvido pelo matemático alemão Volker Strassen em 1969. Por mais de 50 anos, ninguém melhorou o método desenvolvido por Strassen. O método básico ensinado no ensino médio requer 64 passos para multiplicar a matriz 4×4, enquanto o método Strassen requer 49 passos. O tensor alfa encontrou uma maneira de calcular em 47 passos.

Em geral, o alphatensor encontrou uma maneira de superar os melhores algoritmos que antes eram considerados os melhores algoritmos para multiplicar matrizes de mais de 70 tamanhos diferentes. O tensor alfa reduziu os passos necessários para multiplicar duas matrizes 9×9 de 511 para 498, e reduziu os passos necessários para multiplicar 11×11 de 919 para 896. Para as outras matrizes, redescobrimos o algoritmo que foi considerado o melhor, embora não pudéssemos reduzir os passos.

READ  A cidade de Asan, o primeiro "projeto de assistência médica na primeira infância" de Chungcheongnam-do, continua a receber críticas positivas dos cidadãos

Os pesquisadores ficaram muito surpresos ao descobrir que muitos algoritmos eram sensores alfa precisos ao atingir matrizes de diferentes tamanhos. “Fiquei muito surpreso ao descobrir que existem pelo menos 14.000 maneiras de resolver a multiplicação de matrizes 4X4”, disse Hussain Fawzy, cientista da DeepMind Research.

A equipe de pesquisa da DeepMind, que estava procurando o algoritmo teoricamente mais rápido, queria saber qual algoritmo era realmente o mais rápido. Como os chips de computador geralmente são projetados para tipos específicos de operações, algoritmos diferentes possuem hardwares diferentes que podem alcançar melhores resultados. A equipe de pesquisa da DeepMind usou tensores alfa para encontrar algoritmos adequados para os processadores Nvidia V100 GPU e Google TPU, que são comumente usados ​​para treinar redes neurais. O algoritmo que eles encontraram foi cerca de 10 a 20 por cento mais rápido na multiplicação de matrizes do que o normalmente usado usando o chip.

Virginia Williams, do Laboratório de Ciência da Computação e Inteligência Artificial do Instituto de Tecnologia de Massachusetts (MIT), ficou animada ao ver os resultados. Williams observa que as pessoas têm usado métodos auxiliados por computador para encontrar novos algoritmos para multiplicar matrizes há algum tempo, e muitos dos algoritmos mais rápidos existentes foram projetados dessa maneira. No entanto, ninguém melhorou o método de longo prazo como o método Strassen.

“Este método é muito diferente do que os outros fizeram”, disse Williams. “Seria bom.”

DeepMind agora usa sensores alfa para encontrar outros tipos de algoritmos. “Agora, esta é uma nova maneira de fazer ciência da computação”, disse Cooley.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *