Avanços recentes em grandes modelos de linguagem (LLMs) tornaram a inteligência artificial mais adaptável do que nunca, mas isso traz uma desvantagem: mentiras. A IA generativa tende a inventar coisas, mas o Google DeepMind desenvolveu um novo LLM que se apega a verdades matemáticas. O FunSearch da empresa pode resolver problemas matemáticos altamente complexos. Milagrosamente, as soluções que gera não são apenas precisas; são soluções inteiramente novas que nenhum ser humano jamais encontrou.
FunSearch recebe esse nome porque procura funções matemáticas, não porque seja divertido. Embora algumas pessoas possam considerar o problema do limite máximo uma verdadeira piada – os matemáticos nem conseguem concordar sobre a melhor forma de resolvê-lo, tornando-o um verdadeiro mistério numérico. A DeepMind já fez avanços em IA com seus modelos Alpha como AlphaFold (dobramento de proteínas), AlphaStar (StarCraft) e AlphaGo (jogar Go). Estes sistemas não foram baseados em LLMs, mas revelaram novos conceitos matemáticos.
Com o FunSearch, a DeepMind começou com um modo de linguagem grande, uma versão do PaLM 2 do Google chamada Codey. Há uma segunda camada LLM em funcionamento, que verifica a saída do Codey e remove informações incorretas. A equipe por trás deste trabalho não sabia se essa abordagem funcionaria e ainda não sabe ao certo por que funciona, de acordo com o pesquisador da DeepMind, Alhussein Fawzi.
Para começar, os engenheiros da DeepMind criaram uma representação em Python do problema do conjunto de limites, mas deixaram de fora as linhas que descreviam a solução. O trabalho de Codey era adicionar linhas que resolvessem o problema com precisão. A camada de verificação de erros então pontua as soluções do Codey para ver se elas são precisas. Na matemática de alto nível, as equações podem ter mais de uma solução, mas nem todas são consideradas igualmente boas. Com o tempo, o algoritmo identifica as melhores soluções do Codey e as realimenta no modelo.
Crédito: Google
A DeepMind permitiu que o FunSearch funcionasse por vários dias, tempo suficiente para gerar milhões de soluções possíveis. Isso permitiu que o FunSearch refinasse o código e produzisse melhores resultados. De acordo com a pesquisa recém-publicada, a IA apresentou uma solução até então desconhecida, mas correta, para o problema do conjunto de limites. O DepMind também liberou o FunSearch em outra parte difícil da matemática chamada problema de empacotamento de lixeiras, um algoritmo que descreve a maneira mais eficiente de embalar lixeiras. O FunSearch encontrou uma solução mais rápida do que as calculadas por humanos.
Os matemáticos ainda estão lutando para integrar a tecnologia LLM em seu trabalho, e o trabalho na DeepMind mostra um possível caminho a seguir. A equipe acredita que esta abordagem tem potencial porque gera código de computador e não a solução. Isso geralmente é mais fácil de entender e verificar do que resultados matemáticos brutos.