Pesquisadores descobrem uma abordagem mais flexível para aprendizado de máquina

Os pesquisadores em inteligência artificial celebraram uma série de sucessos com as redes neurais, programas de computador que imitam, aproximadamente, a organização do nosso cérebro. No entanto, apesar do rápido progresso, as redes neurais ainda são relativamente inflexíveis, com pouca capacidade de mudar rapidamente ou se adaptar a circunstâncias desconhecidas.

Em 2020, dois pesquisadores do Massachusetts Institute of Technology lideraram uma equipe que introduziu uma nova espécie de rede neural baseada na inteligência da vida real - mas não na nossa própria. Em vez disso, eles tomaram inspiração do minúsculo verme redondo, Caenorhabditis elegans, para produzir o que eles chamaram de redes neurais líquidas. Depois de um avanço no ano passado, as novas redes podem ser suficientemente versáteis para substituir seus contrapartes tradicionais em determinadas aplicações.

As redes neurais líquidas oferecem "uma alternativa elegante e compacta", disse Ken Goldberg, um robótico na Universidade da Califórnia, Berkeley. Ele acrescentou que experimentos já estão mostrando que essas redes podem funcionar mais rapidamente e com maior precisão do que outras redes neurais de tempo contínuo, que modelam sistemas que variam com o tempo.

Ramin Hasani e Mathias Lechner, as forças motrizes por trás do novo design, perceberam há anos que o C. elegans poderia ser um organismo ideal para descobrir como fazer redes neurais resistentes que pudessem acomodar surpresas. O pequeno alimentador de fundo, com milímetros de comprimento, é um dos poucos seres com um sistema nervoso totalmente mapeado e é capaz de uma variedade de comportamentos avançados: movimento, procura de alimento, sono, acasalamento e até mesmo aprendizado a partir da experiência. "Ele vive no mundo real, onde as mudanças estão sempre acontecendo, e pode se sair bem em quase qualquer condição lançada a ele", disse Lechner.

O respeito pelo humilde verme levou-o e Hasani a suas novas redes líquidas, onde cada neurônio é governado por uma equação que prevê seu comportamento ao longo do tempo. E assim como os neurônios estão ligados uns aos outros, essas equações dependem umas das outras. A rede essencialmente resolve todo esse conjunto de equações ligadas, permitindo-lhe caracterizar o estado do sistema em qualquer momento dado - um desvio das redes neurais tradicionais, que apenas dão os resultados em momentos particulares no tempo.

"Eles só podem lhe dizer o que está acontecendo em um, dois ou três segundos", disse Lechner. "Mas um modelo de tempo contínuo como o nosso pode descrever o que está acontecendo em 0,53 segundos ou 2,14 segundos ou em qualquer outro tempo que você escolher".

As redes líquidas também diferem na forma como tratam sinapses, as conexões entre os neurônios artificiais. A força dessas conexões em uma rede neural padrão pode ser expressa por um único número, seu peso. Nas redes líquidas, a troca de sinais entre neurônios é um processo probabilístico governado por uma função "não linear", o que significa que as respostas aos inputs não são sempre proporcionais. O dobro da entrada, por exemplo, poderia levar a uma mudança muito maior ou menor na saída. Essa variabilidade incorporada é o motivo pelo qual as redes são chamadas de "líquidas". A forma como um neurônio reage pode variar dependendo da entrada que ele recebe.

Enquanto os algoritmos no núcleo das redes convencionais são definidos durante o treinamento, quando esses sistemas são alimentados com grandes quantidades de dados para calibrar os melhores valores para seus pesos, as redes neurais líquidas são mais adaptáveis. "Eles são capazes de mudar suas equações subjacentes com base nas entradas que observam", especificamente mudando a velocidade com que os neurônios respondem, disse Daniela Rus, diretora do Laboratório de Ciência da Computação e Inteligência Artificial do MIT.

Um teste inicial para mostrar esta habilidade envolveu tentar dirigir um carro autônomo. Uma rede neural convencional só podia analisar dados visuais da câmera do carro em intervalos fixos. A rede líquida - composta por 19 neurônios e 253 sinapses (o que a torna minúscula pelos padrões de aprendizado de máquina) - poderia ser muito mais sensível. "Nosso modelo pode amostrar mais frequentemente, por exemplo, quando a estrada é sinuosa", disse Rus, coautora deste e de outros trabalhos sobre redes líquidas.

O modelo conseguiu manter o carro na pista, mas tinha um problema, segundo Lechner: "Ele era realmente lento". O problema surgiu das equações não-lineares que representam as sinapses e os neurônios - equações que geralmente não podem ser resolvidas sem cálculos repetidos em um computador, que passa por múltiplas iterações antes de finalmente convergir para uma solução. Esse trabalho geralmente é delegado a pacotes de software dedicados chamados solvers, que precisariam ser aplicados separadamente a cada sinapse e neurônio.

Em um trabalho do ano passado, a equipe revelou uma nova rede neural líquida que superou esse entrave. Essa rede utilizava as mesmas equações, mas a grande inovação foi a descoberta de Hasani de que essas equações não precisavam ser resolvidas por cálculos computacionais extenuantes. Em vez disso, a rede poderia funcionar usando uma solução quase exata, ou "em forma fechada", que, em princípio, poderia ser calculada com lápis e papel. Normalmente, essas equações não lineares não têm soluções em forma fechada, mas Hasani descobriu uma solução aproximada que era suficiente para uso.

"Ter uma solução de forma fechada significa que você tem uma equação na qual você pode inserir os valores de seus parâmetros e fazer as operações matemáticas básicas, e obtém uma resposta", disse Rus. "Você obtém uma resposta de uma só vez", em vez de deixar um computador trabalhar até decidir que está perto o suficiente. Isso corta o tempo e a energia computacional, acelerando consideravelmente o processo.

"O método deles está superando a concorrência por vários órdens de magnitude sem sacrificar a precisão", disse Sayan Mitra, cientista de computação na Universidade de Illinois, Urbana-Champaign.

Além de ser mais rápido, de acordo com Hasani, as suas mais recentes redes são também incomuns estáveis, o que significa que o sistema pode lidar com enormes entradas sem sair do controle. "A principal contribuição aqui é que a estabilidade e outras propriedades boas são incorporadas a esses sistemas pela própria estrutura", disse Sriram Sankaranarayanan, cientista de computação na Universidade do Colorado, Boulder. As redes líquidas parecem operar em o que ele chamou de "ponto ideal: são suficientemente complexas para permitir coisas interessantes acontecerem, mas não tão complexas a ponto de levar a comportamento caótico".

No momento, o grupo do MIT está testando sua rede mais recente em um drone autônomo aéreo. Embora o drone tenha sido treinado para navegar em uma floresta, eles o transferiram para o ambiente urbano de Cambridge para ver como ele lida com condições novas. Lechner chamou os resultados preliminares de encorajadores.

Além de aperfeiçoar o modelo atual, a equipe também está trabalhando para melhorar a arquitetura de sua rede. O próximo passo, de acordo com Lechner, "é descobrir quantos, ou quantos poucos, neurônios realmente precisamos para realizar uma tarefa dada". O grupo também deseja elaborar uma forma ótima de conectar neurônios. Atualmente, todo neurônio está ligado a todos os outros neurônios, mas isso não é como funciona em C. elegans, onde as conexões sinápticas são mais seletivas. Através de mais estudos do sistema de conexão da minhoca redonda, eles esperam determinar quais neurônios em seu sistema devem ser acoplados.

Além de aplicações como direção autônoma e voo, as redes líquidas parecem bem adequadas para a análise de redes elétricas, transações financeiras, tempo e outros fenômenos que flutuam ao longo do tempo. Além disso, de acordo com Hasani, a versão mais recente de redes líquidas pode ser usada "para realizar simulações de atividade cerebral em uma escala anteriormente impossível".

Mitra está particularmente interessado nesta possibilidade. "De certa forma, é um pouco poético, mostrando que esta pesquisa pode estar vindo em círculo completo", disse ele. "As redes neurais estão se desenvolvendo ao ponto de que as próprias ideias que extraímos da natureza logo poderão nos ajudar a entender melhor a natureza".