Pesquisadores Reproduzem Tecnologia de IA por Apenas R$ 150
Um grupo de pesquisadores da Universidade da Califórnia, em Berkeley, afirmou ter reproduzido a tecnologia central da revolucionária IA DeepSeek, que foi desenvolvida na China, por apenas 30 dólares, o que equivale a cerca de R$ 150. Essa criação de baixo custo destaca que, embora as soluções de empresas maiores sejam impressionantes, existem métodos mais acessíveis para desenvolver modelos de inteligência artificial.
O Projeto e Suas Descobertas
Sob a liderança do doutorando Jiayi Pan, os pesquisadores replicaram as capacidades de aprendizado por reforço do DeepSeek R1-Zero utilizando um pequeno modelo de linguagem com apenas 3 bilhões de parâmetros. Apesar de seu tamanho relativamente modesto, a IA demonstrou habilidades de autoverificação e busca, características essenciais que permitem que ela refine suas próprias respostas de maneira iterativa.
Para testar a recreação do DeepSeek, a equipe de Berkeley usou o jogo Countdown, um quebra-cabeça numérico inspirado em um famoso programa de televisão britânico, onde os jogadores precisam usar aritmética para chegar a um número alvo. No início, o modelo produziu respostas aleatórias. No entanto, através do aprendizado por reforço, ele desenvolveu técnicas de autocorreção e resolução de problemas.
Gradualmente, a IA aprendeu a revisar suas respostas até encontrar a solução correta. Os pesquisadores também testaram operações de multiplicação, nas quais a IA destrinchou as equações utilizando a propriedade distributiva, de maneira similar ao que humanos fazem ao resolver problemas de multiplicação mentalmente. Esse teste demonstrou a capacidade do modelo de adaptar sua estratégia de acordo com a natureza do problema.
Custo de Desenvolvimento e Implicações
O que é particularmente impressionante é que toda essa recriação custou apenas 30 dólares, segundo Pan. Esse valor é uma fração irrisória do que as grandes empresas de IA costumam gastar em treinamentos em larga escala. Os pesquisadores experimentaram diferentes tamanhos de modelo, começando com um modelo de 500 milhões de parâmetros, que apenas fazia suposições e parava, sem considerar a precisão.
Quando aumentaram para 1,5 bilhão de parâmetros, a recriação do DeepSeek começou a incorporar técnicas de revisão. Modelos entre 3 e 7 bilhões de parâmetros mostraram melhorias significativas, resolvendo problemas em menos etapas e com maior precisão.
Para se ter uma ideia, a OpenAI cobra 15 dólares por milhão de tokens pelo uso de sua API, enquanto o DeepSeek oferece um custo muito menor, de 0,55 dólares por milhão de tokens. As descobertas da equipe de Berkeley sugerem que modelos de IA altamente capazes podem ser desenvolvidos por uma fração do custo atualmente investido pelas principais empresas de inteligência artificial.
Cuidado com os Riscos Associados ao DeepSeek
Apesar do custo acessível, existem muitos motivos para ter cautela com o uso do DeepSeek. Alguns especialistas, como o pesquisador de IA Nathan Lambert, levantaram preocupações sobre a real abrangência dos custos informados para treinar o modelo de 671 bilhões de parâmetros da DeepSeek, estimados em 5 milhões de dólares. Além disso, a IA envia uma grande quantidade de dados de volta para a China, o que gera preocupações de segurança que já levaram a proibições do DeepSeek em várias partes dos Estados Unidos.
Lambert estima que as despesas operacionais anuais da DeepSeek podem variar entre 500 milhões e mais de 1 bilhão de dólares, levando em conta diversos fatores, como infraestrutura, consumo de energia e salários dos pesquisadores. A OpenAI também indicou que há evidências de que o DeepSeek foi treinado utilizando o ChatGPT, o que poderia ajudar a explicar alguns dos custos reduzidos.
Mesmo assim, o trabalho da equipe de Berkeley comprova que é possível alcançar avanços significativos em aprendizado por reforço sem os enormes orçamentos que gigantes da indústria, como OpenAI, Google e Microsoft, normalmente alocam. Com alguns laboratórios de IA gastando até 10 bilhões de dólares anualmente em treinamento de modelos, essa pesquisa pode sinalizar um potencial ponto de mudança no campo da inteligência artificial.