Uma nova startup chinesa chamada DeepSeek está chamando atenção no mundo da tecnologia com o lançamento de seu modelo de inteligência artificial, o R1. Este modelo promete ser mais barato e acessível, o que fez com que muitos olhassem para ele como um concorrente sério de outras tecnologias já estabelecidas, como a da OpenAI. O impacto na bolsa de valores foi tão grande que causou uma queda significativa nas ações de várias empresas, levando ao movimento de quase 1 trilhão de dólares.
Diante desse cenário, grandes empresas de tecnologia do ocidente, como Microsoft e Amazon, começaram a desenvolver suas próprias versões do modelo R1. A ideia é permitir que usuários utilizem essa tecnologia sem ter que depender de servidores localizados na China, mantendo seus dados em território ocidental. Isso é importante para garantir a segurança e a privacidade das informações dos usuários.
Além disso, há um esforço significativo para replicar o R1 desde o início, e assim investigar se as alegações de desempenho da DeepSeek são válidas. Esta iniciativa está sendo liderada pela Hugging Face, uma plataforma que reúne pesquisadores de inteligência artificial. Segundo Leandro von Werra, um dos responsáveis pela pesquisa na Hugging Face, a expectativa é que esse processo de reprodução do R1 seja finalizado em poucas semanas, e a equipe está bastante motivada com o projeto.
O modelo R1 foi obtido pela DeepSeek através de uma licença de código aberto do MIT, o que facilita o acesso a muitos dos componentes e interações necessárias para replicar o modelo. No entanto, alguns detalhes cruciais sobre a construção do R1 ainda não estão claros, como o custo total de desenvolvimento. Em um estudo anterior, DeepSeek estimou que o custo para treinar um modelo anterior, chamado V3, foi de aproximadamente 5,6 milhões de dólares. Agora, o verdadeiro custo para desenvolver o R1 continua um mistério.
Enquanto isso, a DeepSeek tem se mostrado transparente ao compartilhar informações sobre suas técnicas. Uma das abordagens principais do R1 é chamada de “aprendizado por reforço puro”, que ensina o modelo a raciocinar sem supervisão humana. Essa técnica, combinada com várias inovações técnicas, permite que o modelo seja mais eficiente.
Após o lançamento do R1, as plataformas de tecnologia, como a da Fireworks AI e a Azure AI Foundry da Microsoft, começaram a disponibilizar o modelo para seus usuários. A Fireworks AI expressou seu apoio à DeepSeek, destacando que essas inovações devem ser acessíveis para desenvolvedores de IA.
Por outro lado, a DeepSeek também gerou preocupações sobre a segurança dos dados, já que o modelo armazena informações em servidores chineses, o que levou as empresas ocidentais a acelerarem suas próprias implementações do R1. A integridade e a privacidade dos dados são prioridades para esses desenvolvedores, que buscam evitar que informações sensíveis sejam enviadas para fora do país.
Adicionalmente, relatos sugerem que a versão do R1 pode censurar informações sobre eventos delicados relacionados à China, como as manifestações na Praça da Paz Celestial em 1989. Por outro lado, uma nova versão do R1, disponibilizada pela Perplexity, não apresenta essa censura e fornece acesso a informações completas sobre o evento.
Essa troca de inovações e informações entre empresas americanas e a DeepSeek representa um momento crucial na competividade entre os modelos de inteligência artificial desenvolvidos no oriente e no ocidente, assim como na busca pela open-source, que é um modelo colaborativo de pesquisa em tecnologia.