Sou usuário do ChatGPT há bastante tempo e não consigo imaginar usar a internet sem alguma forma de inteligência artificial para me ajudar. O que mais quero do ChatGPT e de outros programas é que atuem como assistentes. Estou ansioso para que os agentes de IA fiquem melhores e mais fáceis de usar.
Estou também pensando no futuro, onde vou precisar de um robô humanoide para me dar uma força em casa. Conforme vou envelhecendo, vou querer um robô para ajudar com tarefas que podem ser complicadas. Além disso, quero um robô que possa liberar meu tempo, cuidando de alguns afazeres domésticos.
Isso não é só um sonho, várias empresas já estão estudando esse tipo de tecnologia. A Figure é uma delas e recentemente apresentou um novo modelo de IA para robôs humanoides que promete fazer exatamente o que eu desejo. O nome desse modelo é Helix, e ele já é considerado uma grande inovação na robótica doméstica.
O Helix combina dois modelos de IA, rodando em uma GPU dentro do robô, para entender comandos e executar ações. Um desses modelos (S2) é responsável por lidar com a linguagem natural e entradas visuais, entendendo comandos, como pegar um objeto em cima da mesa. O outro modelo (S1) pega a informação do S2 e controla em tempo real o corpo e os membros do robô para executar a tarefa.
O mais incrível é que o Helix passou por cerca de 500 horas de treinamento. Esse modelo permite que robôs lidem com objetos novos e ainda determine se eles precisam de cuidado ao serem manuseados. Criar robôs para ambientes domésticos é muito mais desafiador do que fazer robôs para locais controlados, como linhas de produção em fábricas.
Os robôs domésticos precisam lidar com a bagunça que encontramos em casa. Cada lugar tem seus móveis e um jeito de se organizar. Isso significa que esses robôs não podem ser treinados com uma ideia geral de uma casa. Eles devem se adaptar ao que veem no ambiente que estão.
Além disso, esses robôs precisam entender a linguagem natural e executar tarefas conforme os comandos falados. Esses são os problemas que a equipe da Figure se propôs a resolver, e foi assim que o modelo Helix foi desenvolvido.
Diferente dos sistemas anteriores, os engenheiros da Figure optaram por criar um modelo único. Ele possui uma rede neural que lida com a interpretação de entradas visuais e de linguagem, além de realizar os movimentos robóticos baseados nos comandos recebidos. Essa IA permite que o robô se adapte a várias situações e interaja com outros robôs próximos.
O modelo Helix combina as duas AIs. O S2 é o sistema que faz o pensamento mais avançado, operando em uma frequência mais baixa. Esse modelo entende os comandos e também obtém entradas visuais do ambiente. Tentar pedir para o robô pegar um copo já é suficiente para o AI perceber que está lidando com um objeto frágil, mesmo que nunca tenha lidado com um copo durante o treinamento.
O S1 é a IA que controla os movimentos do robô, como dedos, braços e torso, executando as ordens que o S2 analisou. O S1 funciona em uma frequência muito maior que o S2, permitindo que o robô se adapte em tempo real a diferentes situações. Por exemplo, se o robô precisa se inclinar enquanto, ao mesmo tempo, move um braço para pegar o copo, isso é feito em coordenação.
Para chegar a essa inovação, os engenheiros da Figure treinaram o Helix com 500 horas de dados supervisionados de alta qualidade. Isso é apenas uma fração dos conjuntos de dados anteriores, menor que 5%. O treinamento envolve a IA analisando vídeos de ações do robô e tentando entender os comandos que precisam ser dados para realizar essas ações.
Esse método permite que a IA Helix aprenda a reconhecer e lidar com vários objetos que podem ser encontrados em casa, sem precisar ser treinada especificamente para cada um deles. Os vídeos mostrados pela Figure mostram o robô pegando um objeto específico de uma mesa cheia de coisas, simplesmente entendendo a fala e analisando o que o rodeia.
Isso envolve adaptar os movimentos necessários para realizar a tarefa. Por exemplo, pegar um brinquedo é diferente de pegar um copo. Embora o robô não consiga sentir os objetos como os humanos fazem, seu treinamento ensina a como pegar coisas conforme o nível de fragilidade. Os robôs também podem pegar objetos menores em meio a outros, adaptando-se ao tamanho.
Além disso, a IA Helix também pode fazer robôs humanoides trabalharem juntos em casa. Existem situações em que você pode querer que dois robôs ajudem simultaneamente. Nos exemplos apresentados, vemos um robô se adaptando aos movimentos de outro, além de executar um comando para pegar um objeto que veio de outro robô. Eles se coordenam sem precisar serem programados para isso.
Embora os robôs da Figure e a IA Helix sejam promissores, ainda não se sabe quando esses robôs estarão disponíveis para venda e qual será o preço de cada um. A própria Figure admite que a tecnologia desenvolvida é apenas uma amostra do que é possível. O próximo passo é escalar a Helix, aumentando sua capacidade em mil vezes ou mais.
Para mais detalhes sobre a IA Helix, é possível procurar informações adicionais, incluindo vídeos que mostram os robôs da Figure em ação.