Durante a conferência GTC 2024, a Nvidia apresentou o Project GR00T (Generalist Robot 00 Technology) um modelo de inteligência artificial multimodal para comandar robôs humanoides.
Demonstrando a tecnologia no palco do evento, Jensen Huang, CEO da Nvidia, explicou que construir modelos multimodais é um dos “problemas mais interessantes para resolver na IA atualmente”.
“As tecnologias facilitadoras estão se unindo para que os principais roboticistas de todo o mundo dêem saltos gigantescos em direção à robótica geral artificial.”
- Jensen Huang, CEO da Nvidia.
Utilizando o GR00T, os robôs são capazes de compreender a linguagem natural e emular movimentos apenas observando as falas e ações dos humanos. Dessa forma, a Nvidia promete que as máquinas conseguirão aprender rapidamente a ter coordenação, destreza e habilidades para navegar, adaptar-se e interagir com o mundo real.
No vídeo de transmissão da conferência (a partir de 1:55:40) é possível conferir os robôs BDX (equipados com o GR00T) interagindo com Jensen Huang.
Os robôs humanoides também receberão um chip computacional chamado de Jetson Thor, que permitirá realizar tarefas mais complexas e interagir com pessoas e outras máquinas.
Esse chipset conta com uma GPU de próxima geração baseada na arquitetura NVIDIA Blackwell, que oferece 800 teraflops para desempenho em tarefas de IA e permite a execução de modelos de linguagem com trilhões de parâmetros, incluindo o GR00T.
Outra novidade apresentada pela empresa no campo da robótica foram as ferramentas Issac, utilizadas pelo GR00T para que ele compreenda o ambiente onde está.
A empresa destaca as ferramentas Isaac Lab, de “aprendizado por reforço”; Isaac Manipulator, que aumenta a destreza dos braços robóticos; e o Isaac Perceptor, que fornece recursos de visão surround 3D multicamera aos robôs autônomos.
Utilizando a ferramenta Isaac Manipulator, por exemplo, a empresa diz que os robôs ganham uma aceleração de até “80x no planejamento de seu caminho”.
SAIBA MAIS!