O Google revelou nesta quinta-feira (15), o Gemini 1.5 Pro, a próxima geração de seu modelo de IA com "melhorias drásticas de desempenho".
De acordo com a empresa, a nova versão do modelo multimodal de tamanho médio conta com um recurso experimental de compreensão de contextos longos.
Nos testes de benchmark (desempenho), o Pro 1.5 superou o 1.0 em 87% em avaliações de texto, código, imagem e vídeo. Além disso, o Google explica o modelo teve um desempenho semelhante ao 1.0 Ultra, o modelo de IA mais potente da empresa lançado na semana passada.
As melhorias do Gemini 1.5 Pro acontecem devido ao uso da arquitetura chamada de Mixture of Experts (MoE), que permite executar apenas áreas mais relevantes do modelo, ao invés de toda a rede neural do Gemini.
A versão 1.5 Pro conta com 1 milhão de tokens (parâmetros utilizados por IAs) — sendo muito maior que o GPT-4 Turbo do ChatGPT, que possui 128 mil.
Isso significa que o novo modelo de IA pode processar um alto volume de informações de uma vez só, incluindo 1 hora de vídeo, 11 horas de áudio, códigos com mais de 30.000 linhas e 70.000 palavras.
Porém, os pesquisadores do Google conseguiram utilizar até 10 milhões de tokens.
No vídeo abaixo, a equipe do Google pede que o modelo interprete um documento de 402 páginas sobre a missão Apollo 11. Sob o comando "traga três momentos cômicos [sobre a missão]. Liste citações da transcrição com emojis", a IA analisa todo o texto e, rapidamente, traz resultados precisos sobre as informações solicitadas.
Inicialmente, o Gemini 1.5 Pro foi disponibilizado para um grupo limitado de desenvolvedores em suas plataformas AI Studio e Vertex AI com uma capacidade padrão de modelos de IA (128.000 tokens). Mas, no futuro, a empresa planeja lançar mais opções pagas com até um milhão de tokens.
Ao The Verge, Sundar Pichai, CEO do Google, disse que, eventualmente, a ideia é que o Gemini 1.5 Pro substitua o 1.0 Pro, atualmente disponível para todos os usuários do chatbot de IA.
SAIBA MAIS!
- Vai rivalizar com o Google? OpenAI trabalha em buscador com IA
- Google prepara IA para funcionar em fones de ouvido
- Microsoft Copilot Pro: Conheça os novos recursos de IA Generativa