A OpenAI está cheia de novidades e, para finalizar o evento “12 Dias de OpenAI”, a empresa anunciou o lançamento de dois novos modelos, o o3 e o o3-mini, projetados para tarefas de raciocínio avançado. Os modelos, sucessores da série o1, já estão sendo disponibilizados para pesquisadores selecionados em fase de testes.
De acordo com Sam Altman, CEO da OpenAI, os modelos representam uma evolução significativa, permitindo lidar com tarefas ainda mais complexas. Altman destacou o desempenho excepcional do o3, especialmente em programação e raciocínio matemático, superando largamente benchmarks anteriores.
A empresa divulgou alguns dados interessantes sobre os novos modelos de IA em tarefas de raciocínio avançado, incluindo:
-
Codificação: o o3 alcançou uma pontuação de 2727 no Codeforces, superando o recorde interno da OpenAI.
-
Matemática e ciências: o modelo obteve 96,7% no exame AIME 2024, errando apenas uma questão, e alcançou 87,7% no GPQA Diamond.
-
Desafios avançados: em testes como o Frontier Math da EpochAI, o o3 solucionou 25,2% dos problemas, um recorde inédito, além de triplicar a pontuação do o1 no ARC-AGI.
Um dos destaques do desenvolvimento dos novos modelos é o alinhamento deliberativo, uma técnica de segurança que integra políticas explícitas no raciocínio dos modelos. Essa abordagem permite que eles analisem e apliquem diretrizes de forma dinâmica durante as respostas, minimizando erros comuns, como vulnerabilidade a ataques de jailbreak e recusas a comandos benignos.
Pesquisadores da OpenAI afirmam que o alinhamento deliberativo utilizado no treinamento dos modelos supera métodos tradicionais, como o aprendizado por reforço com feedback humano (RLHF), permitindo mais desempenho em cenários complexos e multilíngues.
As inscrições para o acesso antecipado aos modelos estão abertas até 10 de janeiro de 2025 no site da OpenAI. Pesquisadores interessados devem preencher um formulário detalhando suas intenções de uso e qualificações, além de indicar qual modelo pretendem testar.
Para ficar por dentro das principais notícias de tecnologia, siga o TechShake no Instagram.
Com informações de Venture Beat.
VEJA TAMBÉM!