A OpenAI lançou o modelo o1, focado em raciocínio avançado e auto-verificação, com versões para usuários do ChatGPT e API
A OpenAI anunciou o lançamento do modelo o1, que representa um marco em sua busca por inteligência artificial (IA) mais avançada. O o1 — conhecido internamente como Strawberry — é descrito como um modelo de raciocínio que se destaca por sua capacidade de resolver questões complexas, oferecendo duas versões: o1-preview e o1-mini.
Ambas estarão disponíveis para assinantes do ChatGPT Plus e Team a partir desta quinta-feira (12), com usuários das versões Enterprise e Edu recebendo acesso na próxima semana.
Novas funcionalidades do o1 da OpenAI
Uma das inovações do o1 é sua habilidade de “pensar” antes de fornecer respostas, o que, segundo a OpenAI, ajuda o modelo a reduzir erros de raciocínio comuns em inteligências artificiais. Ele utiliza um processo de raciocínio chamado “cadeia de pensamento”, que simula a análise humana passo a passo para resolver problemas. Essa funcionalidade o torna particularmente eficaz em tarefas complexas, como programação e matemática.
O modelo foi desenvolvido como parte de um projeto interno da OpenAI chamado Q*, que foca em raciocínio avançado. Além de fornecer respostas, o o1 consegue se auto-verificar, revisando suas próprias soluções para minimizar erros.
Limitações do o1 da OpenAI
- O modelo o1 traz novidades, mas também algumas limitações.
- Apesar de suas capacidades avançadas, o o1 pode ser mais lento que seus antecessores em alguns casos, levando até 10 segundos para responder a perguntas mais complexas.
- Além disso, ainda existe o risco de o modelo gerar “alucinações” — respostas incorretas, mas apresentadas com confiança —, um problema que a OpenAI admite não ter completamente resolvido.
- Ele não possui funções como navegação na web ou processamento de arquivos e imagens.
- Além disso, os usuários têm um limite semanal de mensagens: 30 para o o1-preview e 50 para o o1-mini.
- O custo elevado também é um fator, com o o1-preview custando US$ 15 por milhão de tokens de entrada e US$ 60 por milhão de tokens de saída — valores três e quatro vezes maiores, respectivamente, comparados ao GPT-4o.
Treinamento com reforço e aplicações práticas
O treinamento do o1 utiliza um novo algoritmo de otimização e aprendizado por reforço, uma técnica que ensina o sistema por meio de recompensas e punições. Isso permite ao o1 resolver problemas por conta própria.
Esse método inclui o uso de dados voltados ao raciocínio, como literatura científica, tornando o modelo ideal para tarefas que envolvem várias etapas, como a análise de e-mails confidenciais ou a formulação de estratégias de marketing.
Testes indicam que o o1 supera o GPT-4o em tarefas como análise de petições jurídicas e jogos de lógica, além de ter um desempenho excepcional em exames de matemática. Em uma prova da Olimpíada Internacional de Matemática, o o1 obteve 83% de acertos, enquanto o GPT-4o ficou em 13%, segundo a empresa.
Futuro dos modelos de IA
A OpenAI está focada em expandir as habilidades de raciocínio do o1 para além de suas capacidades atuais. A empresa planeja desenvolver futuras versões capazes de raciocinar por períodos mais longos — horas, dias ou até semanas —, visando criar sistemas autônomos ainda mais eficientes em tarefas complexas e em áreas como medicina e engenharia.
Por Ana Luiza Figueiredo
Fonte: Olhar Digital