Cálculos passaram pelo processo de “ajuste fino supervisionado”, método mais barato de aprendizado por reforço em larga escala
![](https://dmarilia.com.br/wp-content/uploads/2025/02/image-119.png)
Contrariando as expectativas de investimentos milionários, um modelo de inteligência artificial foi treinado por menos de US$ 50 (R$ 288 pela cotação atual) por pesquisadores das Universidades de Stanford e de Washington, nos Estados Unidos.
Conhecido como s1, o modelo é baseado em computação em nuvem e apresentou desempenho semelhante ao o1 da OpenAI e o R1 da DeepSeek nos testes de habilidades matemáticas e de cálculo. As informações são do site Tech Crunch. A nova tecnologia utilizou o mesmo processo adotado no mês passado por pesquisadores da universidade de Berkeley, que criaram o Sky-T1 — um modelo de cálculo de IA — por cerca de US$ 450 (R$ 2,5 mil).
![](https://dmarilia.com.br/wp-content/uploads/2025/02/image-120.png)
Uma IA imitando outra IA?
O protótipo foi feito a partir de um sistema do laboratório chinês de IA Qwen, de propriedade do Alibaba, que pode ser acessado gratuitamente na internet. Foram usados dados de mais de 1.000 perguntas e respostas disponíveis no Gemini 2.0 Flash Thinking, a IA experimental do Google.
A ferramenta da big tech está disponível de forma gratuita, mas a empresa não permite engenharia reversa para criar serviços com a IA. A reportagem do Tech Crunch procurou o Google para comentar o projeto dos pesquisadores, mas ainda não recebeu um retorno.
![](https://dmarilia.com.br/wp-content/uploads/2025/02/image-121.png)
A técnica é conhecida como “destilação”, um processo que extrai as capacidades de “raciocínio” de outro modelo de IA por meio do treinamento em suas respostas. Além disso, os cálculos passaram por um “ajuste fino supervisionado” — ou SFT —, um método mais barato de aprendizado por reforço em larga escala.
Os autores explicam que o modelo ficou pronto em menos de 30 minutos usando 16 GPUs Nvidia H100. O sistema foi ensinado a “esperar” antes de concluir os pensamentos, o que permitiu uma espécie de verificação duplicada e respostas mais precisas, segundo o artigo. Os dados usados estão disponíveis no GitHub.
Fonte Olhar Digital