O Google DeepMind está lançando Gemini 2.5 Deep Think, que, diz a empresa, é seu modelo de raciocínio de IA mais avançado, capaz de responder a perguntas explorando e considerando várias idéias simultaneamente e usando esses resultados para escolher a melhor resposta.

Os assinantes da assinatura Ultra de US $ 250 por mês do Google terão acesso ao Gemini 2.5 Deep Think no aplicativo Gemini a partir de sexta-feira.

Investido pela primeira vez em maio no Google I/O 2025, Gemini 2.5 Deep Think é o primeiro modelo multi-agente disponível ao Google. Esses sistemas geram AI múltiplos agentes para abordar uma pergunta em paralelo, um processo que usa recursos computacionais significativamente mais do que um único agente, mas tende a resultar em melhores respostas.

O Google usou uma variação de Gemini 2.5 Deep Pense para marcar uma medalha de ouro na Olimpíada Internacional de Matemática deste ano (IMO).

Ao lado de Gemini 2.5 Deep Think, a empresa diz que está lançando o modelo usado na IMO para um grupo seleto de matemáticos e acadêmicos. O Google diz que esse modelo de IA “leva horas de raciocina”, em vez de segundos ou minutos, como a maioria dos modelos de IA voltados para o consumidor. A empresa espera que o modelo da IMO melhore os esforços de pesquisa e visa obter feedback sobre como melhorar o sistema multi-agente para casos de uso acadêmico.

O Google observa que o modelo Gemini 2.5 Deep Think é uma melhoria significativa sobre o que anunciou na E/S. A empresa também afirma ter desenvolvido “novas técnicas de aprendizado de reforço” para incentivar a Gemini 2.5 Deep Pense para fazer melhor uso de seus caminhos de raciocínio.

“O Deep Think pode ajudar as pessoas a enfrentar problemas que exigem criatividade, planejamento estratégico e melhorias passo a passo”, disse o Google em uma postagem de blog compartilhada com o TechCrunch.

Evento do TechCrunch

São Francisco
|
27-29 de outubro de 2025

A empresa diz que Gemini 2.5 Deep Think alcança o desempenho de ponta no último exame da humanidade (HLE)-um teste desafiador que mede a capacidade da IA de responder a milhares de perguntas de crowdsourcing em matemática, humanidades e ciências. O Google afirma que seu modelo obteve 34,8%no HLE (sem ferramentas), em comparação com o GROK 4 da Xai, que obteve 25,4%, e o OpenAI da O3, que obteve 20,3%.

O Google também diz que o Gemini 2.5 Deep Think supera os modelos de IA do OpenAI, XAI e Anthrópio no Livecodebench6, um teste desafiador de tarefas de codificação competitiva. O modelo do Google obteve 87,6%, enquanto Grok 4 marcou 79%e o OpenAI da O3 obteve 72%.

Pontuações de referência. Créditos da imagem: Google

O Gemini 2.5 Deep Think funciona automaticamente com ferramentas como execução de código e pesquisa do Google, e a empresa diz que é capaz de produzir “respostas muito mais longas” do que os modelos tradicionais de IA.

Nos testes do Google, o modelo produziu tarefas de desenvolvimento da Web mais detalhadas e esteticamente agradáveis em comparação com outros modelos de IA. A empresa afirma que o modelo pode ajudar os pesquisadores e “potencialmente acelerar o caminho para a descoberta”.

Cenas de arte feitas pela IA do Google (Crédito: Google)

Parece que vários laboratórios de IA líder estão convergindo em torno da abordagem multi-agente.

A Xai, de Elon Musk, lançou recentemente um sistema multi-agente, Grok 4 Heavy, que, segundo ele, foi capaz de alcançar o desempenho líder do setor em vários benchmarks. O pesquisador do Openai Noam Brown disse em um podcast O fato de o modelo de IA não lançado que a empresa usou para obter uma medalha de ouro na Olimpíada Internacional de Matemática (IMO) deste ano também era um sistema multi-agente. Enquanto isso, Agente de pesquisa do Anthropicque gera resumos de pesquisa completos, também é alimentado por um sistema multi-agente.

Apesar do forte desempenho, parece que os sistemas multi-agentes são ainda mais caros de servir do que os modelos tradicionais de IA. Isso significa que as empresas de tecnologia podem manter esses sistemas encantados por trás de seus planos de assinatura mais caros, que Xai e agora o Google optaram por fazer.

Nas próximas semanas, o Google diz que planeja compartilhar Gemini 2.5 Deep Think com um grupo seleto de testadores através da API Gemini. A empresa diz que deseja entender melhor como desenvolvedores e empresas podem usar seu sistema multi-agente.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Políticas de privacidade

Este site usa cookies para que possamos oferecer a melhor experiência de usuário possível. As informações de cookies são armazenadas em seu navegador e executam funções como reconhecê-lo quando você retorna ao nosso site e ajudar nossa equipe a entender quais seções do site você considera mais interessantes e úteis.