O Google introduziu uma prévia antecipada do modelo de raciocínio híbrido flash Gemini 2.5. Uma versão inicial do modelo está disponível através da API Gemini via Google AI Studio e Vertex AI, de acordo com uma postagem do blog do Google em 17 de abril.

O Gemini 2.5 Flash se baseia na base do Gemini 2.0 Flash e oferece uma “grande atualização” nos recursos de raciocínio, priorizando a velocidade e o custo, disse o Google. O Gemini 2.5 Flash é o primeiro modelo de raciocínio totalmente híbrido do Google, oferecendo aos desenvolvedores a capacidade de ativar ou desativar o pensamento. O modelo permite que os desenvolvedores defina orçamentos de pensamento para encontrar a troca certa entre qualidade, custo e latência, informou a empresa.

O Google disse que seus modelos Gemini 2.5 são modelos de pensamento, que podem raciocinar através de pensamentos antes de responder. Em vez de gerar imediatamente uma saída, o modelo pode executar um processo de “pensamento” para entender melhor o prompt, dividir tarefas complexas e planejar uma resposta. Para tarefas complexas que exigem vários conjuntos de raciocínio, como resolver problemas de matemática, o processo de pensamento permite que o modelo chegue a respostas mais precisas e abrangentes.