Gemini 2.5 Flash: novo modelo de IA do Google tem foco em eficiência e baixa latência

Durante seu evento Google Cloud Next 2025, o Google anunciou o lançamento do Gemini 2.5 Flash, seu novo modelo de IA mais enxuto, focado em baixa latência e redução de custos. Apesar de ser mais leve do que o poderoso Gemini 2.5 Pro, ele conta com a capacidade de raciocínio, e assim, demora um pouco mais para dar as respostas.

Um dos destaques do Gemini 2.5 Flash é que ele é flexível e pode ser personalizado. A empresa conta que o modelo ajusta o tempo de processamento baseado na complexidade da pergunta. Isso permite ter respostas mais rápidas para pedidos mais simples.

Segundo o Google, o novo modelo oferece uma computação “dinâmica e controlável”, já que o tempo de processamento pode ser ajustado pelos desenvolvedores.

O Gemini 2.5 Flash estará disponível em breve no Vertex AI, plataforma do Google para criar e gerenciar aplicações e agentes de IA. O Google também anunciou que os modelos Gemini poderão ser usados localmente pelas empresas. Além disso, eles estarão disponíveis no Google Distributed Cloud (GDC). Assim, poderão ser implementados pelas empresas que usam o serviço para otimizarem os seus negócios.

Saiba mais sobre os novos modelos 2.5 Pro e 2.5 Flash no blog do Google Cloud.

Via Tech Crunch