O modelo Gemini 1.5 Flash-8B AI do Google agora está pronto para produção. A empresa disse que a versão estável do Gemini 1.5 Flash-8B tem o menor custo por inteligência de qualquer modelo Gemini.

A disponibilidade foi anunciada em 3 de outubro. Os desenvolvedores podem acessar gemini-1.5-flash-8B gratuitamente por meio do Google AI Studio e da API Gemini. Gemini 1.5 Flash-8B oferece um preço 50% menor em comparação com 1.5 Flash e o dobro dos limites de taxa. A menor latência em pequenos prompts também é apresentada.

Uma versão experimental do Gemini 1.5 Flash-8B foi lançada em setembro como uma variante menor e mais rápida do 1.5 Flash. O Flash-8B quase corresponde ao desempenho do modelo Flash 1.5 lançado em maio em vários benchmarks e tem um bom desempenho em tarefas como bate-papo, transcrição e tradução de idiomas de contexto longo, disse o Google.