Google introduceert betaalbare AI met Gemini 1.5 Flash-8B, het meest economische model tot nu toe

Google introduceert betaalbare AI met Gemini 1.5 Flash-8B, het meest economische model tot nu toe

Het Gemini 1.5 Flash-model heeft sinds de lancering snel aan populariteit gewonnen onder ontwikkelaars, voornamelijk vanwege de indrukwekkende snelheid en kostenefficiëntie. In augustus introduceerde Google de Gemini 1.5 Flash 8B, een experimenteel AI-model dat is ontworpen om de kosten verder te verlagen door slechts 8 miljard parameters te gebruiken.

Na wekenlang testen met ontwikkelaars, heeft Google vandaag aangekondigd dat de Gemini 1.5 Flash 8B nu productieklaar is. Dit model blinkt uit in multimodale toepassingen met een hoog volume, samenvattingstaken met lange contexten en nog veel meer. Vergeleken met de originele 1.5 Flash is het nieuwe 1.5 Flash 8B-model 50% betaalbaarder, ondersteunt het 2x hogere snelheidslimieten en biedt het een lagere latentie voor kleinere prompts.

Wat betreft prestaties, lijkt de 1.5 Flash 8B sterk op het 1.5 Flash-model dat in mei werd gelanceerd. Het is met name geschikt voor taken als chatinterfaces, transcriptie en vertaling van lange-contexttaal. Een vergelijking van benchmarkresultaten voor dit nieuwe model vindt u hieronder.

Tweelingen 1.5 Flash 8B

De opvallende eigenschap van het 8B-model is de betaalbaarheid, waardoor Gemini 1.5 Flash 8B het meest budgetvriendelijke AI-model van Google tot nu toe is. Hier is een gedetailleerde uitsplitsing van de prijzen:

  • $0,0375 per 1 miljoen tokens op prompts
  • $0,15 per 1 miljoen tokens op prompts
  • $0,01 per 1 miljoen tokens op gecachte prompts

Om te voldoen aan AI-toepassingen met een hoog volume, verhoogt Google ook de snelheidslimiet voor dit model. De Gemini 1.5 Flash 8B kan nu 4.000 verzoeken per minuut (RPM) verwerken, het dubbele van de vorige limiet.

Ontwikkelaars die geïnteresseerd zijn in het verkennen van het nieuwe gemini-1.5-flash-8b model kunnen zich aanmelden voor gratis toegang via Google AI Studio en de Gemini API. Voor betaalde ontwikkelaars start de facturering voor dit innovatieve model op maandag 14 oktober.

Dankzij de uitzonderlijke combinatie van prestaties, betaalbaarheid en toegankelijkheid zal het Gemini 1.5 Flash 8B-model van Google naar verwachting een favoriete AI-oplossing worden voor ontwikkelaars in uiteenlopende vakgebieden.

Bron: Google

Bron

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *