Google onthult geavanceerde Gemini 1.5-seriemodellen en verlaagt API-prijzen met 50%

2024/09/24

Vandaag heeft Google twee verbeterde, productieklare Gemini 1.5-modellen onthuld : Gemini-1.5-Pro-002 en Gemini-1.5-Flash-002. Deze nieuwste modellen bieden incrementele verbeteringen ten opzichte van de originele Gemini 1.5-modellen die in mei werden uitgebracht.

De herziene Gemini 1.5-seriemodellen behalen een toename van ongeveer 7% in MMLU-Pro, een verbetering van ongeveer 20% in MATH- en HiddenMath-benchmarks en verbeteringen variërend van 2% tot 7% in visie- en coderingsscenario’s. Bovendien heeft Google de algehele behulpzaamheid van de modelreacties verfijnd. Deze modellen genereren nu reacties in een beknopter formaat, met de standaarduitvoerlengte ongeveer 5% tot 20% korter dan hun voorgangers.

Naast de verbeteringen in de functionaliteit van het model, voert Google ook een opvallende prijswijziging door: ze verlagen de kosten voor API’s voor de Gemini 1.5-serie.

Een reductie van 64% op inputtokens.
Een reductie van 52% op outputtokens.
Een afname van 64% op incrementele gecachete tokens voor Gemini 1.5 Pro, met ingang van 1 oktober 2024, voor prompts onder de 128K tokens.

Google verhoogt ook de snelheidslimieten, waardoor ontwikkelaars geavanceerde AI-applicaties kunnen maken. De betaalde snelheidslimieten voor het Gemini 1.5 Flash-model zijn nu 2.000 RPM, terwijl deze voor het Pro-model zijn verhoogd naar 1.000 RPM, van respectievelijk 1.000 en 360. Bovendien is er een vermindering van de latentie met deze nieuwe modellen, waardoor ontwikkelaars de verwachte output krijgen die twee keer zo snel is en drie keer minder latentie.

Met de lancering van de bijgewerkte Gemini 1.5 (-002 modellen) heeft Google de mogelijkheid van het model verbeterd om gebruikersinstructies te volgen en tegelijkertijd veiligheidsprotocollen te handhaven. Standaard zal Google geen AI-inhoudsveiligheidsfilters op deze nieuwste modellen afdwingen; in plaats daarvan kunnen ontwikkelaars de filters toepassen op basis van hun specifieke behoeften.

Ten slotte heeft Google een verbeterde versie van het Gemini 1.5-model uitgerold, bekend als “Gemini-1.5-Flash-8B-Exp-0924.” Deze experimentele versie toont aanzienlijke verbeteringen in prestaties in zowel tekstuele als multimodale applicaties. Al deze bijgewerkte Gemini 1.5-modellen zijn nu toegankelijk voor ontwikkelaars via Google AI Studio en de Gemini API. Voor grotere ondernemingen en Google Cloud-klanten zijn deze onlangs bijgewerkte Gemini 1.5-modellen beschikbaar op Vertex AI.

Bron

Geef een reactie Reactie annuleren