Gemini 1.5 Pro versus. Gemini 1.0: wat kan Gemini doen na de upgrade?

2024/02/23

Nu Google onlangs zijn AI-model heeft hernoemd van Bard naar Gemini en meerdere modellen heeft aangekondigd, zijn de zaken een beetje verwarrend geworden. En nu is er een nieuw model in de mix. Google heeft een nieuw Gemini 1.5 Pro-model uitgebracht. Een van de grootste mysteries is wat het nieuwere Gemini Pro 1.5-model anders maakt dan het oudere Gemini 1.0-model.

Hier bekijken we de verschillen tussen de twee en de dingen die u kunt doen met het geüpgradede AI-model.

Wat is Gemini 1.5 Pro

Gemini 1.5 is het model van de volgende generatie in de Gemini-familie van groottalige modellen van Google en levert aanzienlijke verbeteringen ten opzichte van het bestaande 1.0-model.

Als je Gemini Basic nog niet hebt gebruikt: het lijkt behoorlijk op andere AI-modellen die er zijn. Het draait op het Gemini 1.0 Pro-model en je kunt aanwijzingen in de zoekbalk invoeren en de AI vragen om informatie op te zoeken, inhoud te genereren of afbeeldingen te maken.

Wie heeft er toegang toe? Hoewel Gemini 1.0 momenteel gratis beschikbaar is in verschillende regio’s en meerdere talen via de webapp, is het nieuwere 1.5 Pro-model momenteel niet beschikbaar voor het grote publiek. Momenteel kunnen alleen zakelijke gebruikers en ontwikkelaars het uitproberen met Vertex AI en AI Studio.

Het model dat nu beschikbaar is om te testen is gratis en heeft een contextvenster van maximaal één miljoen tokens, maar zodra het wordt uitgebracht, zal het niet meer gratis zijn. Hoewel het gratis beschikbaar is in Preview, mag u enige latentie van het model verwachten.

Bovendien is Google in eerste instantie van plan Gemini 1.5 Pro uit te brengen met een contextvenster van 128.000 tokens wanneer het voor iedereen wordt uitgebracht. Het zou verschillende prijsniveaus kunnen lanceren, waarbij het basismodel van 128.000 tokens gratis is en het model met een miljoen tokens beschikbaar tegen een prijs, maar het bedrijf heeft nog geen aankondiging gedaan.

Gemini 1.0 versus. Tweeling 1.5 Pro

Laten we nu eens kijken naar de functies die Gemini 1.5 Pro tot een belangrijke upgrade maken ten opzichte van de vorige versie.

Groter contextvenster

AI-modellen zoals Gemini gebruiken een contextvenster, dat is gemaakt van tokens en delen van tekst, afbeeldingen, video’s, audio, code, enz. bevat. Een groter contextvenster zorgt ervoor dat een AI-model meer informatie kan verzamelen en verwerken.

Terwijl het contextvenster van Gemini 1.0 beperkt is tot 32.000 tokens, heeft het nieuwere 1.5-model een contextvenster van één miljoen tokens. (Google heeft tijdens hun onderzoek zelfs met succes 10 miljoen tokens getest; dat is spannend!)

Dit is echter voor de betaalde versie van het Gemini Pro 1.5-model. Het contextvenster van de gratis versie van het Pro-model is beperkt tot 128.000 tokens, wat nog steeds aanzienlijk meer is dan dat van Gemini 1.0.

Met het grotere contextvenster kan Gemini Pro 1.5 30.000 regels code, 700.000 woorden, 11 uur audio, een video van een uur en lange tekstdocumenten verwerken. Dit maakt dit AI-model krachtiger dan het GPT-4-model van OpenAI dat ChatGPT aandrijft.

Snellere responstijd

Gemini 1.5 Pro is gebaseerd op de nieuwste Transformer en Mixture-of-Experts (MoE)-architectuur, waardoor het veel sneller antwoorden kan bieden. Terwijl een normale Transformer als een enkel neuraal netwerk functioneert, gebruiken MoE-transformatoren groepen van dergelijke netwerken, wat resulteert in een grotere efficiëntie.

Wanneer input wordt geleverd aan AI-modellen die gebruik maken van de MoE-architectuur, activeren ze alleen relevante paden, waardoor verspilling van hulpbronnen wordt voorkomen. De uit te voeren taak wordt ook verdeeld over verschillende neurale modellen, waardoor sneller een betere kwaliteit van de output wordt gegarandeerd.

Met Gemini Pro 1.5 kunt u dus sneller antwoorden vinden of afbeeldingen en op tekst gebaseerde inhoud genereren, wat leidt tot grotere efficiëntie en productiviteit.

Superieure codeermogelijkheden

Als u voor codeerdoeleinden op Gemini vertrouwt, is Gemini Pro 1.5 het ideale AI-model. Het kan u helpen snel betrouwbare code te schrijven, wat vooral mogelijk is vanwege het grotere contextvenster waardoor het model een grotere hoeveelheid gegevens kan verwerken.

Dankzij het verbeterde probleemoplossende vermogen van Gemini 1.5 Pro kan het grotere codeblokken verwerken dan het vorige model. Naast dat het u helpt betere code te schrijven, kan het de werking van verschillende delen van de code uitleggen en nuttige wijzigingen voorstellen. Dit maakt het een uitstekende keuze voor ontwikkelaars.

Verbeterde leer- en redeneermogelijkheden

Gemini 1.5 Pro is veel beter in het vasthouden van informatie en kan zeer effectief redeneren in verschillende multimodale contexten. Het is uiterst bedreven in het interpreteren van grote hoeveelheden informatie. Hierdoor kunt u dit AI-model gebruiken om eenvoudig informatie in video’s, audio en lange tekstdocumenten te identificeren en te lokaliseren.

Het kan ook nieuwe talen leren en kan gemakkelijker met meerdere talen omgaan zonder dat er veel informatie over hoeft te worden verstrekt. Omdat het dergelijke informatie kan vinden en zelfs kan oproepen uit enorme datasets, kan het model bovendien met uitstekende resultaten worden gebruikt bij redeneringstaken.

De verbeterde redeneer- en herinneringsmogelijkheden maken Gemini 1.5 Pro geschikt voor een breed scala aan doeleinden, zoals academisch onderzoek, het maken van inhoud en code-analyse.

Verbeterde afhandeling van audio- en visuele taken

Zoals hierboven uitgelegd kan Gemini 1.5 Pro informatie uit afbeeldingen en video’s beter interpreteren dan het oudere model. Het kan worden gebruikt om afbeeldingen effectief te integreren met tekstgegevens, terwijl de context van verschillende elementen in de afbeeldingen wordt begrepen.

Deze mogelijkheid maakt het een goede keuze voor het met minimale inspanning op tekst gebaseerde informatie uit visuele gegevens genereren. Met de nieuwste mogelijkheden voor beeldanalyse en interpretatie kan dit AI-model objecten herkennen en categoriseren, hun relaties begrijpen en informatie uit stilstaande beelden halen.

Op dezelfde manier is het videoanalysevermogen van het nieuwere AI-model veel geavanceerder en kan het patronen in een video herkennen, resultaten voorspellen en veranderingen volgen. Gemini 1.5 Pro kan tot op zekere hoogte gebeurtenissen, acties en zelfs emoties begrijpen. Het kan dus worden gebruikt om videoanalyses met grotere nauwkeurigheid te verkrijgen dan mogelijk was met Gemini 1.0.

Wat de audioverbeteringen betreft, kan de 1.5 Pro-versie van Gemini spraak begrijpen en transcriberen met veel minder fouten dan andere modellen. Hierdoor blijft de nauwkeurigheid hoog, zelfs bij lange audiostukken, en is het gemakkelijker om de ene taal uit de andere te vertalen met behoud van de context en betekenis.

Wat kunt u doen met Gemini 1.5 Pro?

Met Gemini 1.5 Pro kun je veel dingen bereiken die niet mogelijk zijn met het oudere AI-model. Hier zijn een paar voorbeelden van de dingen die u kunt doen met Gemini 1.5 Pro; ontwikkelaars en bedrijven kunnen hier meteen mee experimenteren:

In plaats van alleen korte artikelen te lezen en te begrijpen, kunt u met Gemini 1.5 Pro hele boeken en lange, op tekst gebaseerde inhoud lezen. Omdat het grote hoeveelheden op tekst gebaseerde inhoud en complexe documenten gemakkelijk kan verwerken, kunt u het zelfs vragen om verschillende secties te analyseren en gerelateerde vragen te beantwoorden.
Bekijk complete films en krijg een gedetailleerde analyse van elke scène. Voorheen was dit alleen mogelijk voor korte clips met Gemini 1.0. U kunt het AI-model bijvoorbeeld vragen om u informatie te geven, zoals de motivaties, symboliek en meer van een personage.
Luister naar lange stukken audio en verzamel er informatie uit. Met Gemini 1.0 kon je alleen beknopte aantekeningen maken van korte audiostukjes. U kunt het bijgewerkte AI-model daarentegen gebruiken om naar lange lezingen te luisteren, ingewikkelde ideeën samen te vatten en zelfs gedetailleerde transcripties te maken.
Met een beter herinneringsvermogen kunt u Gemini vragen om vragen te beantwoorden over onderwerpen die eerder in het gesprek zijn besproken. Deze mogelijkheid kan van pas komen bij het opzoeken van informatie over meerdere onderwerpen.
Door de informatie uit verschillende bronnen te gebruiken, kan het AI-model zelfs worden gebruikt om creatieve inhoud zoals scripts of gedichten te genereren. Creatieve velden kunnen veel profiteren van de verbeterde mogelijkheden van Gemini 1.5 Pro.
Het nieuwe Pro AI-model kan u helpen de juiste code te schrijven door het hele programma te begrijpen, in plaats van slechts een paar regels. Je kunt het ook om suggesties vragen, het gebruiken om bugs te identificeren en codefragmenten te genereren.

Gemini 1.5 Pro wordt geleverd met verschillende verbeteringen ten opzichte van de vorige versie, waardoor het voor bijna iedereen een fantastisch hulpmiddel is. Nu de AI van Google rechtstreeks kan concurreren met de GPT-4-aangedreven ChatGPT, zal het ongetwijfeld populairder worden in het dagelijks gebruik zodra Google het op grotere schaal uitbrengt.