Google Gemini kan nu se, høre og forstå dine videoklip
Google har opdateret AI-chatbotten Gemini med evnen til at analysere videoer, som man uploader til AI-chatbotten via appen eller browseren på samme måde, som man uploader billeder på.
Gemini kan give overblik over videoens indhold, finde specifikke detaljer og bruge både billede og lyd til at identificere steder og tidspunkter.
Se også: Gemini kommer til Android Auto og biler med Android Automotive
Geminis videoanalyse rammer ikke altid plet
Den nye funktion i Gemini giver Googles AI-chatbot en fordel over ChatGPT, som endnu ikke understøtter upload af videoer.
Muligheden for at få kunstig intelligens til at analysere og forstå videoer har mange anvendelser. For eksempel kan vigtige personer, objekter, handlinger eller begivenheder let identificeres i en video, og jo længere en video man uploader, jo mere tidsbesparende kan funktionen være.
Upload og analyse af videoer er en noget mere datatung proces end analyse af billeder, og det tager derfor dels noget længere tid (op til flere minutter alt efter videoens længde) og har dels også et højt strømforbrug fra de strømslugende datacentre, der kværner de mange data.
Vi forsøgte at uploade et kort videoklip til Gemini. Den beskriver ganske korrekt, hvad der foregår i videoen, men gætter dog forkert på, hvor videoen foregår. Den gætter på Vallby Friluftsmuseum, men videoen foregik dog i Skånes Djurpark.
Det understreger den sædvanlige problematik ved AI-chatbots om, at de ofte tager fejl, og at man bør tage oplysningerne med et gran salt. Faktatjekker man deres indhold og bruger det AI-genererede indhold med varsomhed, kan det dog være et yderst brugbart hjælpeværktøj i dagligdagen.
Se også: Verdens første lov for kunstig intelligens træder i kraft
Perspektivering
Gemini er en af de mest populære AI-chatbots på markedet, men der findes mange andre gode alternativer. Se de bedste AI-chatbots i Danmark.