Nvidia hæver barren for AI-baseret tekst-til-video

Nvidias nye tekst-til-video teknologi vil blæse dig omkuld, hvis du er storbruger af GIF'er - den viser også fremtiden for video baseret på tekstbidder.

Kunstig intelligens i dag er nærmest blevet meget mainstream takket være AI-assistenter som ChatGPT og værktøjer som Midjourney.

Nu er Nvidia også i gang med noget, som kan ende med at tage vores GIF-oplevelse til et helt nyt niveau.

Se også: Spot AI-snyd med nyt værktøj

Genererer videoer ved lav kraft

Virksomhedens Toronto AI Lab har udviklet det, de kalder “Latent Diffusion Models”. De er i stand til at generere videoer uden behov for store mængder computerkraft. Disse modeller kan betragtes som en type AI, der er bygget oven på tekst-til-billedgeneratorer.

Teknologien er i stand til at frembringe brugbare resultater ud fra simple opfordringer som “en stormtrooper, der støvsuger på stranden” eller “en bamse, der spiller elektrisk guitar, high definition, 4K”.

Se også: Hvad kan kunstig intelligens?

Viser fremtiden for tekst-til-video

Mens tekst-til-video teknologi som Nvidias demoer er mest velegnet til at skabe miniaturebilleder og GIF’er, tyder de hurtige fremskridt, der er set i Nvidias AI-generation til længere scener, på, at vi ikke behøver at vente længe på længere tekst-til-video-klip.

Nvidia er heller ikke det eneste firma, der fremviser tekst-til-video generatorer. Google Phenaki har allerede haft sin debut og afsløret potentialet for 20-sekunders klip baseret på længere tekstinput samt et to-minutters klip.

Mens fuld tekst-til-video generering stadig har lidt vej til at være helt vellykket, tyder de seneste fremskridt på, at forbedringer, der gør teknologien egnet til længere videoer, er lige rundt om hjørnet.