Nvidia hæver barren for AI-baseret tekst-til-video
Kunstig intelligens i dag er nærmest blevet meget mainstream takket være AI-assistenter som ChatGPT og værktøjer som Midjourney.
Nu er Nvidia også i gang med noget, som kan ende med at tage vores GIF-oplevelse til et helt nyt niveau.
Se også: Spot AI-snyd med nyt værktøj
Genererer videoer ved lav kraft
Virksomhedens Toronto AI Lab har udviklet det, de kalder “Latent Diffusion Models”. De er i stand til at generere videoer uden behov for store mængder computerkraft. Disse modeller kan betragtes som en type AI, der er bygget oven på tekst-til-billedgeneratorer.
Teknologien er i stand til at frembringe brugbare resultater ud fra simple opfordringer som “en stormtrooper, der støvsuger på stranden” eller “en bamse, der spiller elektrisk guitar, high definition, 4K”.
Se også: Hvad kan kunstig intelligens?
Viser fremtiden for tekst-til-video
Mens tekst-til-video teknologi som Nvidias demoer er mest velegnet til at skabe miniaturebilleder og GIF’er, tyder de hurtige fremskridt, der er set i Nvidias AI-generation til længere scener, på, at vi ikke behøver at vente længe på længere tekst-til-video-klip.
Nvidia er heller ikke det eneste firma, der fremviser tekst-til-video generatorer. Google Phenaki har allerede haft sin debut og afsløret potentialet for 20-sekunders klip baseret på længere tekstinput samt et to-minutters klip.
Mens fuld tekst-til-video generering stadig har lidt vej til at være helt vellykket, tyder de seneste fremskridt på, at forbedringer, der gør teknologien egnet til længere videoer, er lige rundt om hjørnet.