Google släpper Gemini Omni Flash API för företagsvideoproduktion

Google har lanserat sin Gemini Omni Flash-modell via ett API för företagskunder, vilket möjliggör skapande och redigering av video genom konversation. Teknologin syftar till att snabba upp och billigare göra intern videoproduktion för företag.

30 juni 2026

Google släpper Gemini Omni Flash API för företagsvideoproduktion

Google har gjort sin AI-modell Gemini Omni Flash tillgänglig för företagskunder via ett API. Denna lansering gör det möjligt att skapa och redigera videoinnehåll helt genom konversation, en funktion som tidigare presenterats för konsumenter men nu riktar sig till att effektivisera företagens interna videoproduktion.

Traditionellt sett har skapandet av företagsvideor, som handledningsfilmer eller produktintroduktioner på 90 sekunder, varit en komplicerad process som krävt noggrann planering, inspelning, redigering och revisioner. Även små ändringar kunde leda till att hela processen behövde startas om, vilket gjorde videoproduktion både tidskrävande och kostsam. Gemini Omni Flash syftar till att omforma denna modell genom att erbjuda en snabbare och mer kostnadseffektiv lösning.

Det nya API:et möjliggör produktion av komplexa videor genom att integrera tidigare separata verktyg. Modellen kan generera video från text, bilder och befintliga videoklipp, och levererar en färdig klipp med synkroniserat ljud. Användare kan också redigera befintliga videor genom att ge muntliga eller skriftliga instruktioner, vilket gör redigeringsprocessen smidig.

Teknologin stödjer också multimodala ingångar, såsom referensbilder och befintliga videoklipp, som modellen tar hänsyn till i slutresultatet. Den kan förstå hur fysikaliska scener beter sig, inklusive effekterna av ljus och regn, samt hantera införande eller ändring av text och logotyper i videor. Användare förväntas dock fortfarande granska det genererade materialet manuellt innan publicering.

Googles egna uppgifter anger att modellens nuvarande begränsningar inkluderar en maximal klipplängd på 10 sekunder och en upplösning på 720p. Viktiga funktioner för företag inkluderar även en inbyggd vattenstämpel (SynthID), verktyg för autentisering av innehåll (C2PA) och ett API för detektering av AI-genererat innehåll. Google har också infört begränsningar, såsom att förhindra användningen av foton och ljudinspelningar för att skapa deepfakes.

Ursprunglig källa: venturebeat.com