[ad_1]
Snapchat vill påskynda svarstiden för generativ AI-bildskapande, med en nytt tillvägagångssätt som presenterar en snabbare modell för att bygga bilder baserat på textfrågor.
Vilket jag inte skulle ha trott är ett stort hinder för användning. De flesta generativa AI-verktyg tar för närvarande, kanske, 30 sekunder eller så att generera sådana bilder, även på mobila enheter. Men Snap säger att dess nya system kan producera liknande bilder inom mindre än två sekunder – vilket, även om det kanske inte är en stor spelförändring, är en intressant utveckling i det bredare sammanhanget av generativ AI-process.
Som förklarat av Knäppa:
”SnapFusion förkortar modellens körtid från textinmatning till bildgenerering på mobilen till under två sekunder – den snabbaste tiden som hittills publicerats av den akademiska världen. Snap Research uppnådde detta genombrott genom att optimera nätverksarkitekturen och denoiseringsprocessen, vilket gjorde den otroligt effektiv, samtidigt som bildkvaliteten bibehölls. Så nu är det möjligt att köra modellen för att generera bilder baserade på textmeddelanden och få tillbaka skarpa och tydliga bilder på bara några sekunder på mobilen snarare än minuter eller timmar, som annan forskning visar.”
Det här är några exempel på de bilder som produceras av SnapFusion-processen, som fortfarande ser ut ungefär som samma typ av generativa AI-bilder som du får från vilken annan app som helst (dvs ganska nära men ganska konstigt). Men de returnerades till användaren mycket snabbare, vilket Snap säger kan ha en rad fördelar.
En förbättrad användarupplevelse är en faktor, men Snap noterar också att den nya processen skulle kunna underlätta förbättrad integritet, genom att begränsa datadelning till tredje part, samtidigt som bearbetningskostnaderna för utvecklare minskar.
Även om Snaps forskning inkluderar några asterisker, inklusive, framför allt, att majoriteten av dess experiment utfördes på en iPhone Pro 14, som med Snaps egna ord ”har mer beräkningskraft än många andra telefoner. Som sådan är det förmodligen tveksamt att något mindre än detta kommer att uppfylla dessa hastighetsriktmärken – men det kommer fortfarande att vara snabbare än nuvarande system.
Snap’s gav en fullständig översikt över ”denoising”, tillsammans med alldeles för många matematiska ekvationer, i sin fullständiga uppsats om processen, som du kan ladda ner själv här.
Det är ett intressant experiment, som också pekar på framtiden för generativ AI, som så småningom kommer att kunna svara på användarsignaler i realtid, vilket skulle kunna möjliggöra en hel rad nya användningsalternativ, som realtidsöversättning, allt mer responsivt skapande, och mer.
[ad_2]
Source link