Stabilna difuzija postane javna - in internet je obnoren

Stabilna difuzija postane javna – in internet je obnoren

Dobrodošli v Dolgi pogled-kjer pregledamo tedenske novice in jih zmanjšamo na pomembnost. Gremo delati kar je res pomembno.

Ta teden: A Stabilna difuzija Še posebej

Razen če ste zadnji teden živeli pod skalo, ste videli nekaj preko difuzije stojnic. Je nov odprtokodni model strojnega učenja za ustvarjanje slik iz besedila in celo druge slike.

Varnost AppSec/API 2022

Analiza: Odprta koda je ključ

Tako kot DALL-E in Midjourney mu daste besedilni “poziv” in ustvari neverjetne slike (ali včasih popolne smeti). Za razliko od drugih modelov je odprtokoden, zato enega že vidimo Eksplozija inovativnosti.

Mark Hachman to imenuje Nova ubijalska aplikacija’

Izpopolnite svojo algoritemsko umetnost
Umetna inteligenca je fascinantna. Vnesite poizvedbo in algoritem bo ustvaril sliko po vaših zahtevah. Na splošno se vse to dogaja na spletu z algoritmi, kot je DALL-E. [But] Stability.Ai in njegov model Stable Diffusion sta razbila ta kalup … z modelom, ki je javno dostopen v lahko deluje na potrošniških grafičnih procesorjih.

Za zdaj Stability.Ai priporoča, da imate GPE z vsaj 6,9 GB video RAM-a. Na žalost so trenutno podprti samo grafični procesorji Nvidia. [But] če imate zmogljiv računalnik, si lahko vzamete ves čas, da natančno prilagodite svojo algoritemsko umetnost in pripravite nekaj resnično impresivnega.

Iz konjskih ust je Emad Mostaque: Javna izdaja stabilne difuzije

Uporabite to na etičen, moralen in zakonit način
Z veseljem naznanjamo javno izdajo Stable Diffusion. … V zadnjih nekaj tednih smo bili vsi preobremenjeni z odzivom in trdo smo delali, da bi zagotovili varno in etično izdajo, pri čemer smo uporabili podatke iz naših testov beta modelov in skupnosti za ukrepanje proti razvijalcem.

Ker so bili ti modeli urjeni na parih slika-besedilo iz širokega internetnega odpadka, lahko model reproducira nekatere družbene pristranskosti in proizvede nevarno vsebino, zato odprte strategije zmanjševanja in odprta razprava o teh pristranskostih pritegnejo vse v ta pogovor. … Upamo, da bodo vsi to uporabili na etičen, moralen in zakonit način ter prispevali k skupnosti in diskurzu okoli nje.

Ja prav. Ste bili kdaj na internetu? Kyle Wiggers zveni zaskrbljeno: Deepfakes za vse

90% jih je žensk
Stable Diffusion … zdaj uporabljajo storitve ustvarjanja umetnin, kot so Artbreeder, Pixelz.ai in druge. Toda nefiltrirano uživanje v modelu ne pomeni, da je bila vsa uporaba povsem prekomerna.

Drugi sistemi za ustvarjanje umetnosti z umetno inteligenco, kot je OpenAI’s DALL-E 2, so implementirali stroge filtre za pornografsko gradivo. … Poleg tega mnogi nimajo sposobnosti ustvarjanja umetnosti javnih osebnosti. … Ženske so, žal, daleč najverjetneje žrtve tega. Študija, izvedena leta 2019, je pokazala, da je od 90 % do 95 % globokih ponaredkov, ki niso prostovoljni, približno 90 % žensk.

Zakaj je to tako velik posel? Samo vprašajte Simona Willisona:

Znanstvena fantastika je resnična
Stabilna difuzija je res velika stvar. Če niste bili pozorni na dogajanje … bi res morali biti. … Podoben je modelom, kot je DALL-E Open AI, vendar z bistveno razliko: izdali so celotno stvar.

V samo nekaj dneh je prišlo do eksplozije inovacij povsod. Stvari, ki jih ljudje gradijo, so popolnoma neverjetne. … Ustvarjanje slik iz besedila je ena stvar, ustvarjanje slik iz drugih slik pa je povsem nova igra. … Predstavljajte si, da imate konceptualnega umetnika na zahtevo, ki lahko ustvari vse, kar si lahko zamislite, in z vami ponavlja do vašega idealnega rezultata.

Znanstvena fantastika je zdaj resnična. Generativni modeli strojnega učenja so tukaj in hitrost, s katero se izboljšujejo, je neresnična. Vredno je posvetiti resnično pozornost.

Kakšen je v primerjavi z DALL-E? Samo vprašaj Beyondo:

Osebno je stabilna difuzija boljša. … OpenAI se sliši, kot da so ustvarili sveti gral modelov za generiranje slik, vendar njihove slike ne navdušijo nikogar, ki je uporabljal stabilno difuzijo.

@fabianstelzer naredil kup primerjalnih testov:

Ti slikovni sintetizatorji so kot instrumenti – neverjetno je, da jih dobimo toliko, od katerih ima vsak edinstven “zvok”. … DALL-E je res odličen za obrazno mimiko. [Midjourney] obrišite tla z drugimi, ko gre za… zahteve po teksturnih podrobnostih štejejo. … DALL-E je običajno za prizore z 2 ali več jasnimi “igralci.” … DALL-E in SD sta boljša pri fotografijah … Stabilna difuzija lahko naredi neverjetne fotografije … vendar morate paziti, da ne “preobremenite” scene.

V trenutku, ko v poziv vnesete “umetnost”, Midjourney preprosto ponori. … Pomanjkljivosti DALL-E so videti zelo digitalne, za razliko od MJ-jevih. … Ko gre za kopiranje določenih slogov, je SD absoluten 🤯🤌 [but] DALL-E vam ne bo naredil Botticellijeve slike Trumpa.

Kaj pa podatki o usposabljanju? Tukaj je Andy Baio:

Ena največjih frustracij modelov AI za ustvarjanje besedila v sliko je, da se počutijo kot črna skrinjica. Vemo, da so bili urjeni na slikah, povzetih s spleta, toda katere? … Ekipa, ki stoji za Stable Diffusion, je bila zelo pregledna glede tega, kako je njihov model usposobljen. Od javne izdaje prejšnji teden je Stable Diffusion eksplodiral v priljubljenosti, predvsem zaradi svoje brezplačne in permisivne licence.

Simon Willison [and I] zgrabil podatke za več kot 12 milijonov slik, uporabljenih za treniranje stabilne difuzije. [It] je bil usposobljen iz treh ogromnih podatkovnih nizov, ki jih je zbral LAION. … Vsi nabori slikovnih podatkov LAION so zgrajeni iz Common Crawl, [which] vsak mesec postrga milijarde spletnih mest in jih objavi kot ogromne nabore podatkov. … Skoraj polovica slik, približno 47 %, je bila pridobljena iz samo 100 domen, pri čemer je največ slik prihajalo iz Pinteresta. … Blogi, ki jih gosti WordPress na wp.com in wordpress.com, predstavljajo … 6,8 % vseh slik. Druga spletna mesta za fotografije, umetnost in bloganje vključujejo … Smugmug … Blogspot … Flickr … DeviantArt … Wikimedia … 500px in … Tumblr.

Medtem, kako deluje? Letitia Parcalabescu je lahko reči zanjo:

Kako delujejo modeli latentne difuzije? Če želite odgovore na ta vprašanja, smo vam na voljo!


Morala zgodbe:
Kakšni bedaki so ti smrtniki

Prebrali ste Dolgi pogled avtorja Richie Jennings. Kontaktirate ga lahko na @RiCHi oz [email protected].

Slika: Stabilna difuzija, prek Andyja Baia (Creative ML OpenRAIL-M; zglajeno in obrezano)

Leave a Comment

Your email address will not be published.