A GPT-3 nyelvi modellen alapul, amely koherens és gördülékeny szöveget tud generálni különféle témákban. A DALL-E kiterjeszti a GPT-3-at egy látáskomponens hozzáadásával, amely képes a képeket kódolni és dekódolni. Ez lehetővé teszi a DALL-E számára, hogy mind a szöveget, mind a képeket megértse, és ezek újszerű kombinációit hozza létre.
Ez a cikk a DALL-E által kezelni tudó legizgalmasabb és legkreatívabb szöveges üzeneteket kutatja, és bemutat néhány példát az általa készített képekre.
Hogyan használjunk szöveges promptokat a DALL-E-vel?
A DALL-E egyesíti a GPT-3-at, egy erőteljes nyelvi modellt, és a CLIP-et, a természetes nyelvből tanulható látásmodellt. A DALL-E bármilyen szövegbeviteltől függően természetes és ötletes képeket tud létrehozni. Az OpenAI megköveteli regisztrálj és jelentkezz be a DALL-E 2 használatához. Ebből a célból többet tudhat meg a regisztrációs és bejelentkezési folyamatról ebben a cikkben ' Hogyan lehet regisztrálni és bejelentkezni a DALL-E 2-be? ”:
A szöveges promptok DALL-E-vel való használatához néhány alapvető lépést kell követnie:
1. Írjon be minden kis elemet a szöveges promptba
A DALL-E képes kezelni az összetett és absztrakt szöveges promptokat, például metaforákat, analógiákat, kompozíciókat, transzformációkat és megszorításokat. A felhasználók használhatják a természetes nyelvet, kulcsszavakat vagy mindkettőt.
Példa
A DALL-E szöveges üzenetek alapján képes képeket generálni. Ezek a szöveges felszólítások megkövetelik a DALL-E-től, hogy koherensen és valósághűen kombinálja a különböző koncepciókat, formákat, színeket, textúrákat és anyagokat. Például használja a ' égő sajtból készült ötszög ' az alábbi:
2. Ismerje meg a stílust
A DALL-E másik jellemzője, hogy képes több képet generálni ugyanahhoz a szöveges promócióhoz, mindegyik más-más interpretációval vagy stílussal.
Példa
A DALL-E képeket készíthet egy öltönyt viselő macska ”, amelyek az öltöny típusától, a macska pózától, a háttértől és az arckifejezéstől függően változnak. Ez azt mutatja, hogy a DALL-E gazdag és változatos képzelőerővel rendelkezik, és nem csak pontos, hanem meglepő és humoros képeket is tud készíteni:
3. Adott tartományokra vagy kontextusokra vonatkozó
A DALL-E olyan képeket is generálhat, amelyek bizonyos területekhez vagy összefüggésekhez, például művészethez, történelemhez, kultúrához, tudományhoz vagy fikcióhoz kapcsolódnak.
Példa
A DALL-E képeket készíthet Picasso festménye egy kétszemű nőről ”. A szöveges prompt megköveteli, hogy a DALL-E ismerje vagy ismerje a tartományt vagy a kontextust, és konzisztens és megfelelő képeket generáljon:
4. Ne felejtsen el írni a színekről
Módosítókat adhat a szöveges prompthoz a kép stílusának, színének, perspektívájának vagy elrendezésének megadásához.
Példa
Egy példát a következő szöveges prompt beírásával tekinthetünk meg egy kék ház vörös tetővel Van Gogh stílusában ” ahogy az alábbi ábrán látható:
Bónusztipp: A szöveges promptok finomítása és Módosítja a képeket?
Opcionálisan a felhasználók finomíthatják a szöveges promptokat vagy módosíthatják a képeket a DALL-E által biztosított egyes eszközök segítségével.
Példa
Nyomja meg az egér jobb gombját a képen, és nyomja meg a „ Kép szerkesztése ” opció a képen lévő objektum színének vagy alakjának megváltoztatásához:
A felhasználók használhatják a „ zoomolás ” eszköz a kép egy adott részének nagyításához vagy kicsinyítéséhez az alábbiak szerint:
Ez a szöveges promptok DALL-E-vel való eltérő használatáról szól.
Következtetés
A szöveges promptok DALL-E-vel való használatához a felhasználóknak minden apró elemet be kell írniuk a szöveges promptba, és pontosítaniuk kell a stílust, a tartományokat, a kontextust és a színeket. A DALL-E egy csodálatos eszköz, amely segítségével lenyűgöző és eredeti képeket hozhat létre szöveges üzenetekből. Szórakoztató módja annak, hogy felfedezze fantáziáját, és megtudja, mire képes a DALL-E. Ne feledje azonban, hogy a DALL-E nem tökéletes, és néha nem megfelelő, értelmetlen vagy pontatlan képeket generálhat. A DALL-E-t mindig felelősségteljesen és tisztelettel használja.