Projekt Genie, prototyp umelej inteligencie od spoločnosti Google na vytváranie interaktívnych svetov

  • Projekt Genie kombinuje Genie 3, Nano Banana Pro a Gemini na generovanie interaktívnych virtuálnych svetov z textu alebo obrázkov.
  • Prístup je obmedzený pre predplatiteľov služby Google AI Ultra v Spojených štátoch, s reláciami v dĺžke do 60 sekúnd a rozlíšením okolo 720p.
  • Nástroj umožňuje skicovať, skúmať a miešať svety v reálnom čase, ale trpí problémami s realizmom, latenciou a slabým ovládaním postáv.
  • Jeho schopnosť napodobňovať známe hry otvára diskusie o autorských právach a znepokojuje časť herného priemyslu.

Projekt umelej inteligencie na generovanie interaktívnych svetov

Google urobil nový krok vo svojej ofenzíve. umelá inteligencia aplikovaná vo videohrách a virtuálne svety So spustením Project Genie, prototypu, ktorý umožňuje používateľom generovať a navigovať v interaktívnych prostrediach na základe niekoľkých textových pokynov alebo obrázka, spoločnosť prezentuje tento nástroj ako experiment, ktorý je stále v testovaní. Jeho prvé ukážky však v tomto odvetví vyvolali nadšenie aj pochybnosti.

Prístup je zatiaľ obmedzený na predplatitelia plánu Google AI Ultra v Spojených štátochs krátkymi sedeniami a výkonom, ktoré jasne vyznačujú experimentálnu povahu systému. Projekt však poukazuje na budúcnosť, v ktorej by mohol každý používateľ vytvorte malý „hrateľný svet“ v priebehu niekoľkých sekúnd, bez toho, aby ste museli vedieť programovať alebo ovládať grafické enginy.

Čo je Projekt Genie a aké technológie kombinuje?

Generátor svetov s umelou inteligenciou

Projekt Džin je výskumný prototyp vyvinutý spoločnosťami Google DeepMind a Google AI ktorý funguje ako generátor interaktívneho sveta. Jeho technický základ spočíva na troch pilieroch: modeli Genie 3, špecializovanom na simuláciu dynamických prostredí; Nano Banana Pro, zodpovednom za vizuálne aspekty a náčrty; a Gemini, multimodálnom modeli, ktorý interpretuje používateľské pokyny a pôsobí ako asistent počas tvorby.

Srdcom systému je Genie 3, model „sveta“ schopný predpovedať, čo sa deje na obrazovke snímok po snímkeNa rozdiel od predchádzajúcich technológií, ktoré generovali iba statické 3D scény, tento prístup umožňuje prostrediu reagovať na pohyby hráča v reálnom čase s približným rozlíšením 720p a niekoľkými minútami vizuálnej koherencie podľa interných experimentov spoločnosti DeepMind.

Na základe toho je integrovaný Nano Banana Pro, zodpovedný za generovanie počiatočného obrazu javiska Tento úvodný pohľad, ktorý začína popisným textom alebo referenčným obrázkom, slúži ako náčrt na rozhodnutie o grafickom štýle, zložení sveta a vzhľade postavy, ktorá bude ovládaná počas prieskumu.

konečne, Gemini funguje ako orchestračná vrstva a asistentInterpretuje pokyny v prirodzenom jazyku, pomáha upravovať svet za pochodu a uľahčuje úlohy, ako je zmena perspektívy (prvá alebo tretia osoba), remixovanie už vytvoreného prostredia alebo spájanie viacerých nápadov do jedného hrateľného scenára.

Ako sa vytvárajú a skúmajú virtuálne svety

Interaktívne svety generované umelou inteligenciou

Činnosť Projektu Genie je štruktúrovaná okolo progresívny proces v troch fázach Google to zhrňuje ako skicovanie, skúmanie a prelínanie svetov. Cieľom je, aby ktokoľvek mohol prejsť od nápadu k malému interaktívnemu zážitku bez použitia ďalších nástrojov.

V prvej fáze používateľ napíše popis sveta, ktorý chce vytvoriť, alebo nahrá referenčný obrázok. Na základe tohto vstupu... Nano Banana Pro generuje statický náhľad Prostredie môže byť les v nízkopolygonálnom štýle, futuristické mestské prostredie, historická krajina alebo čokoľvek, čo je opísané v texte. V tejto fáze sa tiež definuje typ postavy, režim kamery a niektoré základné parametre pohybu.

Akonáhle je náčrt prijatý, do hry vstupuje Džin 3, ktorý hráčovi umožňuje Voľne preskúmajte prostredie pomocou typických ovládacích prvkov pre PC, ako sú klávesy W, A, S a D.Model generuje za chodu to, čo sa objaví pred postavou, predpovedá každý záber na základe predchádzajúcich a zachováva určitú konzistenciu, keď sa kamera otočí alebo sa vráti do už navštívenej oblasti.

Treťou kľúčovou schopnosťou je kombinovanie a remixovanie svetovSystém umožňuje používateľom vrátiť sa k predtým vygenerovaným scenárom, upraviť ich s novými parametrami, zlúčiť ich alebo dokonca použiť vopred vygenerované svety od Googlu ako základ na vytváranie variácií. Okrem toho je možné zdieľať videá zo stretnutí, aby si ich ostatní používatelia mohli pozrieť alebo použiť ako inšpiráciu.

Toto všetko je spustené z webovej aplikácie podobnej iným službám Google AI, takže Nie je potrebné inštalovať žiadne ďalšie programy ani pokročilé technické znalosti.Jednoducho spustite nástroj, zadajte inštrukciu a začnite testovať kombinácie, kým nenájdete zaujímavý výsledok.

Technické obmedzenia: čas, výkon a realizmus

Obmedzenia prototypu umelej inteligencie pre virtuálne svety

Google trvá na definovaní Projektu Genie ako výskumný prototyp s výrazným experimentálnym charakteromToto označenie nie je len formalita: súčasné skúsenosti predstavujú niekoľko jasných obmedzení, ktoré podmieňujú praktické využitie nástroja nad rámec počiatočnej zvedavosti.

Najzrejmejším je ten 60-sekundový limit na generovanie a prieskumnú reláciuPo tejto minúte sa svet vypne a musí sa začať nový zážitok. Spoločnosť vysvetľuje, že toto obmedzenie umožňuje lepšie rozdelenie výpočtových zdrojov, pretože každá relácia rezervuje vyhradený čip pre používateľa, ktorý hrá.

Pokiaľ ide o výkon, verejné testy opisujú rozlíšenie blízke 720p a frekvencia medzi 20 a 24 snímkami za sekunduTieto funkcie sú sprevádzané citeľným oneskorením vstupu pri pohybe postavy alebo zmene kamery. Podľa niektorých prvých testerov sa zážitok podobá skôr interaktívnemu videu než plne plynulej tradičnej videohre.

Treba tiež poznamenať, že Genie 3 Nie je to klasický grafický engine, ale model, ktorý predpovedá ďalší snímok. Na základe vyššie uvedeného. Výsledkom je zvláštne správanie: cesty, ktoré menia textúru bez zjavného dôvodu, prvky, ktoré miznú, nepravdepodobná fyzika alebo animácie, ktoré sa náhodne deformujú.

Samotný Google varuje, že vygenerované svety „Môžu sa zdať úplne skutočné alebo vždy zodpovedať indikáciám alebo fyzikálnym zákonom.“A ovládanie postáv môže byť nepresné. Inými slovami, technológia síce síce vyzerá sľubne, ale stále má ďaleko od toho, aby ponúkala vycibrený herný zážitok, čo sa týka hrateľnosti a vizuálnej stability.

Obmedzený prístup a medzinárodný plán

Obmedzený prístup k prototypu umelej inteligencie

V tejto prvej fáze je Projekt Genie dostupný iba pre Zákazníci služby Google AI Ultra v Spojených štátochNajpokročilejší predplatný plán spoločnosti je zameraný na firmy a tvorcov, ktorí potrebujú vysokovýkonné funkcie umelej inteligencie. Ide o prémiovú službu, ktorá obmedzuje počet používateľov s prístupom k experimentu.

Rozhodnutie obmedziť testovanie sa vysvetľuje jednak tým, výpočtové náklady na každú reláciu Je to kvôli záujmu spoločnosti Google o zhromaždenie podrobnej spätnej väzby pred širším spustením. Riaditeľ výskumu spoločnosti DeepMind, Shlomi Frutcher, zdôraznil, že je „vzrušujúce“ sprístupniť tieto nástroje väčšiemu počtu ľudí, aby zhromaždili názory na ich používanie v reálnom svete, ale zatiaľ nie je stanovený konkrétny dátum ich príchodu do Európy alebo na iné trhy.

Z pohľadu španielskych a európskych používateľov a štúdií to znamená, že prinajmenšom v krátkodobom horizonte Najrealistickejšou úlohou bude úloha pozorovateľapozorne sledovať testy, analyzovať videá, ktoré už kolujú na sociálnych sieťach, a posúdiť, do akej miery by sa táto technológia dala integrovať do pracovných postupov pre návrh úrovní, rýchle prototypovanie alebo vizualizáciu nápadov.

Spoločnosť Google naznačila svoj zámer postupne rozširovať prístup Za predpokladu, že to výkon, náklady a právne otázky dovolia. Tempo tohto rozšírenia však bude závisieť aj od reakcie komunity a od toho, ako sa budú vyvíjať diskusie o autorských právach a zodpovednom používaní obsahu tretích strán.

Schopnosť napodobňovať známe hry a debaty o autorských právach

Jedným z najchúlostivejších bodov Projektu Genie bolo jeho schopnosť s rôznou mierou úspechu znovu vytvoriť svety jasne inšpirované existujúcimi videohramiNiektorým špecializovaným novinárom sa podarilo vytvoriť scenáre, ktoré sa jasne podobali titulom ako Super Mario 64, Metroid Prime alebo The Legend of Zelda: Breath of the Wild.

V prípade Zeldy ich dokonca videli postavy, ktoré pri zoskoku spustia paragliderToto gesto úzko súvisí s hrou od Nintenda. Tieto zhody naznačujú, že model bol trénovaný s použitím veľkého množstva verejne dostupných herných videí, čo vyvoláva otázky o zaobchádzaní s duševným vlastníctvom pri trénovaní umelej inteligencie.

Po niekoľkých testoch, v ktorých boli znovu vytvorené svety inšpirované veľmi známymi franšízami, spoločnosť Google začala blokovať generovanie určitých scenárov a postávnajmä ak sa spomínajú konkrétne mená alebo ochranné známky. V niektorých prípadoch nástroj priamo bráni vytváraniu svetov založených na určitých ságach s odvolaním sa na „záujmy poskytovateľov obsahu tretích strán“.

Spoločnosť vysvetľuje, že Projekt Genie je „vyškolení primárne s verejne dostupnými webovými údajmi“Pamätajte však, že tento obsah naďalej podlieha autorským zákonom. Výsledkom je systém moderovania, ktorý je stále vo výstavbe a v ktorom sú niektoré pokusy o reprodukciu diel chránených autorskými právami výslovne blokované, zatiaľ čo iné prechádzajú, pokiaľ sa vyhnete príliš priamym odkazom.

Toto nepravidelné správanie podnecuje diskusiu o Do akej miery sa môže alebo mala by umelá inteligencia inšpirovať existujúcimi hrami? A kde je hranica medzi poctou, napodobňovaním a kopírovaním? Diskusia, ktorá bude pravdepodobne obzvlášť relevantná v regiónoch, ako je Európska únia, kde sa regulačné rámce pre tréningové údaje a autorské práva v oblasti umelej inteligencie stále definujú.

Potenciálny vplyv na herný priemysel

Okrem mediálnej príťažlivosti sledovania svety „ako Mario“ alebo „ako Zelda“ vygenerované v priebehu niekoľkých sekúndProjekt Genie je súčasťou širšej súťaže medzi veľkými technologickými spoločnosťami o aplikáciu generatívnej umelej inteligencie vo vývoji hier. Napríklad spoločnosť Microsoft predstavila projekty ako Muse na automatizáciu častí procesu návrhu a výroby a ďalšie spoločnosti skúmajú podobné riešenia na zníženie nákladov a urýchlenie vývoja.

V tejto súvislosti sa návrh spoločnosti Google snaží stať nástroj na rýchle prototypovanie a experimentovanie Toto by mohlo byť zaujímavé pre nezávislé štúdiá aj veľkých vydavateľov. Schopnosť vytvoriť hrateľný scenár z náčrtu alebo odseku textu môže uľahčiť včasné overenie nápadov, vytvorenie interných dem alebo testovanie mechaník bez investovania mesiacov práce.

Nárast týchto typov riešení však vyvoláva obavy u niektorých v tomto sektore. Na jednej strane, Existujú obavy z možného vplyvu na určité profesionálne profily. Ak sa časť obsahu generuje automaticky. Na druhej strane, mnohí vývojári sa obávajú obchodných modelov, v ktorých je umelá inteligencia trénovaná na už publikovaných dielach bez jasnej kompenzácie pre ich autorov.

Na európskom a španielskom trhu, kde je diskusia o ochrane kultúrnej tvorby obzvlášť intenzívna, bude kľúčové vidieť, ako nástroje ako Project Genie zapadnú do budúcich predpisov. Aspekty ako transparentnosť týkajúca sa údajov o školeniach, systémy odhlásenia pre držiteľov práv a uvádzanie zdroja vytvoreného obsahu môžu znamenať rozdiel medzi obozretným prijatím a pretrvávajúcim konfliktom s vývojármi a vydavateľmi.

Projekt Genie je zatiaľ v ranej fáze, kde Funguje skôr ako verejné laboratórium než ako hotový produkt.Jeho vývoj a to, ako Google rieši súvisiace právne a etické otázky, určí, či sa nakoniec integruje do pracovných postupov v štúdiách, alebo zostane len okázalým, ale obmedzeným experimentom.

Vzhľad tohto prototypu však jasne ukazuje, že veľké technologické spoločnosti v ňom vidia Automatické generovanie interaktívnych svetov strategický terén prvého rádu. Hoci jeho skutočné využitie je dnes obmedzené a sužované technickými nedokonalosťami, smer vývoja je jasný: modely čoraz viac schopné transformovať text a obrázky na hrateľné zážitky a odvetvie, ktoré sa bude musieť rozhodnúť, ako chce s týmito novými nástrojmi koexistovať.

Súvisiaci článok:
Definícia virtuálnej reality Čo by ste mali vedieť!