Deși s-ar putea să vă simțiți copleșiți de numarul de modele AI, startup-uri, investitori și companii Big Tech care sunt in horal AI, știați că toate, și mă refer la absolut toate, fac același pariu, mai exact: AI generativă?
Din punct de vedere al banilor, AI și AI generativă sunt aproape acelasi lucru; acesta din urmă a consumat întreaga narațiune, a absorbit tot interesul, capitalul și tracțiunea și a făcut să pară că nimic altceva nu contează.
Dar dacă… greșim cu toții?
Meta spune acum că LLM-urile nu vor fi coloana vertebrală a inteligenței artificiale, un pariu împotriva aproape fiecărui dolar investit în AI în ultimii ani. Iată de ce.
Pe scurt, Meta a prezentat prima sa provocare reală pentru status quo – un model al lumii (World Model) AI non-generativ care atinge mai multe scoruri reusite de modelele de ultimă generație. Și folosind o abordare alternativă, ei sunt foarte clari (și spun explicit acest lucru), că toată lumea procedeaza greșit, că toată lumea își plasează pariurile unde nu trebuie.
Dar ce este un World model? Și de ce este atât de important?
În termeni simpli, se bazează pe principiul inferenței active a creierului uman, în care creierul nostru construiește o reprezentare a lumii din interiorul nostru care îl ajută să facă predicții despre ceea ce se va întâmpla în lumea reală; este literalmente ceea ce permite oamenilor să supraviețuiască într-o lume în schimbare, complicată și parțial observabilă.
Simplificand, noțiunea de modele ale lumii (world models)
Mai informal, ceea ce cercetătorii Meta își propun să construiască cu acest „world model” este un motor de bun simț pentru mașini (Yann LeCun, cercetator șef la Meta).
Dar ce este „bunul simț”? De la o vârstă fragedă, dezvoltăm o noțiune despre ceea ce este așteptat sau neașteptat despre lumea reală. Bebelușii învață foarte devreme că, dacă aruncă o minge în aer, mingea cade înapoi; nici copilul, nici noi nu ne așteptăm ca mingea să rămână în aer, pentru că, ei bine, gravitația.
Aceste seturi de intuiții construiesc ceea ce este descris în mod colocvial drept „bunul simț”, care este capacitatea noastră de a supraviețui într-o lume în continuă schimbare ca a noastră, făcând predicțiile necesare despre ceea ce se va întâmpla în continuare pentru a ne crește șansele de supraviețuire.
De exemplu, știți că a face un pas in plus în timp ce vă aflați pe marginea unei prapastii nu se va termina bine, în același mod în care creierul nostru activează instantaneu piciorul pentru a împinge pedala de frână în timp ce mașina din fața dvs. se oprește brusc.
Astfel, „modelul World” al creierului nostru, acest motor de bun simț, este o reprezentare simplificată a lumii care surprinde adevăratul său sens și, prin reprezentare, vreau să spun că, deoarece creierul nostru nu poate acorda atenție fiecărui detaliu din jurul nostru, păstrează doar ceea ce este important și ignoră restul; reprezintă părțile esențiale ale fiecărui obiect, eveniment, acțiune și ignora orice altceva, permițându-i să înțeleagă ce se va întâmpla în continuare, având în vedere „starea” lui această lume.
Altfel spus, a avea un model world este dovada că înțelegeți lumea, cel puțin într-o oarecare măsură.
Înțelegând importanța modelelor world, este ușor de înțeles de ce oamenii de știință doresc să formeze un adevărat model al lumii; o IA care înțelege lumea este cea mai scurtă cale către Inteligența Generală Artificială (AGI), până la punctul în care „construirea unui model al lumii” este obiectivul principal pentru mulți dintre titulari, așa cum au spus deschis oameni precum fondatorul și CEO-ul Google Deepmind, precum și laureatul Nobel, Demis Hassabis; nu sunt modele de reasoning sau un agent AI verticalizat, scopul acestor laboratoare este acest „model al lumii” care oferă un „common sense” pentru mașini.
Și ceea ce fac toate aceste laboratoare este să spere că ChatGPT sau Gemeni ne vor duce la acea viziune a modelului World. Dar apare o întrebare:
Abordarea lor este fundamental defectuoasă? Poate un model generativ să înțeleagă lumea generând-o?