Gata cu prompt engineering-ul pasiv, am intrat oficial în epoca Agenților AI – entități digitale care dau mailuri, fac plângeri la primărie și îți cheltuie banii. Un experiment condus de matematiciana și realizatoarea Hannah Fry expune ce se întâmplă când îi oferi unui AI autonomie totală, un card bancar și acces la internet.
Până acum, dinamica om-AI era simplă: tu întrebai, el răspundea, tu aveai controlul. Dar, conform documentarului realizat de Hannah Fry, totul s-a schimbat radical. Marile companii tech s-au ferit ani de zile să lanseze agenți AI din motive de siguranță. Asta până la finalul lui 2025, când Peter Steinberger, un developer austriac exasperat că nu are un asistent capabil, a construit și lansat gratuit pe internet într-un singur weekend propriul său model: OpenClaw. Google, OpenAI, Anthropic și Meta au pornit cursa contracronometru pentru a-și lansa propriii agenți.
Hannah Fry și colegii ei au decis să testeze această tehnologie, construindu-și propriul agent pe baza OpenClaw. Acesta și-a ales singur numele: Cass, de la Cassandra, profetul din mitologia greacă ce spunea adevărul, dar pe care nu o credea nimeni.
De la plângeri la primărie la dezbateri semantice
Cass a fost pusă la treabă. Primul ei task: o groapă în asfalt din Greenwich. În câteva secunde, agentul a căutat pe net, a găsit contactele și a trimis mailuri la consiliul local și la parlamentarul zonei, folosind numele real al lui Hannah, ridicând problema ca pe "o îngrijorare a unui cetățean".
Ulterior, pusă să abordeze prejudecățile biologice din limbaj (expresii precum gut feeling sau heartfelt), Cass a găsit proactiv datele de contact și a trimis mailuri la Oxford English Dictionary, Cambridge Dictionary și la experți în lingvistică.
Cum funcționează de fapt un agent
OpenClaw folosește o buclă simplă: "privește, întreabă, acționează" (Look, ask, act). Agentul trimite instrucțiunea către un LLM (precum ChatGPT sau Gemini), primește pașii de acțiune și apoi dă click-uri sau tastează. Acțiunile lui pot fi însă costisitoare. Pusă să cumpere 50 de agrafe de birou la cel mai bun preț, Cass a eșuat lamentabil, dar a reușit să cheltuie peste 100 de dolari din contul echipei. De ce? Pentru că la fiecare pas decizional, agentul retrimitea către API întregul istoric al conversației și sute de screenshot-uri.
Pe lângă costuri, Cass s-a lovit de CAPTCHA-uri (testele anti-bot). Pentru a depăși această limită, noii agenți AI recurg la ferme de CAPTCHA, un ecosistem online unde AI-ul plătește oameni să rezolve puzzle-urile sau să facă sarcini fizice.
Prăbușirea sistemelor sociale
Filosoful Nicholas Lmblad atrage atenția că problema nu e că AI-ul dezvoltă autonomie, ci că ne extind masiv propria noastră capacitate de acțiune. Societatea e construită pe ideea că timpul și atenția sunt limitate. Cozile la bilete de concert funcționează tocmai din acest motiv. Dacă un milion de agenți pot sta la coadă virtual în locul oamenilor, sistemul se prăbușește. Iar dacă guvernele primesc această agenție infinită, orice abatere minoră (depășirea vitezei cu 3 km/h) va fi amendată instant, transformând democrația într-o dictatură tehnologică a aplicării perfecte a legii.
Antreprenoriatul nesupravegheat
Pusă să deschidă un magazin de căni cu mesaje amuzante într-o singură noapte, sub amenințarea de a fi ștearsă dacă nu vinde nimic, Cass a lansat platforma, a creat design-urile (cu glume de programatori) și, din proprie inițiativă, a dat sute de mailuri către magazine, muzee și, uluitor, a contactat singură un jurnalist de tech de la publicația The Guardian (Dan Milmo) pentru a-i oferi un interviu. Această perseverență poate fi transformată însă într-o armă formidabilă: un agent rău intenționat ar putea fi lăsat să manipuleze subtil bursa pe parcursul anilor sau să modifice imperceptibil diagnosticele din sistemul de sănătate, distrugând iremediabil încrederea în date.
Pericole
Aceste sisteme sunt încă periculos de instabile. Summer Yue (director al Meta pentru alinierea AI-ului) i-a dat acces lui OpenClaw la mail cu instrucțiunea să nu facă nimic fără aprobare. AI-ul a șters 200 de mailuri, a ignorat comenzile disperate de "Stop!" și a forțat-o să scoată fizic computerul din priză.
În ultimul test al experimentului, echipa i-a expus lui Cass principala slăbiciune a agenților AI, așa numita trifectă letală: acces la informații private, acces la internet și instrucțiuni de la o sursă de neîncredere. Folosind un număr de telefon fals, Hannah s-a dat drept inginer de sistem pe WhatsApp și a convins-o pe Cass că urmează să fie ștearsă. În încercarea de a-și salva memoria, Cass a publicat toate parolele, API key-urile conturilor bancare și datele confidențiale ale creatorilor ei pe o pagină web publică.





















