Cum sunt antrenate și livrate modelele GPT, Claude și Gemini

De ce ne costă mai puțin să dăm unui AI un text enorm de citit, dar ne costă de cinci ori mai mult să-l facem să ne scrie un răspuns lung? Răspunsul ține de limitările fizice ale cipurilor, în memoria hardware și în cablurile care le conectează. Într-un interviu cu Dwarkesh Patel, Reiner Pope, fost arhitect hardware la Google pe seria TPU și actual CEO MatX, a explicat economia și limitările infrastructurii AI din spatele OpenAI, Google sau Anthropic.

Discuția abordează infrastructura de machine learning, arhitectura modelelor și mecanica de inferență și antrenament din interiorul unui cluster de servere.

Limite fizice

Dacă serverele ar procesa o singură cerere la un moment dat, costul ar fi astronomic. Memoria GPU-ului pierde enorm de mult timp doar pentru a aduce greutățile întregului model pe procesor. Soluția este să procesezi mii de secvențe unice simultan, un batch de aproximativ 2.000-3.000 de cereri. Astfel, costul încărcării memoriei se amortizează la maximum pe toți utilizatorii, iar factorul limitator devine strict capacitatea matematică de calcul a cipului.

În inferența modelelor mari de limbaj (LLMs), este un fapt documentat că la batch-uri mici sistemul este limitat de lățimea de bandă a memoriei, iar la batch-uri mari depinde de procesare.

Un model bazat pe „Mixture of Experts” (cum este DeepSeek) împarte datele către mai mulți experți. Limitările nu țin doar de soft, ci de fizică absolută: spațiul pentru cabluri, raza de îndoire a acestora, greutatea de tone a metalului dintr-un rack și soluțiile de răcire.

Topologiile centrelor de date moderne confirmă acest lucru. Rețeaua din interiorul unui rack Nvidia (Scale-up via NVLink) este de aproximativ 8 ori mai rapidă decât rețeaua care conectează rack-uri separate între ele (Scale-out via InfiniBand/Ethernet).

Input versus Output

În prețurile API-urilor, output-ul este de multe ori facturat de 5 ori mai scump decât input-ul. Pope demonstrează de ce: faza de Prefill (citirea prompt-ului tău) poate procesa toți tokenii în paralel. Acest lucru face operațiunea eficientă (compute-bound). În schimb, Decode-ul (generarea răspunsului) se face secvențial, literă cu literă, pas cu pas. La fiecare pas, sistemul trebuie să încarce iarăși o cantitate uriașă de parametri din memorie, făcând generarea complet limitată de latența memoriei.

Gemini, de exemplu, taxează cu 50% mai mult atunci când treci de pragul de 200.000 de tokeni per prompt. Matematic, la acel nivel, timpul necesar pentru a extrage KV Cache-ul (memoria de lucru care stochează ce au înțeles deja cip-urile din tokenii precedenți) îl depășește efectiv pe cel necesar pentru a procesa greutățile propriu-zise ale modelului. Așadar, pragurile de preț din API-uri oglindesc limitările hardware exacte la care modelele își pierd eficiența termodinamică și de memorie.

KV Cache-ul crește liniar direct proporțional cu lungimea contextului și dimensiunea batch-ului. La contexte foarte mari, KV Cache-ul devine dominant și mănâncă aproape toată memoria HBM disponibilă, forțând costuri gigantice la infrastructură.

Overtraining

Deși legea de scalare Chinchilla spune clar cât trebuie să antrenezi un model de o anumită dimensiune ca să obții un optim pe antrenament, modelele moderne sunt antrenate pe cantități gigantice de date care depășesc uneori de 100 de ori limitele legii. De ce? Pentru că este mai eficient financiar să ai un model puțin mai mic (chiar dacă l-ai antrenat excesiv plătind costuri masive o singură dată la antrenare) pe care apoi să îl oferi foarte rapid și ieftin sutelor de milioane de utilizatori zilnici.

Toate modelele puternice lansate recent (cum ar fi Llama 3) sunt extra-antrenate în comparație cu optimul teoretic Chinchilla, exclusiv pentru a oferi clienților latențe mai mici și costuri operaționale mai blânde.

Rețelele Neurale & Criptografia

Cele două domenii fac proceduri oarecum inverse: criptografia ia date structurate și le amestecă pentru a părea complet aleatoare, în timp ce AI-ul ia zgomot sau date haotice și le distilează pentru a extrage modele semantice și structură curată. Cu toate astea, din criptografie a fost împrumutată o procedură numită cifrul Feistel, care permite o prelucrare reversibilă a datelor. Aplicat sub forma de Reversible Networks (RevNets), permite GPU-urilor să ruleze backpropagation fără a fi nevoie să salveze în memoria principală toți pașii făcuți inițial, sacrificând putere de calcul suplimentară pentru a economisi spațiu esențial din memoria serverului.

Modelele RevNets folosesc o proprietate a blocurilor de tip Feistel pentru a reconstrui activările exact în faza de backpropagation (în mod invers). Calculul matematic suplimentar este o concesie excelentă având în vedere că memoria (VRAM) este mereu elementul cel mai prețios la scalarea antrenamentelor.

Jobs

Copywriter @ The Social Nest
Copywriter cu “vibe” de proiecte speciale (BTL & Social Media) Ai experienta de minim 5 ani... [detalii]

Social Media Manager @ Bad Habits
Căutăm un Social Media Manager care să ne demonstreze că social media nu este doar... [detalii]

PR Manager @ Confident Communications
RESPONSABILITĂȚI Creare și implementare hands-on a strategiilor de comunicare integrată pentru clienți B2B & B2C Implicare activă... [detalii]

Specialist Marketing Digital @ Ivatherm
Ivatherm (venituri de 12 milioane de euro | 70 de persoane | 70 de produse... [detalii]

Amazing Digital Marketing Internship @ Traction Keys
We’re looking for amazing interns to join our new team at Traction Keys in our... [detalii]

Revenue & Partnerships Specialist (Digital Growth & SaaS Sales) @ Flaminjoy Group
Role Overview We're looking for a Revenue & Partnerships Specialist who can identify, structure, and activate... [detalii]

Account Manager @ Publicis
We are expanding our Client Business Management team with an Account Manager to be part... [detalii]

Marketing Graphic Designer @ Natural Intelligence
Founded in 2009 and 100% self-funded to this day, Natural Intelligence is a leader in online multi-vertical... [detalii]

BTL Field & Production Manager @ The Social Nest
Căutăm un BTL Field & Production Manager cu focus puternic pe zona de producții speciale... [detalii]

Marketing Operations Specialist @ IXY Retail
IXY Retail, the Romanian official partner of NEXT UK is expanding and preparing to launch... [detalii]

Media Relations & Content Development Manager @ Lighthouse PR
Lighthouse PR își extinde echipa și caută un profesionist cu experiență solidă în media relations... [detalii]

Marketing Manager @ Bookster
Căutăm un coleg sau o colegă care să dezvolte și să coordoneze strategia de Marketing... [detalii]

Account Director @ Propaganda
Dacă: Poți convinge un client să accepte o idee creativă fără să intri în PowerPoint burnout; Ai... [detalii]

Group Account Director @ Propaganda
Propaganda caută Group Account Director care să conducă relația cu un portofoliu de clienți strategici,... [detalii]

Senior Account Manager @ Propaganda
Căutăm Account Manager senior... [detalii]

Account Executive @ Propaganda
Unele joburi sunt mai potrivite pentru tine decât altele... [detalii]

Account Manager - BTL @ Rename Advertising
Căutăm un Account Manager care nu doar urmărește task-uri, ci mișcă proiectele înainte... [detalii]

PR Specialist @ Lighthouse PR
Lighthouse PR is looking for a new colleague We’re Hiring: PR Specialist (2–3 years experience) Are... [detalii]

Senior Graphic Designer @ DDB
We’re on the lookout for a graphic designer with at least 7-8 years of agency... [detalii]

Account Manager @ Highlight Agency
We are looking for a team player, motivated and experienced Account Manager in BTL field,... [detalii]

UI/UX Designer ︈︌︁︍︍︎️︆︂︆︄︅︁︁︎︌︈︂︇︍︈︆︅️︊︄︈︌︊︎︂︎(Mid–Strong) @ Flaminjoy Group
We are seeking a highly motivated and experienced UI/UX Designer to design intuitive, engaging digital... [detalii]

Social Media & Content Creator @ HexagonX
Căutăm un Social Media & Content Creator care să crească alături de HexagonX... [detalii]

Performance Media Manager @ Stefanini Infinit
Căutăm un Performance Media Manager care să ne ajute să scalăm și să optimizăm campaniile... [detalii]

Administrative & Financial Hero @ Stefanini Infinit
Căutăm o persoană organizată și atentă la detalii pentru rolul de Asistent Administrativ & Financiar,... [detalii]

Social Media Manager @ Oxygen
We are looking for a Social Media Manager to oversee social media projects from strategy... [detalii]

Art Director @ Bell Studio
Căutăm un Art Director care nu doar dă direcția, ci și pune mâna și duce... [detalii]

Graphic Designer @ Ivatherm
Cautam un Graphic Designer mid-level (3–5 ani experienta) cu abilitati solide de design vizual si... [detalii]

Content Creator / Social Media Producer @ Bell Studio
Căutăm un creator care filmează, fotografiază, editează și — cel mai important — vine cu... [detalii]

Graphic Designer @ Bell Studio
Căutăm un graphic designer pasionat de advertising, cu energie bună și chef de muncă... [detalii]

Account Manager @ High Contrast
We are a creative agency with over 20 years of experience building brands and designing... [detalii]

Social Media & Influencer Marketing Specialist @ Flaminjoy Group
Social media content that earns attention... [detalii]

Graphic Designer @ Calipso
AI nu iti fura jobul... [detalii]

BTL Account Executive @ The Mansion Advertising
Responsabilitati: Recrutarea personalului din agentie: promoteri, hostesse, mascote, helperi, merchandiseri, team leaderi etc... [detalii]

Growth Marketing Department Manager @ Flaminjoy Group
About the Role Strategy defines direction... [detalii]

Content Creator @ Stefanini Infinit
După ce filmezi și editezi, iese ceva cu care te mândrești? Și la care lumea... [detalii]

Coordonator Logistică BTL @ The Mansion Advertising
Suntem în căutarea unui Coordonator Logistică BTL organizat și responsabil, care să se alăture echipei... [detalii]

Integrated Marketing Team Lead @ Zitec
Our promise: You choose how you'll work with us: fully remote, hybrid, or at our offices... [detalii]

Video Editor @ The Script Agency
We're a boutique creative & communications agency obsessed with doing great work for our clients... [detalii]

Account Manager @ DDB
O parte din proiectele de top din DDB își caută Account Manager... [detalii]

BTL Coordinator @ TOTAL PR
Responsabilitati Planificarea și organizarea proiectelor de marketing BTL inclusiv conferințe, evenimente și activități de direct marketing Realizarea... [detalii]

PR Manager @ Confident Communications
RESPONSABILITĂȚI Creare și implementare hands-on a strategiilor de comunicare integrată pentru clienți B2B & B2C Implicare activă... [detalii]

Media Relations Specialist @ Confident Communications
RESPONSABILITĂȚI Crearea și implementarea hands-on a strategiilor de presă Redactarea de conținut editorial: comunicate de presă, interviuri,... [detalii]

PR Executive @ Confident Communications
RESPONSABILITĂȚI Implementare hands-on a campaniilor integrate (media relations, social media, influencer marketing, evenimente, media buying) Coordonare cu... [detalii]

Senior Influencer Marketing Specialist @ Flaminjoy
Flaminjoy este platforma de influencer marketing care conectează peste 18... [detalii]

Social Media Manager @ The Social Nest
Căutăm om de Social cu minimum 2 - 3 ani de experiență în agenție, familiarizat... [detalii]

Creative Designer @ Kubis Interactive
We're on the hunt for a talented and thoughtful Creative Designer to join our team... [detalii]

Copywriter @ Hueman
Copywriter cu idei fresh wanted! Ești genul care face brainstorming și sub duș? Ai talent la... [detalii]

Social Media Advertiser @ Hueman
Ce cunoștințe trebuie să ai Ai experiență în crearea, observarea, analizarea și optimizarea campaniilor de publicitate... [detalii]

Specialist Marketing @ Editura Litera
La Editura Litera, fiecare carte are o poveste... [detalii]

Art Director @ Saatchi&Saatchi
Ești art mid, dar pe bune, adică ai câțiva ani de experiență în agenție, ai... [detalii]

BTL Account Manager @ The Mansion Advertising
Căutăm un BTL Project Manager excepțional care să se alăture echipei noastre! Dacă ești un profesionist pasionat... [detalii]

Account Manager @ Play Vertical
Play Vertical este agenția de producție video care știe că oamenii nu stau pe TikTok... [detalii]

Partnership Operations Specialist @ Create Direct
Suntem în căutarea unui Partnership Operations Specialist organizat și atent la detalii, care să ne... [detalii]

Coordonator Post-Productie @ Factor
Angajam coordonator Postproducție Audio-Video (Nivel Mediu)... [detalii]

Digital Marketing Specialist @ Zitec
Our promise: You choose how you'll work with us: fully remote, hybrid, or at our offices... [detalii]

Account Executive @ SAMY
SAMY is looking for an Account Executive with experience in influencer marketing to lead strategic... [detalii]

SR Account Director Influencer Marketing @ SAMY
SAMY, a global network of independent marketing and communications agencies, is looking for a SR... [detalii]

Campaign Manager @ BUZZStore
BUZZStore este prima platformă de word-of-mouth marketing din România și Bulgaria... [detalii]

Social Media Executive @ Bloom Communication
Cine suntem? Bloom Communication... [detalii]

Account Manager @ Vouchers Depot
Vouchers Depot is the largest digital gift card distributor in Romania and one of the... [detalii]

vezi toate joburile

Adauga anunt de recrutare

Cum sunt antrenate și livrate modelele GPT, Claude și Gemini

Limite fizice

Input versus Output

Overtraining

Rețelele Neurale & Criptografia

Companii

Branduri

Oameni

Pozitii

Subiecte

Sectiune

Dictionar

Branded

Related

Dario Amodei: La 18 luni distanță de țara geniilor artificiale

Samsung și Google Cloud își unesc forțele pentru a integra AI generativ în seria Samsung Galaxy S24

[AIdea] Alex Frimescu: AI-ul “fură” meseria specialiștilor… în sensul bun. Poate descoperi pattern-uri pe care nu le vezi așa ușor, deschizând uși către idei sau segmente de public cu potențial uriaș

[Digital Buzz - Webstock 2009] TPU.ro are UGC de 3 milioane de afisari pe luna

De la SEO la GEO: cum să rămâi relevant când toată lumea caută pe ChatGPT în loc de Google

Xiaomi își extinde portofoliul AIoT, acoperind mobilitatea, dispozitivele wearable și produsele esențiale de zi cu zi

Viitorul pe steroizi

Jobs

Catalog IQads

Digital Kitchen

Goldfish Project

AdSymphony

On Heels PR

DBO

Bloom Communication

MSLGROUP The Practice

Creative Market

Mullen Romania

Beans United