Când tehnologia se intersectează cu competiția academică, rezultatele pot fi neașteptate: Gemini 2.5 Deep Think a obținut performanțe demne de o medalie de aur la concursul internațional ICPC, după ce în iulie s-a remarcat și la probleme matematice. ICPC, considerat cel mai vechi și influent concurs universitar de programare algoritmică, atrage studenți de la aproape 3.000 de universități din 103 țări, iar finala mondială solicită echipelor să rezolve 12 probleme reale în cinci ore, unde doar soluțiile perfecte influențează clasamentul. Atmosfera e serioasă: reprezintă un nivel educațional superior olimpiadelor de liceu și o probă autentică de adaptare la provocări complexe.
Anul acesta, din cele 139 de echipe calificate în finală, patru au câștigat medalii de aur. O versiune avansată a lui Gemini 2.5 Deep Think, ajustată pentru a concura în timp real într-un mediu online remote și operând conform regulilor ICPC, a rezolvat 10 din 12 probleme în 677 de minute. În termeni practici, asta înseamnă că a executat cod, a utilizat structuri de date avansate și algoritmi sofisticați, ajungând rapid la soluții: opt probleme în primele 45 de minute și încă două în decurs de trei ore. Dacă ar fi comparată direct cu echipele umane, Gemini ar fi ocupat locul al doilea la general. Google subliniază un rezultat deosebit: problema C, pe care nicio echipă umană nu a rezolvat-o, a fost rezolvată de Gemini.
Problema C implica distribuirea unui lichid printr-o rețea de conducte către multiple rezervoare, cu scopul de a determina configurația conductelor care umple toate rezervoarele cât mai rapid posibil. Dificultatea rezida în faptul că fiecare conductă poate fi deschisă, închisă sau parțial deschisă, generând un număr nelimitat de configurații posibile și făcând căutarea exhaustivă nepracticabilă. Abordarea lui Gemini a îmbinat intuiția algoritmică cu tehnici matematice: a început prin asignarea fiecărui rezervor a unei valori de prioritate, adică cât de mult ar trebui favorizat unul în fața celuilalt. Pentru un set fix de valori de prioritate, problema devenea tratabilă prin programare dinamică; apoi, folosind teorema minimax, Gemini a reformulat problema originală ca o căutare a acelor valori de prioritate care minimizează fluxul. Observând că spațiul soluțiilor era convex și funcția avea forma unui „bol”, a aplicat o căutare ternară dublă (nested ternary search) pentru a identifica rapid prioritățile optime și, pe baza acestora, configurațiile de conducte potrivite. Astfel, a găsit o soluție eficientă acolo unde metodele convenționale păreau să se blocheze.
Google explică succesul ca fiind rodul unor progrese multiple: îmbunătățiri în pre-antrenare și post-antrenare, tehnici noi de învățare prin întărire, capacități de raționament pe mai mulți pași și gândire paralelă care permit agenților Gemini să exploreze variante variate, să verifice soluții și să itereze constant înainte de a furniza un răspuns. În practica de învățare prin întărire, mai mulți agenți Gemini propun soluții separate, rulează cod în terminale, testează rezultatele și își ajustează strategiile în funcție de feedback. Această colaborare internă între agenți seamănă oarecum cu o echipă de programatori care discută idei la tablă, doar că aici „discuțiile” sunt execuții de cod și evaluări automate. Versiunea „light” a Deep Think, disponibilă în aplicația Gemini la 249, 99 dolari pe lună, rămâne neschimbată, iar Google consideră aceste avansuri drept pași importanți către capacități mai generale de rezolvare abstractă a problemelor.
Rezultatul ridică întrebări interesante despre cum se îmbină creativitatea, raționamentul abstract și aptitudinea de a genera soluții noi pentru provocări fără precedent. Concursuri precum ICPC solicită nu doar viteză de implementare, ci și ingeniozitate algoritmică, iar aici modelele AI încep să joace un rol semnificativ. În plus, performanțele demonstrează că metodele moderne de antrenament pot produce soluții care combină matematică teoretică (teorema minimax), optimizare numerică (căutare ternară) și programare dinamică într-un flux coerent.
Problema C, strategia bazată pe valori de prioritate și rezultatul de 10 din 12 probleme rezolvate în 677 de minute sunt exemple clare ale modului în care inteligența artificială poate aborda probleme complexe de competiție. Nu este vorba doar de viteză, ci și de capacitatea de a alege ce instrumente algoritmice sunt potrivite în momentul potrivit. Creșterea implicării AI în astfel de competiții pune accent pe colaborarea între oameni și mașini, dar ridică și chestiuni legate de reguli, etică și criteriile prin care evaluăm inovația tehnică. Credeți că finalele ICPC viitoare vor semăna tot mai mult cu un parteneriat între echipe umane și agenți AI?

hm, deci 10 din 12? not bad, dar parca ceva lipsește, vezi să nu…