u/Complex_Medium_7125

David Turturean de la MIT rezolva o problema Erdos folosing ChatGPT 5.5

"Nu mă gândisem niciodată că voi spune asta! Dar iată: am rezolvat prima mea problemă Erdős! Am făcut acest lucru folosind ChatGPT-5.5-Pro.

Problemele Erdős sunt o colecție de câteva sute de întrebări matematice deschise, formulate de-a lungul vieții sale de Paul Erdős, unul dintre cei mai prolifici matematicieni ai secolului XX, care obișnuia să ofere recompense bănești celor care le rezolvau. Multe dintre ele sună înșelător de simplu - adesea despre numere întregi, mulțimi sau grafuri - dar au rezistat încercărilor de rezolvare timp de decenii, devenind un fel de etalon al ingeniozității matematice. Asta se schimbă, cu AI transformativ la orizont.

În ultimele luni, eu m-am jucat cu diverse forme de scaffold-uri peste ChatGPT pentru a obține soluții la probleme matematice deschise. Pentru o vreme, am reușit să obțin soluții parțiale la diverse probleme Erdős - însă nimic care să meargă până la capăt.

Apoi, GPT-5.5 a apărut, și a fost clar imediat că e o bestie matematică. În ciuda faptului că, pe foaie, performează similar cu GPT-5.4 pe benchmark-urile matematice efectuate de către companiile AI, dacă te-ai jucat cu ambele, știi că GPT-5.5 nu este atât de mult un increment, cât mai mult un pas mare deasupra: 5.5 se mișcă de 3 ori mai repede și totuși oferă răspunsuri mai bune decât GPT-5.4, făcând acum tractabile o mulțime de probleme Erdős, într-un timp și număr de pași rezonabil. Ce vreau să zic e că de multe ori se spune că companiile își laudă prea mult capabilitățile modelelor: pentru GPT-5.5, cred că nu s-au lăudat destul capabilitățile.

În ziua în care s-a lansat GPT-5.5, după ce am rulat Pro timp de aproximativ 6 ore la rând, de-a lungul a vreo 20 de ture secvențiale, am reușit să obțin o soluție pentru problema Erdős #330, o problemă care se ocupă de baze aditive: anume, de existența unei baze minimale care marginal nu satisface o proprietate pe care multe baze o satisfac în rest.

Soluția implică multă 'contabilitate'; ea valorifică, de asemenea, proprietățile modulare ale numerelor prime pentru a construi baza necesară.

Pentru a-l cita pe Daniel Larsen (coleg MIT) din comentariul său: „Ideea este foarte simplă, dar scrierea tuturor detaliilor ar fi extrem de obositoare pentru un om”.

Deoarece soluția este obositoare de parcurs pentru orice om, fie și el expert, eram îngrijorat că nu suficienți experți vor avea timp să citească soluția și să o valideze. Apoi, Allen Hart de la Universitatea Warwick a formalizat soluția în Lean 4. Acest lucru reduce verificarea problemei la a scrie corect un enunț pentru ea în Lean; apoi, atâta timp cât codul pentru soluție se compilează fără erori, soluția este corectă! Și așa a fost.

Până în 2025, comunitatea matematică rezolva vreo 5-10 probleme Erdős pe an, din cele ~600 rămase nerezolvate. De când a apărut ChatGPT-5.5, cred că eu însumi am rezolvat tot vreo 5-10, în vreo 10 zile, însă este nevoie ca soluțiile să fie verificate mai îndeaproape sau, în unele cazuri, să termin eu a le scrie. Această problemă, #330, e prima la care am găsit o soluție și tot prima la care s-a efectuat o verificare robustă.

Pentru viitorul foarte apropiat și previzibil, păstrez soluția mea ca manuscris în Overleaf. Voi obține mai mult feedback din partea comunității, voi descoperi care este cea mai bună modalitate de a prezenta rezultate generate de AI, apoi o voi posta pe arXiV: ar trebui să prezint rezultatul în forma finală, succintă - sau ar ajuta dacă aș urmări pașii prin care modelul a ajuns la rezultat, sau să detaliez cum funcționează scaffold-ul meu?

Aceasta nu este, de asemenea, singura problemă legată de baze aditive pe care cred că am obținut-o de la Pro - o soluție la #870 este în așteptarea verificării formale! Așa că poate le voi prezenta pe ambele în aceeași lucrare, dacă lucrurile merg bine.

În final, mulțumesc lui Thomas Bloom (de la Universitatea din Manchester), care întreține site-ul Erdős Problems și care a gestionat din plin avalanșa de soluții nou propuse pe forum în aceste ultime luni!

Trăim într-o explozie de inteligență din plin."

https://www.facebook.com/DavidTurtureanC/posts/pfbid02CFrjy2ZjdLbPQWQQaJej8VXbJtdb74pKWh1jNcJ2oqoKD6GPhJA8tAeMwGqD6Ru3l

reddit.com
u/Complex_Medium_7125 — 2 days ago