Un test publicat de MakeUseOf a pus la încercare trei dintre cele mai cunoscute asistențe AI pentru programare: Claude, ChatGPT și Gemini. Toate au primit același fișier JavaScript defect, construit cu trei probleme distincte, iar rezultatul a arătat că viteza nu este neapărat același lucru cu acuratețea.
Potrivit MakeUseOf, scenariul de test a inclus o problemă de scoping, o eroare de tip async race și o atribuire bazată pe index care ducea la o ordonare nedeterministă. Sunt genul de erori care pot părea minore la prima vedere, dar care pot face ca un script să se comporte imprevizibil și să îngreuneze depanarea.
Concluziile testului MakeUseOf
Gemini a fost descris ca având un răspuns intermediar ca viteză, venind după Claude și înaintea ChatGPT. MakeUseOf notează că a identificat corect o problemă de scoping și a explicat blocarea la nivel de bloc, dar a ratat condiția de cursă legată de întârzierile aleatorii din cod. În consecință, soluția propusă ar fi părut corectă la o primă vedere, însă nu ar fi rezolvat complet problema.
Publicația mai spune că, la unele rulări, Gemini a detectat eroarea async, dar tot a omis problema de atribuire bazată pe index. Cu alte cuvinte, rezultatul nu a fost stabil de la o încercare la alta.
De ce ChatGPT a fost aproape, dar nu perfect
ChatGPT a avut nevoie de mai mult timp, însă MakeUseOf spune că a identificat toate cele trei erori: problema de scoping, lipsa unui await care făcea ca jurnalele finale să apară prea devreme și ordonarea nedeterministă cauzată de întârzierile aleatorii. Explicația a fost descrisă ca fiind metodică și ușor de urmărit pentru un începător.
Totuși, articolul observă că unele dintre opțiunile de remediere propuse de ChatGPT ar fi tratat efectul, nu cauza. Într-un caz, soluția sugerată ar fi presupus că o altă parte a codului se va alinia automat, ceea ce MakeUseOf consideră o abordare care amână problema, nu o elimină complet.
De ce Claude a ieșit în față
Claude a fost modelul care, potrivit MakeUseOf, a oferit cea mai completă soluție și a făcut-o cel mai repede. Publicația spune că acesta a identificat cele trei probleme și le-a explicat metodic, apoi a aplicat corecțiile. Spre deosebire de celelalte două modele, Claude nu s-a limitat la o diagnoză parțială.
Articolul menționează și că testul a fost făcut cu Claude Chat, nu cu Claude Code, iar după răspuns Claude ar fi recomandat trecerea la Claude Code. Chiar și așa, concluzia MakeUseOf a fost că Claude a fost mai consecvent și mai complet în depanare decât Gemini și ChatGPT.
Ce înseamnă asta pentru dezvoltatori
Concluzia testului nu este că un singur instrument rezolvă orice problemă, ci că utilitatea unui model AI depinde de tipul de bug. MakeUseOf notează că Gemini rămâne util în multe scenarii, iar ChatGPT poate prinde majoritatea erorilor, însă Claude a părut mai bun atunci când era nevoie de urmărirea atentă a relației cauză-efect într-un flux de execuție.
Pentru verificări rapide, oricare dintre cele trei poate ajuta. Dar atunci când codul conține erori care induc în eroare sau care depind de ordine de execuție, testul publicat de MakeUseOf sugerează că Claude poate fi opțiunea mai sigură pentru a ajunge la cauza reală, nu doar la o corecție de suprafață.
Concluzie: în acest experiment, Claude a fost singurul care a livrat o diagnoză completă și coerentă a celor trei erori din JavaScript, în timp ce ChatGPT și Gemini au rămas la soluții parțiale.
























