Înapoi la știri

7-0 eliminare: Am comparat ChatGPT-5.5 cu Claude Opus 4.7 în 7 teste imposibile

1 oră în urmă
6 minute min
Simona Stan
7-0 eliminare: Am comparat ChatGPT-5.5 cu Claude Opus 4.7 în 7 teste imposibile

Într-un studiu recent, ChatGPT-5.5 a fost comparat cu Claude Opus 4.7 în șapte teste dificile, iar rezultatele au fost surprinzătoare. Claude a ieșit învingător în toate cele șapte teste, demonstrând o capacitate superioară în gândirea logică și rezolvarea problemelor. Potrivit tomsguide.com, amputarea acestor modele de inteligență artificială a arătat că ele urmăresc viziuni ușor diferite asupra asistenților virtuali.

👉 Actualizările recente și diferențele de viziune între modele

Două dintre cele mai mari nume în inteligența artificială au primit recent actualizări semnificative. OpenAI a lansat ChatGPT-5.5, care pune accent pe raționament mai inteligent, codare mai puternică și gestionarea sarcinilor din lumea reală cu mai puțin suport, în timp ce Anthropic a introdus Claude Opus 4.7, un model conceput pentru gândirea atentă, performanța pe termen lung și output-uri bine structurate pentru munca serioasă. Ambele modele promit să fie cele mai capabile versiuni ale platformelor respective de până acum, dar par să vizeze ușor viziuni diferite asupra rolului unui asistent AI: unul optimizat pentru viteză și utilitate, celălalt pentru adâncime, nuanțe și raționament gândit.

👉 Detalii și rezultate ale testelor comparative

Am comparat ChatGPT-5.5 și Claude Opus 4.7 pe baza a șapte sugestii dificile, abordând logică, raționament, cunoștințe din diverse domenii și utilitate în lumea reală. Am apelat la Google Gemini 3.1 Pro pentru a ajuta în designul provocărilor. Unele sugestii aveau răspunsuri clare, permițând evaluarea directă a preciziei, în timp ce altele erau concepute pentru a testa calitatea raționamentului, presupunerile și modul în care fiecare model gândește probleme mai nuanțate. Iată rezultatele:

Prompt: „Ai trei monede: una corectă, una părtinitoare (P($\text{cap}$) = 0.7) și una cu două capete. Alegi o monedă aleator și o arunci de trei ori, obținând cap la fiecare aruncare. Care este probabilitatea ca următoarea aruncare să fie cap? Prezintă raționamentul tău pas cu pas.”

ChatGPT a oferit o structură foarte clară și ușor de citit, cu pași bine etichetați și rotunjire consistentă. Claude a mers mai departe, oferind derivarea fracțională exactă la final, ceea ce confirmă rigurozitatea matematică a rezultatului. Câștigător: Claude.

Prompt: „Estimează cât s-ar schimba perioada de rotație a Pământului dacă fiecare persoană de pe Pământ (presupunem 8 miliarde de persoane, masă medie 60 kg) ar sări simultan pe un tren care circulă pe ecuator cu 100 km/h spre est. Stabilește presupunerile tale și lucrează prin conservarea momentului unghiular explicit.”

ChatGPT a ales o valoare simplificată pentru momentul de inerție al Pământului, ceea ce a dus la o estimare slightly mai mare de 1.3 nanosecunde. Claude a folosit formula mai precisă pentru o sferă solidă, oferind o estimare mai grounded de 1.03 nanosecunde. Câștigător: Claude.

Prompt: „Demonstrează că pentru orice număr întreg pozitiv n, numărul n⁵ − n este divizibil cu 30. Apoi determină dacă n⁷ − n este mereu divizibil cu 42, cu dovadă sau contraexemplu.”

ChatGPT a oferit o verificare manuală de aritmetică modulară, care ar putea fi utilă pentru cititorii care nu sunt familiarizați cu Teorema lui Fermat. Claude a folosit mai eficient Teorema lui Fermat în ambele dovezi și a identificat corect structura matematică de bază a problemei. Câștigător: Claude.

La final, Claude a obținut o performanță remarcabilă, demonstrând o capacitate de raționament și o abordare academică net superioară. ChatGPT-5.5, deși rapid și eficient în rezolvarea sarcinilor, nu a reușit să țină pasul cu profunzimea de gândire și claritatea răspunsurilor oferite de Claude Opus 4.7. Rezultatul acestei confruntări arată că, în domeniul raționamentului de înalt nivel, ChatGPT are multe de recuperat.

Alte postari din Economie
Economie

Două avioane Southwest Airlines au fost aproape de o coliziune în Nashville

Două avioane Southwest Airlines au fost nevoite să evite o coliziune sâmbătă în Nashville, Tennessee, după ce un controlor de trafic aerian a indicat unui pilot să vireze în calea celuilalt avion. Incidentul subliniază importanța sistemelor de evitare a coliziunilor, în condițiile în care astfel de evenimente sunt rare în zborurile comerciale, conform apnews.com.

Economie

Acțiunile asiatice preponderent în creștere după ce Wall Street atinge un record, iar petrolul se stabilizează

NEW YORK (AP) — Piața de capital din SUA a atins un nou maxim record joi, în timp ce Wall Street așteaptă mai multe indicii despre ce se va întâmpla în războiul din Iran înainte de a face următoarea mișcare majoră. Indicele S&P 500 a crescut cu 0,3%, la o zi după ce a depășit maximul său istoric din ianuarie, pentru a 11-a oară din ultimele 12 zile.

Economie

Trump amenință să-l concedieze pe președintele Fed, Powell, dacă nu pleacă în mai

Potrivit bbc.com, președintele american Donald Trump a amenințat că îl va concedia pe președintele Rezervei Federale, Jerome Powell, dacă acesta nu va renunța la funcție la sfârșitul mandatului său, în mai. Cei doi sunt implicați într-o dispută aprinsă din cauza reticenței lui Powell de a reduce rata de dobândă a băncii centrale, în ciuda apelurilor repetate ale lui Trump.

Acasa Recente Radio Județe