Test CEO-Bench: tylko 3 modele AI nie zbankrutowały po 500 dniach prowadzenia firmy
Naukowcy z Uniwersytetu Princeton stworzyli test CEO-Bench, w którym modele AI zarządzają fikcyjną firmą programistyczną przez 500 symulowanych dni. Większość modeli zbankrutowała, a prosty algorytm oparty na regułach — bez żadnej sztucznej inteligencji — pokonał niemal wszystkie testowane modele AI. Tylko trzy modele AI zakończyły test z kapitałem wyższym niż na starcie.
Komentarze
Jeszcze nikt nie skomentował — napisz pierwszy 👇
Brak komentarzy. Bądź pierwszy!