Pasak „TechCrunch“, naujieji „OpenAI“ modeliai prieštarauja tendencijai, pagal kurią kiekvienas naujas modelis buvo vis geriau patobulintas, tačiau šiuo atveju „OpenAI“ juda klaidinga kryptimi.
Remiantis „OpenAI“ vidiniais bandymais, o3 ir o4-mini yra linkę į klysti dažniau nei senesni modeliai, įskaitant o1, o1-mini ir net o3-mini.
Naujausi modeliai padarė dvigubai daugiau klaidų nei ankstesni
Atliekant bendrovės tikslumo testą, o3 modelis padarė 33 proc. klaidų. Tai maždaug dvigubai daugiau nei ankstesniuose „OpenAI“ modeliuose.
Tuo tarpu modelis o4-mini pateikė dar blogesnį rezultatą – 48 proc. klaidų.
Dar blogiau tai, kad bendrovės ekspertai, atrodo, iki galo nesupranta problemų priežasčių. Jų techninėje ataskaitoje teigiama, kad „norint suprasti šių klaidų priežastis, reikia atlikti daugiau tyrimų“.
Kviečiame atrasti naują tv3.lt turinį! Nuo šiol portale jūsų laukia kasdien nauji testai – išbandykite savo žinias ir smagiai praleiskite laiką.



