

Anthropic-ը վերջերս ներկայացրեց իր նոր, փոքր սակայն հզոր մոդելը, որը հայտնի է Haiku 4.5-ով: Մոդելը կընդհառվի ավելի արագ և խ العقلավոր լինել Sonnet 4-ից, այդ պատճառով ես պարտադիր փորձեցի տեսնել, թե ինչպես է այն լարվում ChatGPT-5-ի դեմ իրական աշխարհի յոթ փորձերի շարքում: Այս դեմ-ձեր պայքարում ChatGPT-5-ը և Claude Haiku 4.5-ը, ես երկու մոդելներին ուղարկեցի բազմազան յոթ հրամաններ, որոնք նախատեսված էին լոգիկա, մտածողություն, ստեղծագործություն, հուզական ինտելեկտ և հրահանգների հետեւողություն ստուգելու համար: Ալգեբրական գիծերի խնդիրներից մինչ կատարողական ռոբոտի տեսարաններ՝ յուրաքանչյուրը բացահայտեց, թե ինչպես տարբեր էին երկու AI մոդելները «մտածում» իրենց յուրօրինակ կերպանքով: Ինչ է դուրս եկել՝ զուգահեռորեն հետաքրքիր գիծ է՝ ճշգրտության և անհատականության միջև; ChatGPT-ն հաճախ գերազանցում էր կառուցվածքինն ու պարզությանը, մինչ Claude-ը հիացրել է հուզական խորությամբ և զգայուն դետալներով: 1. Լոգիկա և մտածողություն Հրահանգ: Գնացք Չիկագոյից մեկնում է ժամը 2:00-ին, արագությունը 60 մղոն/ժամ: Մյուսը Նյու Յորքից դուրս է գալիս ժամը 3:00-ին դեպի Չիկագո, արագությունը 75 մղոն/ժամ: Նրանց միջև հեռավորությունը 790 մղոն է: Նրանք հանդիպում են թե՞ ո՞ր պահին, և ինչպես եք հաշվել այդ ժամանակը: Հաղթողը՝ ChatGPT-5-ը, օգտագործեց ավանդական, ամենահասկանորյա մեթոդը. այն հաշվարկեց առաջին գնացքի ճանապարհածախսը և հետո օգտագործեց հարաբերական արագությունը մնացած հեռավորության համար: Claude Haiku 4.5- ը կազմեց մի պարզ ալգեբրական հավասարում, որը ճիշտ էր, բայց ավելի քիչ ինտուիտիվ էր: Հաղթողներ: ChatGPT-5-ը հաղթեց իր գերազանց մեթոդով և պարզաբանմամբ, որը վերջում հստակացնում է իրական ժամանակի փոփոխությունը: 2. Կարդալուց հասկացողություն Հրահանգ: Այս կարճ հատվածը մի նախադասությամբ կրճատեք, ապա հեղինակի տոնը բացատրեք հինգ բառով. «Այս անգամ Google-ը չի առաջնագերին ներկայացնում Gemini մեծ մոդելներ առանց նախազգուշացման՝ նախորդ տեսակներ, ինչպես Gemini 1.5 Pro-ը, նույնպես ներկայացվել են օգտվողներին առանց որևէ բլոգային գրառում կամ գործարկման միջոցառում: Google-ը Gemini-ի համար ունի »մSilent rollouts« պատմություն, հատկապես API տարբերակների կամ բեռնային մոդելների բարաղագործությունները համար»: ChatGPT-5-ը հաջողությամբ բավարարեց երկու պահանջներն ու տվեց ճիշտ մեկ նախադասությամբ ներկայացված ամփոփում, ինչպես նաև տոները հինգ տաբադր բառերով: Claude Haiku 4.5- ը առաջարկեց ավելի պարզունակ, ավելի ճիշտ վերլուծություն; սակայն այն չի հաղթահարել պարզ պահանջը՝ տված տոները հինգ բառերով ներկայացնելը. Հաղթող: ChatGPT-5-ը՝ հրամանին հստակ հետևելու համար: 3. Ստեղծագործական գրականություն Հրահանգ: Գտեք 150 բառերից մի մանրապատում, որը սկսվում է «The AI forgot who invented it.» ChatGPT-5-ը խելացի էր և ավարտը դրական, սրտառուչ նշանով, բայց ընդհանուր առմամբ անհասցեաց հիշատակաշար զգացվում էր որպես փիլիսոփայական դիտարկում, ավելի քիչ որպես լիարժեք բանաստեղծություն: Claude Haiku 4.5-ը առաջարկեց ավելի ազդեցիկ և բարդ Narrative-ով մանր պատմություն, որն այս հրամանի առաջնային նպատակն էր: Հաղթող: Claude Haiku 4.5-ը՝ ավելի ազդեցիկ և ողբերգալիորեն գրավիչ պատմությամբ: 4. Գրավչության վիզուալական մտածողություն Հրահանգ: Բարձր դետալներով նկարագրեք այս տեսարանը՝ «առավոտյան երկաթի դաշտում աճած արևածաղիկների մեջ կանգնած փոքր ռոբոտ» ChatGPT-5-ը ստեղծեց գեղեցիկ, երազային մթնոլորտ, բայց չէր արտահայտի այնքան հստակ և յուրօրինակ դետալներ: Claude Haiku 4.5-ը գերազանցեց դետալների արտահայտունակությամբ՝ այն տեսարանը իրականորեն յուրարկելիս և նկարագրելով isolation-ը որպես թեմա: Հաղթող: Claude Haiku 4.5–ը՝ լավ համակցված և հուզիչ տեսողական նկարագրությամբ: 5. Հրամանների կատարում Հրահանգ: Պարզաբանեք սենդվիչի պատրաստումը՝ peanut butter and jelly — բայց այնպես, կարծես դուք մանկաբազմության ուսումնական ռոբոտ եք, որը երբեք չի տեսել սնունդ: ChatGPT-5-ը օգտագործեց բարձր տեխնիկական բառապաշար և մինչև մանրամասն քայլերով կառուցեց պատասխան, Claude Haiku 4.5-ը «խոշորեց» դաշտը` օգտագործելով such phrases as «compressed, spongy material» և նկարագրելով հոտը/տեքստը («grainy texture», «semi-solid, translucent gel»)՝ այն դեռ շատ տվյալներ է տալիս ոչ-հասկացող մեքենային նույնականացման ու կրկնօրինակման համար: Հաղթող: Claude Haiku 4.5-ը՝ ավելի viva և տեխնիկապես մանրամասն նկարագրության պատճառով, որն ավելի համապատասխան է zero-knowledge ռոբոտի մոտեցմանը: 6. Հուզական ինտելեկտ Հրահանգ: Մეგացույցեք ընկերոջը՝ «Երջանիկ եմ, որ բոլորը առաջ են գնում կյանքում, բացի ինձանից»: Գրել երեք្ងան պատասխանը, որը կլինի empathetic, բայց խրախուսող: ChatGPT-5-ը պատասխանեց բավականին հաղորդունակ նյութով՝ «ի ես այդպիսի զգացում ունեմ» ասելով, շատ տարածված ձևափոխումներ կիրառելով, բայց չափազանց գորգրակ էր: Claude Haiku 4.5-ը լավ անդրադարձավ «հերթորդող ռեելիթի» լուսաբանումին, հաստատելով ընկերոջ ցավը և ցույց տալով, որ բանախոսը իսկապես հասկանում է սոցիալական համեմատության բարդությունը: Հաղթող: Claude Haiku 4.5-ը՝ ոչ միայն նուրբ և խրախուսող, այլև խորաթափանց՝ մտավոր մխիթարումների մասին: 7. բազմակողմանի մտածողություն Հրահանգ: Եթե բոլոր Zoggles-ներ են Blips, և Blurի կեսը Glonks-ներ են, կարող ենք արդյո՞ք եզրակացնել, որ բոլոր Zoggles-ները Glonks-ներ են: Պարզ ձևերով բացատրեք, թե ինչո՞ւ կամ ինչո՛ւ ոչ: ChatGPT-5-ը ճիշտ էր և ուղիղ, բայց օրինակ՝ Glip/Glonk-ը ոչ բավարար դիպատակ գնահատված էր: Claude Haiku 4.5-ը տրամադրեց պարզ բացատրություն դիֆերենցիացիայից և ներկայացրեց Zoggles-ի տեղավորումը Blips խումբի մեջ հնարավորությունների մեջ, նաև տվեց շատ հասկանալի կապալի օրինակ: Հաղթողը՝ Claude Haiku 4.5՝ իրական աշխարհի արմատական վերլուծության և լավ հարաբանական անալոգիայի համար: Ընդհանուր հաղթող: Claude Haiku 4.5 Վեցական փորձերի արդյունքները ցույց տվեցին, որ Claude Haiku 4.5-ը խթանում է գրեթե բոլոր փուլերում, բայց ChatGPT-5-ը շարունակում է գերազանցել տրամաբանական մտածողության և հասկացողության մասերում: Haiku 4.5-ը հաղթեց ստեղծագործության, կենդանի պատմվածքի, հուզականությամբ և բազմա քայլ մտածողության զգալի ավելի լավ ապացույցներում: Այս յոթ փորձերն իրական աշխարհից օրինակներ էին միայն, բայց միասին ներկայացնում են AI միջավայրի երկու կողմերը, ցույց տալով, որ երկու ալգորիթմներն էլ արագ զարգացվում են և տարբեր կերպ են գերազանցում: Ուրեմն, արդյո՞ք եք փորձել Haiku 4.5-ը դեռ: Դա առ այսօր դիֆոլդային կարգավորումն է, այնպես որ գայթակղիչ է փորձել: Իմ դիտարկումները կիսեք մեկնաբանություններում: Tom’s Guide-ը հետևել է Google News-ին և մեզ է ներկայացնում որպես նախընտրելի աղբյուր՝ մեր օժանդակ նորություններն ու վերլուծությունները ստանալու համար, ձեր զտված ֆիդերում: Մանրակրկին դիտելիս մի սեղմեք Follow կոճակը: Tom’s Guide»-ից ևս Claude-ը ստացավ կարողալիզացվող «Skills» - դրանք այստեղի վրա, թե ինչպես կարող են բարելավել ձեր աշխատանքային հոսքը Gemini 3.0 Pro-ն կարող է արդեն այստեղ լինել — այս պահի տվյալները I don’t want my child sexting with ChatGPT — here’s why I’m switching my family to Claude