OpenAI zbulon o1, një model që mund të kontrollojë vetë faktet
(last modified Thu, 12 Sep 2024 19:01:37 GMT )
Shtator 12, 2024 21:01 Europe/Tirane
  • OpenAI zbulon o1, një model që mund të kontrollojë vetë faktet

Prodhuesi i ChatGPT OpenAI ka njoftuar lëshimin e versionit të tij të ardhshëm të produktit: Një model gjenerues i Inteligjencës Artificiale me emrin e koduar Strawberry, i quajtur zyrtarisht OpenAI o1.

Për të qenë më të saktë, o1 është në fakt një koleksion modelesh. Dy janë të disponueshme sot në ChatGPT dhe nëpërmjet API-së së OpenAI: o1-preview dhe o1 mini, një model më i vogël dhe më i lirë. Do të duhet të abonoheni në ChatGPT Plus ose Team për t'i parë ato në klientin ChatGPT; Përdoruesit e Enterprise dhe Edu do të kenë akses në fillim të javës së ardhshme.

Vini re se përvoja e O1 chatbot është mjaft e thjeshtë për momentin; ndryshe nga ChatGPT, o1 nuk mund të shfletojë ueb ose të analizojë skedarët. Është me afat të kufizuar - kufijtë javor janë aktualisht 30 mesazhe për o1-preview dhe 50 për o1-mini. Modelet o1 janë të shtrenjta. Në API, o1-preview është 15 dollarë për 1 milion shenja hyrëse (3 herë kostoja e GPT-4o) dhe 60 dollarë për 1 milion argumente dalëse (4x GPT-4o). (1 milion argumente është e barabartë me rreth 750,000 fjalë.)

OpenAI thotë se planifikon të sjellë akses o1-mini për të gjithë përdoruesit falas të ChatGPT, por nuk ka caktuar një datë lëshimi. o1 shmang disa nga grackat e arsyetimit që zakonisht pengojnë modelet gjeneruese të AI, të paktën sipas OpenAI. Kjo për shkak se o1 mund të kontrollojë në mënyrë efektive veten duke shpenzuar më shumë kohë duke marrë parasysh të gjitha pjesët e një komande ose pyetjeje. OpenAI thotë se o1, me origjinë nga një projekt i brendshëm i kompanisë i njohur si Q*, është veçanërisht i aftë në zgjidhjen e sfidave të matematikës dhe programimit. Por ajo që e bën o1 vetëm me tekst të "ndihet" cilësisht i ndryshëm nga modelet e tjera gjeneruese të AI është aftësia e tij për të "menduar" përpara se t'u përgjigjet pyetjeve.  Kur i jepet kohë shtesë për të "menduar", o1 mund të arsyetojë në mënyrë specifike për një detyrë - duke planifikuar përpara dhe duke kryer një sërë veprimesh për një periudhë të gjatë kohore që e ndihmojnë atë të arrijë në përgjigje. Kjo e bën o1 të përshtatshme për detyra që kërkojnë përputhjen e rezultateve të pyetjeve dhe problemeve të shumta, si zbulimi i emaileve të privilegjuara në kutinë hyrëse të një avokati ose stuhia e ideve për një strategji marketingu produkti. "O1 është trajnuar me të mësuari në mënyrë përforcuese", i cili mëson sistemin përmes shpërblimeve dhe ndëshkimeve, "të "mendojë" përpara se të përgjigjet nëpërmjet një zinxhiri privat mendimi," tha Noam Brown, një shkencëtar kërkimor në OpenAI, në një seri postimesh në X. Ai shtoi se OpenAI përdor një algoritëm të ri të përditësuar dhe një grup të dhënash trajnuese të përshtatura posaçërisht për modelet o1. "Sa më gjatë ai të mendojë, aq më mirë bën në detyrat e arsyetimit."