O3-Mini i Openai është një model më i dobët AI që mban ritmin me Deepseek

Openai është duke bërë një version më të vogël, më efikas të modelit të tij më të zgjuar të inteligjencës artificiale të disponueshme falas, pasi kërkon të përgjigjet në hype dhe entuziazmin që tundet rreth një oferte të re me burim të hapur nga fillimi kinez i AI Deepseek.

Wired më parë raportoi se Openai po përgatiste modelin e ri, të quajtur O3-Mini, për lëshim më 31 janar. Studiuesit e kompanisë kanë punuar jashtë orarit për ta përgatitur atë për kohën e parë, sipas burimeve që flisnin për gjendjen e anonimitetit.

O3-Mini, i cili Openai u përlot në dhjetor, është një version më i vogël i modelit që përmban aftësitë më të përparuara të arsyetimit të AI të çdo oferte Openai deri më sot. Modeli mund të thyejë probleme të vështira në pjesët përbërëse në mënyrë që të kuptojë se si t’i zgjidhë ato më mirë.

“Ky model i fuqishëm dhe i shpejtë përparon kufijtë e asaj që modelet e vogla mund të arrijnë,” tha kompania në një postim në blog duke njoftuar disponueshmërinë e O3-Mini.

Openai po e vë O3-MINI në dispozicion për të gjithë plus, ekipin dhe përdoruesit pro të Chatgpt. Përdoruesit e versionit falas të ChatGPT gjithashtu do të jenë në gjendje të provojnë O3-MINI por nuk do të jenë në gjendje të dërgojnë sa më shumë pyetje, thotë kompania.

Openai me sa duket ka përdorur studentë të doktoratës për të ndihmuar në trajnimin e një modeli të ri për ca kohë. Disa javë më parë, kompania filloi të rekrutojë studentë të shkencave kompjuterike të doktoraturës me 100 dollarë në orë për një “bashkëpunim kërkimor” që do të “përfshijë punën në modele të paarritura”, sipas një emaili të shikuar nga Wired.

Openai gjithashtu duket se ka rekrutuar studentë të doktoratës me ekspertizë në fusha të tjera përmes një kompanie të quajtur Mercor që përdor rregullisht për të gjetur stafin për trajnime modeli. Një e fundit Postimi i Punës Nga Mercor në LinkedIn thotë: “Qëllimi i përgjithshëm i këtij projekti në të cilin mund të bëheni pjesë është të krijoni pyetje sfiduese të kodimit shkencor të dizajnuara për të testuar aftësitë e modeleve të mëdha të gjuhëve në gjenerimin e kodit për zgjidhjen e problemeve realiste të kërkimit shkencor.”

Postimi i punës vazhdon të japë një problem shembulli që është jashtëzakonisht i ngjashëm me një problem në një pikë referimi të quajtur SciCode që është krijuar për të provuar aftësinë e një modeli të madh të gjuhës për të zgjidhur probleme komplekse shkencore.

Lajmi vjen ndërsa R1 i Deepseek vazhdon të ulë industrinë e teknologjisë amerikane. Fakti që një model i tillë i fuqishëm mund të lëshohet për falas bën presion në Google dhe Antropic për të ulur çmimet e tyre.

Openai është veçanërisht i etur për të demonstruar se mbetet në pararojë të zhvillimit dhe komercializimit të AI, sipas burimeve brenda kompanisë.

Modeli i disponueshëm lirisht i Deepseek përfshin risi që e bënë atë më efikas për të trajnuar dhe shërbyer. Kompania duket se e ka zhvilluar atë duke përdorur shumë më pak burime sesa Openai dhe kompani të tjera amerikane që aktualisht ndërtojnë modele AI Frontier, megjithëse detajet e sakta të shpenzimeve të Deepseek mbeten të panjohura. Openai thotë se beson R1 mund të ketë përfshirë rezultatin nga modelet e tij në trajnimin e tij.

Ke një këshillë?

A jeni një punonjës aktual apo ish në Openai? Ne do të donim të dëgjonim nga ju. Duke përdorur një telefon ose kompjuter jo të punës, kontaktoni Knight në Will_Knight@wired.com ose në sinjal përmes emrit të tij të përdoruesit WAK01.

Modeli më i ri i Openai mund të mos e tejkalojë R1 për sa i përket çmimit, por tregon se kompania do ta bëjë efikasitetin pjesë të fokusit të saj përpara. Openai gjithashtu thotë se modeli është veçanërisht i fortë në matematikë, shkencë dhe kodim.

Kompania thotë se modeli i fundit do të përfshijë gjithashtu veçori të reja, duke përfshirë aftësinë për të hyrë në kërkime në internet, funksione të thirrjeve nga kodi i një përdoruesi dhe për të ndryshuar midis niveleve të ndryshme të arsyetimit që tregtojnë shpejtësinë për aftësitë e zgjidhjes së problemeve.

Rritja e papritur e Deepseek gjithashtu ka ngritur pyetje në lidhje me strategjinë e qeverisë amerikane për të frenuar rritjen e Kinës në AI. Dy administratat e kaluara të SHBA kanë prezantuar një numër sanksionesh për të frenuar aftësinë e Kinës për të hyrë në çipat më të përparuar të Nvidia që përdoren zakonisht për të ndërtuar modele të përparme të AI. Deepseek përshkroi disa lloje të patate të skuqura Nvidia në hulumtimin e saj, por mbetet e paqartë se çfarë është përdorur saktësisht.