DeepSeek ka marrë Openai të pushkatuar

Kanë kaluar pak më shumë se një javë që kur Deepseek ngriti botën e AI. Futja e modelit të tij me peshë të hapur-të trajnuar me padurim në një pjesë të çipave të specializuar informatikë që drejtuesit e industrisë së energjisë-vendosin valët e shokut brenda Openai. Jo vetëm që punonjësit pretenduan të shohin aludime se Deepseek kishte “distiluar në mënyrë të papërshtatshme” modelet e Openai për të krijuar të vetën, por suksesi i fillimit e kishte Wall Street të pyeste nëse kompani si Openai ishin duke u mbivlerësuar në mënyrë të egër në llogaritjen.

“Deepseek R1 është momenti Sputnik i AI,” shkroi Marc Andreessen, një nga shpikësit më me ndikim dhe provokues të Silicon Valley, në x.

Si përgjigje, Openai po përgatitet të nisë një model të ri sot, përpara orarit të tij të planifikuar fillimisht. Modeli, O3-Mini, do të debutojë si në API ashtu edhe në bisedë. Burimet thonë se ka arsyetim të nivelit O1 me shpejtësi 4-niveli. Me fjalë të tjera, është e shpejtë, e lirë, e zgjuar dhe e dizajnuar për të shtypur Deepseek. (Zëdhënësi i Openai, Niko Felix thotë se puna në O3-Mini filloi shumë kohë para debutimit të Deepseek dhe qëllimi ishte të fillonte deri në fund të janarit).

Momenti ka galvanizuar stafin e Openai. Brenda kompanisë, ekziston një ndjenjë që – veçanërisht ndërsa Deepseek mbizotëron bisedën – Openai duhet të bëhet më efikas ose të rrezikojë të bjerë pas konkurrencës së saj më të re.

Një pjesë e çështjes buron nga origjina e Openai si një organizatë kërkimore jofitimprurëse përpara se të bëhet një central elektrik që kërkon fitim. Një luftë e vazhdueshme e pushtetit midis hulumtimit dhe grupeve të produkteve, pretendojnë punonjësit, ka rezultuar në një përçarje midis ekipeve që punojnë në arsyetim të përparuar dhe atyre që punojnë në chat. (Zëdhënësi i Openai, Niko Felix thotë se kjo është “e pasaktë” dhe vëren se drejtuesit e këtyre ekipeve, Zyrtari Kryesor i Produkteve Kevin Weil dhe Zyrtari Kryesor i Kërkimit Mark Chen, “Takohen çdo javë dhe punojnë ngushtë për t’u përafruar me përparësitë e produktit dhe kërkimit.”)

Disa brenda Openai duan që kompania të ndërtojë një produkt të unifikuar të bisedës, një model që mund të tregojë nëse një pyetje kërkon arsyetim të përparuar. Deri më tani, kjo nuk ka ndodhur. Përkundrazi, një menu drop-down në ChatGPT i shtyn përdoruesit të vendosin nëse duan të përdorin GPT-4O (“E shkëlqyeshme për shumicën e pyetjeve”) ose O1 (“përdor arsyetimin e përparuar”).

Disa punonjës pretendojnë se ndërsa Chat sjell pjesën e luanit të të ardhurave të Openai, O1 merr më shumë vëmendje – dhe burimet e llogaritjes – nga udhëheqja. “Udhëheqja nuk interesohet për bisedën,” thotë një ish -punonjës që ka punuar në bisedë (e keni menduar). “Të gjithë duan të punojnë në O1 sepse është seksi, por baza e kodit nuk u ndërtua për eksperimente, kështu që nuk ka asnjë moment.” Ish -punonjësi kërkoi të mbetet anonim, duke përmendur një marrëveshje të mos zbulimit.

Openai kaloi vite duke eksperimentuar me mësimin e përforcimit për të rregulluar modelin që përfundimisht u bë sistemi i përparuar i arsyetimit të quajtur O1. (Mësimi i përforcimit është një proces që trajnon modelet e AI me një sistem gjobash dhe shpërblimesh.) Deepseek ndërtoi punën e të mësuarit të përforcimit që Openai kishte pionier për të krijuar sistemin e tij të përparuar të arsyetimit, të quajtur R1. “Ata përfituan të dinë që të mësuarit e përforcimit, zbatohej në modelet e gjuhës, funksionon,” thotë një ish -studiues i Openai i cili nuk është i autorizuar të flasë publikisht për kompaninë.

“Mësimi i përforcimit [DeepSeek] A është e ngjashme me atë që bëmë në Openai, “thotë një tjetër ish -studiues i Openai,” por ata e bënë atë me të dhëna më të mira dhe pirg më të pastër. “

Punonjësit e Openai thonë se hulumtimet që hynë në O1 u bënë në një bazë kodesh, të quajtur pirg “Berry”, të ndërtuara për shpejtësi. “Kishte ndërprerje tregtie-ashpërsi eksperimentale për xhiros,” thotë një ish-punonjës me njohuri të drejtpërdrejta të situatës.

Këto ndërprerje tregtare kishin kuptim për O1, i cili në thelb ishte një eksperiment i madh, kufizimet e bazës së kodit pavarësisht. Ata nuk kishin aq kuptim për chat, një produkt i përdorur nga miliona përdorues që ishte ndërtuar në një pirg tjetër, më të besueshëm. Kur O1 filloi dhe u bë një produkt, çarjet filluan të shfaqen në proceset e brendshme të Openai. “Ishte si,” Pse po e bëjmë këtë në bazën e kodeve eksperimentale, a nuk duhet ta bëjmë këtë në bazën e kodeve kryesore të hulumtimit të produktit? “” Shpjegon punonjësi. “Kishte një reagim të madh për atë nga brenda.”