Dallimi midis një modeli konvencional dhe një arsyetimi është i ngjashëm me dy llojet e të menduarit të përshkruar nga ekonomisti fitues i çmimit Nobel Michael Kahneman në librin e tij të vitit 2011 Duke menduar shpejt dhe të ngadaltë: Sistemi i shpejtë dhe instinktiv i të menduarit-1 dhe më ngadalë mendimi më i diskutueshëm i sistemit-2.
Lloji i modelit që e bëri të mundur Chatgpt, i njohur si një model i madh gjuhësor ose LLM, prodhon përgjigje të menjëhershme për një shpejtë duke kërkuar një rrjet të madh nervor. Këto rezultate mund të jenë jashtëzakonisht të zgjuara dhe koherente, por mund të mos përgjigjen në pyetje që kërkojnë arsyetim hap pas hapi, përfshirë aritmetikën e thjeshtë.
Një LLM mund të detyrohet të imitojë arsyetimin diskutues nëse udhëzohet të dalë me një plan që duhet të ndjekë më pas. Megjithatë, ky mashtrim nuk është gjithmonë i besueshëm dhe modelet zakonisht luftojnë për të zgjidhur problemet që kërkojnë planifikim të gjerë, të kujdesshëm. Openai, Google, dhe tani Antropic janë të gjithë duke përdorur një metodë të mësimit të makinerisë të njohur si mësimi i përforcimit për të marrë modelet e tyre të fundit për të mësuar të gjenerojnë arsyetim që tregon drejt përgjigjeve të sakta. Kjo kërkon mbledhjen e të dhënave shtesë të trajnimit nga njerëzit për zgjidhjen e problemeve specifike.
Penn thotë se mënyra e arsyetimit të Claude mori të dhëna shtesë për aplikacionet e biznesit, përfshirë kodin e shkrimit dhe rregullimit, përdorimin e kompjuterave dhe përgjigjen e pyetjeve komplekse ligjore. “Gjërat për të cilat kemi bërë përmirësime janë … subjekte teknike ose lëndë që kërkojnë arsyetim të gjatë,” thotë Penn. “Ajo që ne kemi nga klientët tanë është shumë interes për vendosjen e modeleve tona në ngarkesat e tyre aktuale të punës.”
Antropic thotë se Claude 3.7 është veçanërisht i mirë në zgjidhjen e problemeve të kodimit që kërkojnë arsyetim hap pas hapi, duke tejkaluar O1 të Openai në disa standarde si SWE-Bench. Kompania sot po lëshon një mjet të ri, të quajtur Claude Code, i krijuar posaçërisht për këtë lloj kodimi të ndihmuar nga AI.
“Modeli tashmë është i mirë në kodim,” thotë Penn. Por “Mendimi shtesë do të ishte i mirë për rastet që mund të kërkojnë planifikim shumë kompleks – të themi se po shikoni një bazë kodesh jashtëzakonisht të madhe për një kompani.”