NVIDIA ka fituar firmën sintetike të të dhënave Gretel për nëntë figura, sipas dy personave me njohuri të drejtpërdrejtë të marrëveshjes.
Pricemimi i blerjes tejkalon vlerësimin më të fundit të Gretel prej 320 milion dollarë, thonë burimet, megjithëse kushtet e sakta të blerjes mbeten të panjohura. Gretel dhe ekipi i saj prej afro 80 punonjës do të palosen në Nvidia, ku teknologjia e saj do të vendoset si pjesë e grupit në rritje të CHIP Giant të shërbimeve të AI të bazuara në cloud, për zhvilluesit.
Blerja vjen pasi NVIDIA ka qenë duke shpërndarë mjete sintetike të gjenerimit të të dhënave, në mënyrë që zhvilluesit të mund të trajnojnë modelet e tyre të AI dhe t’i rregullojnë ato për aplikacione specifike. Në teori, të dhënat sintetike mund të krijojnë një furnizim të afërm të pafund të të dhënave të trajnimit të AI dhe të ndihmojnë në zgjidhjen e problemit të mungesës së të dhënave që ka dalë mbi industrinë e AI pasi që Chatgpt shkoi në rrjedhën e parë në vitin 2022-megjithëse ekspertët thonë se përdorimi i të dhënave sintetike në AI gjeneruese vjen me rreziqet e veta.
Një zëdhënës i Nvidia nuk pranoi të komentojë.
Gretel u themelua në vitin 2019 nga Alex Watson, John Myers dhe Ali Golshan, i cili gjithashtu shërben si CEO. Fillimi ofron një platformë sintetike të të dhënave dhe një grup të API për zhvilluesit që duan të ndërtojnë modele gjeneruese të AI, por nuk kanë qasje në të dhëna të mjaftueshme trajnimi ose kanë shqetësime të intimitetit rreth përdorimit të të dhënave të njerëzve të vërtetë. Gretel nuk ndërton dhe licencon modelet e veta të AI-së kufitare, por akordon mirë modelet ekzistuese të burimit të hapur për të shtuar karakteristika diferenciale të intimitetit dhe sigurisë, pastaj paketon ato së bashku për t’i shitur ato. Kompania mblodhi më shumë se 67 milion dollarë në fonde të kapitalit të sipërmarrjes para blerjes, sipas PitchBook.
Një zëdhënës i Gretel gjithashtu nuk pranoi të komentojë.
Për dallim nga të dhënat e krijuara nga njeriu ose në botën reale, të dhënat sintetike janë të krijuara nga kompjuteri dhe të dizajnuara për të imituar të dhënat e botës reale. Përkrahësit thonë se kjo bën që gjenerimi i të dhënave të kërkohet për të ndërtuar modele AI më të shkallëzueshme, më pak intensive të punës dhe më të arritshme për zhvilluesit e AI më të vegjël ose më pak të buruar. Mbrojtja e intimitetit është një tjetër pikë kryesore e shitjes së të dhënave sintetike, duke e bërë atë një mundësi tërheqëse për ofruesit e kujdesit shëndetësor, bankat dhe agjensitë qeveritare.
NVIDIA tashmë ka ofruar mjete sintetike të të dhënave për zhvilluesit për vite me rradhë. Në vitin 2022 ajo nisi Replicator Omniverse, i cili u jep zhvilluesve mundësinë për të gjeneruar të dhëna 3D me porosi, të sakta fizikisht, sintetike 3D për të trajnuar rrjetet nervore. Qershorin e kaluar, NVIDIA filloi të nxjerrë një familje të modeleve të hapura të AI që gjenerojnë të dhëna trainimi sintetik për zhvilluesit që i përdorin në ndërtimin ose LLM-të e rregullimit të mirë. Të quajtur Nemotron-4 340B, këto mini-modele mund të përdoren nga zhvilluesit për të nxitur të dhëna sintetike për LLM-të e tyre në të gjithë “kujdesin shëndetësor, financat, prodhimin, shitjen me pakicë dhe çdo industri tjetër”.
Gjatë prezantimit të tij kryesor në Konferencën Vjetore të Zhvilluesve të NVIDIA këtë të martë, bashkëpunëtori i NVIDIA dhe shefi ekzekutiv Jensen Huang foli për sfidat me të cilat përballet industria në shkallëzimin e shpejtë të AI në një mënyrë me kosto efektive.
“Ka tre probleme në të cilat përqendrohemi,” tha ai. “Një, si e zgjidhni problemin e të dhënave? Si dhe ku i krijoni të dhënat e nevojshme për të trajnuar AI? Dy, cila është arkitektura e modelit? Dhe pastaj tre, cilat janë ligjet e shkallëzimit?” Huang vazhdoi të përshkruaj se si kompania tani po përdor gjenerimin e të dhënave sintetike në platformat e saj robotike.