Nvidia pregătește lansarea unui nou procesor dedicat calculului de inferență, menit să permită modelelor de inteligență artificială să răspundă mai rapid la solicitări. Anunțul a fost făcut în contextul conferinței GTC din martie, potrivit Mediafax, care citează informații publicate de Reuters.
Noua platformă urmează să fie prezentată la conferința dezvoltatorilor GTC din San Jose și va include un cip proiectat de startup-ul Groq. Soluția vizează îmbunătățirea performanței în sarcini unde viteza de răspuns este esențială, precum generarea de cod sau aplicațiile conversaționale.
Parteneriate strategice și competiție în zona de inferență
Conform informațiilor citate, OpenAI nu este pe deplin satisfăcută de viteza actualelor cipuri Nvidia pentru anumite tipuri de probleme, inclusiv dezvoltarea de software. Noul hardware ar putea acoperi aproximativ 10% din necesarul de calcul inferențial al companiei.
Anterior, OpenAI a purtat discuții cu Cerebras și Groq pentru a obține cipuri mai rapide dedicate inferenței. Între timp, Nvidia a semnat un acord de licențiere evaluat la 20 de miliarde de dolari cu Groq, încheind astfel negocierile.
În septembrie, Nvidia a anunțat o investiție de până la 100 de miliarde de dolari în OpenAI, obținând o participație în companie și acces la cipuri avansate.
Mișcarea reflectă competiția tot mai intensă din zona infrastructurii AI, unde optimizarea inferenței devine la fel de importantă precum puterea de antrenare a modelelor.
Sursa foto: Daily Sabah

