Nvidia a prezentat Nemotron 3 Super 120B — un LLM deschis cu o creștere de cinci ori în viteză pentru agenți AI.

Nvidia a prezentat Nemotron 3 Super 120B — un LLM deschis cu o creștere de cinci ori în viteză pentru agenți AI.

7 hardware

Noua model Nvidia – Nemotron 3 Super

Nvidia a anunțat lansarea Nemotron 3 Super, un model AI deschis de tip Mixture‑of‑Experts (MoE).

* 120 miliarde de parametri totali, dintre care 12 miliarde activi.
* Destinat pentru IA agenți – sisteme în care mai mulți „agenti” interacționează între ei și cu lumea exterioară.

Arhitectură
Modelul utilizează o abordare hibridă Mamba‑Transformer (combinație de straturi Mamba și elemente Transformer).

În Nemotron 3 Super se aplică pentru prima dată paradigma LatentMoE, straturile Multi‑Token Prediction și antrenamentul prealabil prin protocolul NVFP4. Potrivit Nvidia, acest stack îmbunătățește precizia și accelerează inferența.

Performanță
* Lățime de bandă – până la 5× mai rapid decât versiunea precedentă Nemotron Super.
* Precizie – până la 2× mai mare.
* Suport pentru fereastra contextuală de 1 milion de tokeni permite agenților să păstreze starea completă a fluxului de lucru, reducând riscul devierii de la obiectiv.

Aplicații practice
Nemotron 3 Super este potrivit pentru sarcini complexe în sisteme multi‑agent:

SarcinăExemplu de utilizare
Generare și depanare a codului fără fragmentarea pe documenteScriere automată și verificare a programelor mari
Analiză financiarăÎncorporarea a mii de pagini de rapoarte în memoria modelului

Învățare
Modelul a fost antrenat pe date sintetice create cu ajutorul modelelor logice de gândire. Nvidia dezvăluie metodologia completă:

* peste 10 trilioane de tokeni înainte și după antrenament;
* 15 medii pentru învățarea prin întărire;
* rețete de evaluare.

Cercetătorii pot folosi platforma Nvidia NeMo pentru ajustări suplimentare sau pentru a crea propriile versiuni ale modelului.

Detalii tehnice
* Suport NVFP4 pe arhitectura Nvidia Blackwell.
* Reducerea cerințelor de memorie și accelerarea inferenței de patru ori față de FP8 pe Nvidia Hopper fără pierderi de precizie.

Disponibilitate
Modelul este deja disponibil:

* Pe build.nvidia.com, Hugging Face, OpenRouter și Perplexity.
* Parteneri cloud: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* Ca microserviciu Nvidia NIM, permițând implementarea locală sau în cloud.

Nemotron 3 Super deschide noi posibilități pentru IA agenți, combinând precizie ridicată, scalabilitate și flexibilitate de configurare.

Comentarii (0)

Împărtășește-ți opinia — te rugăm să fii politicos și să rămâi la subiect.

Încă nu există comentarii. Lasă un comentariu și împărtășește-ți opinia!

Pentru a lăsa un comentariu, autentifică-te.

Autentifică-te pentru a comenta