Nvidia a prezentat Nemotron 3 Super 120B — un LLM deschis cu o creștere de cinci ori în viteză pentru agenți AI.
Noua model Nvidia – Nemotron 3 Super
Nvidia a anunțat lansarea Nemotron 3 Super, un model AI deschis de tip Mixture‑of‑Experts (MoE).
* 120 miliarde de parametri totali, dintre care 12 miliarde activi.
* Destinat pentru IA agenți – sisteme în care mai mulți „agenti” interacționează între ei și cu lumea exterioară.
Arhitectură
Modelul utilizează o abordare hibridă Mamba‑Transformer (combinație de straturi Mamba și elemente Transformer).
În Nemotron 3 Super se aplică pentru prima dată paradigma LatentMoE, straturile Multi‑Token Prediction și antrenamentul prealabil prin protocolul NVFP4. Potrivit Nvidia, acest stack îmbunătățește precizia și accelerează inferența.
Performanță
* Lățime de bandă – până la 5× mai rapid decât versiunea precedentă Nemotron Super.
* Precizie – până la 2× mai mare.
* Suport pentru fereastra contextuală de 1 milion de tokeni permite agenților să păstreze starea completă a fluxului de lucru, reducând riscul devierii de la obiectiv.
Aplicații practice
Nemotron 3 Super este potrivit pentru sarcini complexe în sisteme multi‑agent:
| Sarcină | Exemplu de utilizare |
|---|---|
| Generare și depanare a codului fără fragmentarea pe documente | Scriere automată și verificare a programelor mari |
| Analiză financiară | Încorporarea a mii de pagini de rapoarte în memoria modelului |
Învățare
Modelul a fost antrenat pe date sintetice create cu ajutorul modelelor logice de gândire. Nvidia dezvăluie metodologia completă:
* peste 10 trilioane de tokeni înainte și după antrenament;
* 15 medii pentru învățarea prin întărire;
* rețete de evaluare.
Cercetătorii pot folosi platforma Nvidia NeMo pentru ajustări suplimentare sau pentru a crea propriile versiuni ale modelului.
Detalii tehnice
* Suport NVFP4 pe arhitectura Nvidia Blackwell.
* Reducerea cerințelor de memorie și accelerarea inferenței de patru ori față de FP8 pe Nvidia Hopper fără pierderi de precizie.
Disponibilitate
Modelul este deja disponibil:
* Pe build.nvidia.com, Hugging Face, OpenRouter și Perplexity.
* Parteneri cloud: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* Ca microserviciu Nvidia NIM, permițând implementarea locală sau în cloud.
Nemotron 3 Super deschide noi posibilități pentru IA agenți, combinând precizie ridicată, scalabilitate și flexibilitate de configurare.
Comentarii (0)
Împărtășește-ți opinia — te rugăm să fii politicos și să rămâi la subiect.
Autentifică-te pentru a comenta