Google a anunțat Gemini 3.1 Flash‑Lite ca fiind „cel mai rapid și cel mai eficient din punct de vedere energetic reprezentant al liniei sale”.
Google prezintă Gemini 3.1 Flash‑Lite – o model AI economic și rapid
Compania Google a anunțat lansarea noii versiuni a modelului Gemini 3.1 Flash‑Lite, care se poziționează ca fiind cea mai accesibilă din linia Gemini în ceea ce privește costul și performanța.
* Optimizare pentru date mari – algoritmul este special conceput pentru procesarea eficientă a seturilor de informații extinse.
* Cost de utilizare – 0,25 $ per milion de tokenuri de intrare și 1,50 $ per milion de tokenuri de ieșire.
Versiunea preliminară este deja disponibilă:
- dezvoltatorilor prin Gemini API în Google AI Studio;
- clienților corporativi – în Vertex AI.
Viteză și calitate
IndicatorGemini 3.1 Flash‑LiteGemini 2.5 FlashTimpul până la primul token 2,5‑ori mai rapid—Rata de generare a răspunsului este cu 45 % mai mare—Calitatea răspunsului similară/supra—
Latența scăzută face modelul deosebit de atractiv pentru aplicații în timp real: de la chatbot-uri până la interfețe interactive, unde reacția trebuie să fie instantanee.
Rezultatele testelor
* Rating ELO pe Arena.ai – 1432 puncte.
* GPQA Diamond – 86,9 %.
* MMMU Pro – 76,8 %.
În aceste teste, Gemini 3.1 Flash‑Lite a depășit modelele de același nivel și chiar unele predecesori mai mari (de exemplu, Gemini 2.5 Flash) în raționament și procesare multimodală.
Flexibilitate și scalabilitate
Dezvoltatorii pot ajusta adâncimea gândirii modelului pentru nevoile lor – un factor important pentru sarcinile cu frecvență ridicată.
Algoritmul este optimizat pentru:
- traducerea volumelor mari de text;
- moderarea conținutului, unde costul are prioritate absolută.
Este potrivit și pentru generarea interfețelor utilizator (UI), tablouri de bord, modelare, precum și pentru realizarea cercetărilor bazate pe întrebări complexe.
În concluzie: Gemini 3.1 Flash‑Lite combină economicitatea, viteza și calitatea fiabilă, făcându-l un instrument valoros atât pentru dezvoltatorii individuali, cât și pentru clienții corporativi care caută soluții AI cu latență scăzută și performanță ridicată.
Comentarii (0)
Împărtășește-ți opinia — te rugăm să fii politicos și să rămâi la subiect.
Autentifică-te pentru a comenta