Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B

TL;DR: В этой статье мы возьмем новейшую Gemma 4 31B, которая в оригинале весит 62 ГБ, и заставим её работать и выгружаться на бесплатном Kaggle с лимитом диска в 57 ГБ. Спойлер: нам придется удалять исходники прямо во время работы Python-скрипта.

https://habr.com/ru/articles/1018682/

#Gemma_4 #LLM #MLOps #Kaggle #Hugging_Face #bitsandbytes #Квантование #NF4 #Transformers #Python

Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B

TL;DR: В этой статье мы возьмем новейшую Gemma 4 31B, которая в оригинале весит 62 ГБ, и заставим её работать и выгружаться на бесплатном Kaggle с лимитом диска в 57 ГБ. Спойлер: нам придется удалять...

Хабр

구글, 파라미터당 지능 극대화한 오픈 모델 Gemma 4 출시

Gemma 4는 Gemini 3의 연구 기술을 기반으로 설계되어 파라미터당 지능(Intelligence-per-parameter)을 극대화한 구글의 차세대 오픈 모델 시리즈다.

🔗 원문 보기

구글, 파라미터당 지능 극대화한 오픈 모델 Gemma 4 출시

Gemma 4는 Gemini 3의 연구 기술을 기반으로 설계되어 파라미터당 지능(Intelligence-per-parameter)을 극대화한 구글의 차세대 오픈 모델 시리즈다.

Ruby-News | 루비 AI 뉴스

Gemma 4: 안드로이드 로컬 에이전트 AI의 새로운 표준

복잡한 추론과 자율적 도구 호출 기능을 갖춘 차세대 오픈 모델 Gemma 4를 통해 안드로이드 로컬 에이전트 AI 시대를 열었다.

🔗 원문 보기

Gemma 4: 안드로이드 로컬 에이전트 AI의 새로운 표준

복잡한 추론과 자율적 도구 호출 기능을 갖춘 차세대 오픈 모델 Gemma 4를 통해 안드로이드 로컬 에이전트 AI 시대를 열었다.

Ruby-News | 루비 AI 뉴스
Pixel 11、次世代「Gemini Nano 4(Gemma 4)」搭載へ

Google、「Gemini Nano」の次世代モデル「Gemini Nano 4(Gemma 4)」を発表すると共に、今年 2026 年後半に登場する次世代 Google Pixel デバイスへの搭載を明らかに。次世代 Google Pixel デバイス「Pixel 11」シリーズでは、次世代モデル「Gemini Nano 4」が初期搭載。「Gemini Nano 4」では、劇的な効率化が最大の特徴です。従来の「Gemini Nano」と比較して、推論速度は最大 4 倍に向上し、バッテリー消費量も最大 60% 削減。

Jetstream