Gemma 4, 스마트폰에서 돌아가는 에이전트 오픈 모델 출시
Google DeepMind가 공개한 Gemma 4는 스마트폰과 라즈베리파이에서 자율 에이전트를 실행하는 오픈 모델 패밀리입니다. Apache 2.0 라이선스로 상업적 활용이 자유롭습니다.Gemma 4, 스마트폰에서 돌아가는 에이전트 오픈 모델 출시
Google DeepMind가 공개한 Gemma 4는 스마트폰과 라즈베리파이에서 자율 에이전트를 실행하는 오픈 모델 패밀리입니다. Apache 2.0 라이선스로 상업적 활용이 자유롭습니다.LiteRT, 온디바이스 AI의 새로운 표준
Google LiteRT, TFLite 대비 GPU 1.4배·NPU 100배 빠른 온디바이스 AI 프레임워크. PyTorch 직접 변환과 크로스플랫폼 통합으로 모바일 AI 배포를 단순화합니다.Meet #Google’s new accelerator for #LiteRT - Qualcomm AI Engine Direct (QNN) - designed to enhance on-device AI performance for Qualcomm-powered #Android devices running Snapdragon 8 SoCs.
The results❓
⚡ Up to 100× faster than CPU execution
⚡ Up to 10× faster than GPU
Learn more: https://bit.ly/4atd1go
Chuyển đổi safetensor/GGUF sang LiteRT cho LLM locally trên điện thoại. Người dùng gặp trở khăn với Edge Gallery yêu cầu model_LR/Task/LITERLM. Cần giải pháp transfer format hoặc appᚱ l який hỗ trợ mô hình trên S25. Chi tiết: [link]
Tags: #AI #LiteRT #Ghg4 #Safetensor #Android #LocalLLM #Megalopy #ThậpNguoidnij
(498 ký tự)
https://www.reddit.com/r/LocalLLaMA/comments/1oekn2v/any_way_of_converting_safetensor_and_gguf_to/