Gemma 4, 스마트폰에서 돌아가는 에이전트 오픈 모델 출시

Google DeepMind가 공개한 Gemma 4는 스마트폰과 라즈베리파이에서 자율 에이전트를 실행하는 오픈 모델 패밀리입니다. Apache 2.0 라이선스로 상업적 활용이 자유롭습니다.

https://aisparkup.com/posts/10798

LiteRT, 온디바이스 AI의 새로운 표준

Google LiteRT, TFLite 대비 GPU 1.4배·NPU 100배 빠른 온디바이스 AI 프레임워크. PyTorch 직접 변환과 크로스플랫폼 통합으로 모바일 AI 배포를 단순화합니다.

https://aisparkup.com/posts/8800

Tomorrow I'll see whether I manage to convert a #PyTorch model to #LiteRT and then further to LiteRT for microcontroller. so far I always used Tensorflow/Keras but the model we are working on was created with PyTorch.

Meet #Google’s new accelerator for #LiteRT - Qualcomm AI Engine Direct (QNN) - designed to enhance on-device AI performance for Qualcomm-powered #Android devices running Snapdragon 8 SoCs.

The results❓
⚡ Up to 100× faster than CPU execution
⚡ Up to 10× faster than GPU

Learn more: https://bit.ly/4atd1go

#InfoQ #AI #LLMs #Mobile

Chuyển đổi safetensor/GGUF sang LiteRT cho LLM locally trên điện thoại. Người dùng gặp trở khăn với Edge Gallery yêu cầu model_LR/Task/LITERLM. Cần giải pháp transfer format hoặc appᚱ l який hỗ trợ mô hình trên S25. Chi tiết: [link]
Tags: #AI #LiteRT #Ghg4 #Safetensor #Android #LocalLLM #Megalopy #ThậpNguoidnij

(498 ký tự)

https://www.reddit.com/r/LocalLLaMA/comments/1oekn2v/any_way_of_converting_safetensor_and_gguf_to/

For all those interested in our #VirtualComputer stack for #robotics on #Quest3 we have just upgraded to #Qemu 7.2.0 and have full support for camera #passthrough #XR #Linux and #GPU acceleration (tested with #LiteRT #AI)