Mastodawn

남정현 Sep 16, 2025

OpenAI의 gpt-oss 모델에 이어, RAG (검색 증강 생성)에서 매우 중요한 역할을 하는 임베딩 모델을 Google에서 새롭게 오픈 소스로 공개헀습니다.

EmbeddingGemma라는 이름의 임베딩 모델로, 고성능 하드웨어 없이도 RAG를 구현할 수 있으면서, 한국어, 중국어, 일본어를 포함한 수많은 언어를 지원하도록 개발된 모델이어서 의미가 있습니다.

그래서 재빨리 File-based App과 Semantic Kernel용으로 개발된 sqlite-vec 확장 모듈을 붙여서 프로토타입 코드를 만들어봤는데, 잘 작동하는 것 같네요! :-D

#embeddinggemma #RAG #AI #SemanticKernel #Google

https://forum.dotnetdev.kr/t/google-embeddinggemma-ollama-sqlite-vec-rag/13754

Google EmbeddingGemma + Ollama + sqlite-vec으로 간단한 로컬 RAG 구현하기

OpenAI의 gpt-oss 모델에 이어, RAG (검색 증강 생성)에서 매우 중요한 역할을 하는 임베딩 모델을 Google에서 새롭게 오픈 소스로 공개헀습니다. EmbeddingGemma라는 이름의 임베딩 모델로, 고성능 하드웨어 없이도 RAG를 구현할 수 있으면서, 한국어, 중국어, 일본어를 포함한 수많은 언어를 지원하도록 개발된 모델이어서 의미가 있습니다. 그래서 재빨리 File-based App과 Semantic Kernel용으로 개발된 sqlite-vec 확장 모듈을 붙여서 프로토타입 코드를 만들어봤는데, 잘 작동하는 것 같네요! 😃 참고로, | 기호나 query: 같은 라벨은 엄격한 의미의 문법은 아니고 EmbeddingGemma가 동작하는 방식에 맞춰주기 위한 부분이라고 합니다. (https://ai.google.dev/gemma/docs/embeddinggemma/inference-embeddinggemma-with-sentence-transformer...

닷넷데브

AI Sparkup Sep 11, 2025

구글 EmbeddingGemma로 완전 로컬 AI 문서 검색 시스템 만들기

Google의 새로운 EmbeddingGemma 모델로 인터넷 연결 없이 완전 로컬에서 동작하는 AI 문서 검색 시스템을 구축하는 실용적인 가이드입니다. 프라이버시를 중시하는 개발자와 기업을 위한 단계별 튜토리얼을 제공합니다.

https://aisparkup.com/posts/4809

AI Sparkup Sep 9, 2025

스마트폰에서 돌아가는 구글 AI, EmbeddingGemma가 개발 판도를 바꾼다

구글이 공개한 혁신적인 임베딩 모델 EmbeddingGemma의 특징과 실무 활용법을 소개합니다. 스마트폰에서도 실행 가능한 308M 파라미터 모델로 고품질 AI 기능을 저비용으로 구현하는 방법을 다룹니다.

https://aisparkup.com/posts/4761

Guillaume Laforge Sep 8, 2025

In-browser #AI semantic search 🧠 with Google's new #EmbeddingGemma embedding model and #huggingface #Transformersjs

Gain enhanced privacy, zero server costs, low-latency results directly on your device.👇

https://glaforge.dev/posts/2025/09/08/in-browser-semantic-search-with-embeddinggemma/

In-browser semantic search with EmbeddingGemma

Tech blog of Guillaume Laforge, with articles on generative AI, LLMs, cloud computing, microservices architecture, serverless solutions, Java and Apache Groovy programming

PPC Land Sep 5, 2025

Google launches EmbeddingGemma for on-device AI embedding tasks: Google releases EmbeddingGemma, a 308M parameter multilingual embedding model optimized for mobile devices with sub-200MB RAM usage and 15ms inference times. https://ppc.land/google-launches-embeddinggemma-for-on-device-ai-embedding-tasks/ #Google #AI #EmbeddingGemma #MachineLearning #MobileTech

Google launches EmbeddingGemma for on-device AI embedding tasks

Google releases EmbeddingGemma, a 308M parameter multilingual embedding model optimized for mobile devices with sub-200MB RAM usage and 15ms inference times.

PPC Land