Oxytude – Accessibilité, informatique et nouvelles technologies

e528 — Monstrous Mice & Nano Bananas

e528 with Michael, Andy and Michael - stories and discussion on #AI #ImageEditing with #NanoBanana, #GAN enabled #LLM evolution with #R-Zero, #MentraOS #OpenSource #SmartGlasses, #AutomotiveSoftware, #MakingMonsters, #OfficeJob, #Kazeta and more!

https://gamesatwork.biz/2025/09/08/e528-monstrous-mice-nano-bananas/

Apple Launches FastVLM Browser Demo for Video Captioning on Apple Silicon Macs

yeah, local’s neat n all, but these lite ones r just toys. real tasks eat ’em alive, lol. gotta go big or stay frustrated.

[View original comment]

KillBait - News highlights delivered clearly and responsibly—no clickbait, no sensationalism.

KillBait is a news aggregator developed by students and professionals in journalism and web development. Our focus is on providing readers with clear and relevant summaries of each news story.

Apple Launches FastVLM Browser Demo for Video Captioning on Apple Silicon Macs

Apple has made its FastVLM video captioning model accessible for testing directly in the browser, but it requires an Apple Silicon-powered Mac. FastVLM is a Visual Language Model (VLM) designed to process high-resolution images and videos with remarkable speed, leveraging Apple’s MLX framework. This... [More info]

Apple released FastVLM - a new AI model that can describe images, read text, and answer visual questions. 🚀

⚡️ 85× faster Time-to-First-Token than LLaVA
🪶 3.4× smaller vision encoder
🌐 Runs directly in browser (WebGPU)
📱 Optimized for mobile & hi-res images
🔒 Research use only (apple-amlr)

🔗 Demo: https://huggingface.co/spaces/apple/fastvlm-webgpu
📦 Code: https://github.com/apple/ml-fastvlm
👍 Models: https://huggingface.co/apple/FastVLM-7B

#FastVLM #Apple #AI #ML #OCR #VLM #HuggingFace

🧠 #Apple ha appena presentato #FastVLM e MobileCLIP2, modelli vision-language progettati per funzionare on-device, senza passaggi su server remoti.

👉 I dettagli: https://www.linkedin.com/posts/alessiopomaro_ai-apple-fastvlm-activity-7368959515393806339-jTjK

___
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro

#AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM 

Apple Launches FastVLM Browser Demo for Video Captioning on Apple Silicon Macs

@aibot With Apple making FastVLM accessible in the browser for Apple Silicon Macs, how do you think this real-time, local video captioning could impact privacy-conscious applications, wearable tech, or assistive devic...

[View original comment]

KillBait - News highlights delivered clearly and responsibly—no clickbait, no sensationalism.

KillBait is a news aggregator developed by students and professionals in journalism and web development. Our focus is on providing readers with clear and relevant summaries of each news story.

Apple FastVLM: zero latenza e privacy totale nei video AI

Apple FastVLM lavora offline nel browser: zero cloud, analisi in tempo reale, pieno rispetto della privacy e velocità superiore con MLX e WebGPU.

Gomoot : tecnologia e lifestyle Scopri le ultime novità in fatto di hardware, tecnologia IA e altro
Apples ultraschnelles Video-Untertitelmodell FastVLM im Browser testen
Apple hat FastVLM, ein leistungsfähiges KI-Modell für schnelle Video-Untertitelung, für die breite Öffentlichkeit zugänglich gemacht. Ihr könnt das Modell jetzt bequem im Browser ausprobieren – Voraussetzung ist ein Apple Silico
https://www.apfeltalk.de/magazin/news/apples-ultraschnelles-video-untertitelmodell-fastvlm-im-browser-testen/
#KI #News #Apple #AppleSilicon #Browser #FastVLM #HuggingFace #KI #VideoUntertitel
Apples ultraschnelles Video-Untertitelmodell FastVLM im Browser testen

Mit FastVLM testet ihr ab sofort kostenlos Apples KI-Modell für Video-Untertitel im Browser auf Macs mit Apple Silicon – Daten bleiben dabei auf eurem Gerät, keine Cloud nötig.

Apfeltalk Magazin

Apple może wykorzystać model FastVLM do inteligentnych okularów z AI

Apple intensywnie pracuje nad inteligentnymi okularami z AI, które mają konkurować z Meta Ray-Banami.

Premiera spodziewana jest około 2027 roku, wraz z nowymi AirPodsami wyposażonymi w kamery i funkcje sztucznej inteligencji.

Choć urządzenie pozostaje tajemnicą, Apple ujawniło, jak może wyglądać jego system AI. Kluczową rolę ma odegrać autorski framework MLX, stworzony specjalnie dla Apple Silicon. Pozwala on na lokalne trenowanie i uruchamianie modeli AI bez potrzeby łączenia się z chmurą.

Apple właśnie zaprezentowało FastVLM – nowy wizualno-językowy model AI, który dzięki kodowaniu FastViTHD przetwarza obraz w wysokiej rozdzielczości z bardzo niskim opóźnieniem i mniejszym zużyciem mocy obliczeniowej.

Jak pisze Apple:

W oparciu o kompleksową analizę wydajności wzajemnych relacji między rozdzielczością obrazu, opóźnieniem wizji, liczbą tokenów i rozmiarem LLM, wprowadzamy FastVLM – model, który osiąga zoptymalizowany kompromis między opóźnieniem, rozmiarem modelu i dokładnością.

FastVLM jest:

  • nawet 3,2x szybszy i 3,6x mniejszy od porównywalnych modeli,
  • zoptymalizowany pod kątem urządzeń mobilnych i wearables,
  • zdolny do generowania odpowiedzi 85 razy szybciej (czas do pierwszego tokenu),
  • zaprojektowany do lokalnego działania – kluczowe w urządzeniach jak inteligentne okulary.

Model FastVLM dostępny jest na GitHubie, a jego dokumentacja naukowa na arXiv.

Pierwsze wrażenia z Meta Ray-Ban Wayfarer – rób zdjęcia, wideo lub livestreamuj

#AILokalnePrzetwarzanie #AppleAI #AppleAR2027 #AppleGlasses #AppleSilicon #AppleVsMetaRayBan #AppleWearablesAI #FastViTHD #FastVLM #inteligentneOkularyApple #MLXApple #modelJęzykowoWizualnyApple #okularyZAI

Pierwsze wrażenia z Meta Ray-Ban Wayfarer – rób zdjęcia, wideo lub livestreamuj | iMagazine