Mastodawn

Как за один вечер разгрести 36 000 фотографий и почту с 2005 года, руками AI-агента и локальных моделей

Есть задачи, которые не делаются никогда. Не потому что сложные, а потому что объём убивает любое намерение на втором часу. У меня такой задачей был фотоархив: около 36 000 фото и видео, 222 ГБ, копившиеся 20 лет и размазанные вообще везде. Время пришло :)

https://habr.com/ru/articles/1047274/

#AIагент #локальные_модели #дедупликация #распознавание_лиц #диаризация #CLIP #Qwen25VL #MLX #InsightFace #czkawka

Как за один вечер разгрести 36 000 фотографий и почту с 2005 года, руками AI-агента и локальных моделей

Есть задачи, которые не делаются никогда. Не потому что сложные, а потому что объём убивает любое намерение на втором часу. У меня такой задачей был фотоархив: около 36 000 фото и видео, 222 ГБ,...

Хабр

王永帥🍥Jan 31, 2025

#開源分享 Qwen2.5-VL的Cookbooks出來了，包含了一系列用例指南，有計算機使用、空間理解、文件解析、移動代理、OCR、通用識別、影片理解等，可以快速上手

計算機使用，它會截取用戶桌面的螢幕截圖和用戶查詢，然後利用模型對查詢進行解釋

空間理解，展示了Qwen2.5-VL的高級空間定位能力，包括在圖像中進行準確的目標檢測和特定目標定位，展示了模型如何整合視覺和語言理解來解釋複雜的場景等

文件解析，它可以處理任何圖像，並以 HTML、JSON、MD 和 LaTeX 等多種格式輸出

移動代理，示範了如何使用Qwen2.5-VL的代理函數調用功能與行動裝置進行交互，展示了模型根據用戶查詢和視覺上下文生成和執行操作的能力

OCR，從圖像中提取和識別文本，了解它如何在複雜場景下也能準確捕獲和解釋文本內容

專案地址： github.com/QwenLM/Qwen2.5-VL/tree/main/cookbooks

Qwen 聊天： chat.qwenlm.ai

#Qwen25VL #Qwen25VL指南 #Qwen25VLcookbooks