Как за один вечер разгрести 36 000 фотографий и почту с 2005 года, руками AI-агента и локальных моделей

Есть задачи, которые не делаются никогда. Не потому что сложные, а потому что объём убивает любое намерение на втором часу. У меня такой задачей был фотоархив: около 36 000 фото и видео, 222 ГБ, копившиеся 20 лет и размазанные вообще везде. Время пришло :)

https://habr.com/ru/articles/1047274/

#AIагент #локальные_модели #дедупликация #распознавание_лиц #диаризация #CLIP #Qwen25VL #MLX #InsightFace #czkawka

Как за один вечер разгрести 36 000 фотографий и почту с 2005 года, руками AI-агента и локальных моделей

Есть задачи, которые не делаются никогда. Не потому что сложные, а потому что объём убивает любое намерение на втором часу. У меня такой задачей был фотоархив: около 36 000 фото и видео, 222 ГБ,...

Хабр

#開源分享 Qwen2.5-VL的Cookbooks出來了,包含了一系列用例指南,有計算機使用、空間理解、文件解析、移動代理、OCR、通用識別、影片理解等,可以快速上手

計算機使用,它會截取用戶桌面的螢幕截圖和用戶查詢,然後利用模型對查詢進行解釋

空間理解,展示了Qwen2.5-VL的高級空間定位能力,包括在圖像中進行準確的目標檢測和特定目標定位,展示了模型如何整合視覺和語言理解來解釋複雜的場景等

文件解析,它可以處理任何圖像,並以 HTML、JSON、MD 和 LaTeX 等多種格式輸出

移動代理,示範了如何使用Qwen2.5-VL的代理函數調用功能與行動裝置進行交互,展示了模型根據用戶查詢和視覺上下文生成和執行操作的能力

OCR,從圖像中提取和識別文本,了解它如何在複雜場景下也能準確捕獲和解釋文本內容

專案地址: github.com/QwenLM/Qwen2.5-VL/tree/main/cookbooks

Qwen 聊天: chat.qwenlm.ai

#Qwen25VL #Qwen25VL指南 #Qwen25VLcookbooks