Donde vivo comparten información de distribución de agua en X/Facebook desde años.🙄

Empecé a extraer estos datos desde Nitter. Luego publican imágenes (con una lista de colonias o zonas de distribución)! Supongo que publicar TEXTO sería demasiado complicado: imagino que copian y pegan la lista antes de publicarla diario...❓

Me doy cuenta que Tesseract llega a sus limites para extraer texto. En mi compu ollama + minicpm-v 👌, pero terminaré pagando OpenAI o Anthropic en linea.😕

#oaxaca #mexico

Me resigno a pagar OpenAI, o otro LLM, porque no tengo un servidor lo suficiente potente donde correr MiniCPM-V con Ollama.

Este modelo es "ligero" pero se traga 4GB de memoria de todos modos, y corre mucho mejor si tiene acceso a un GPU. En este contexto son más económicas las APIs de OpenAI o Anthropic.

Creo que para extraer datos de una imagen pequeña, será gratis o cerca de 0 de todos modos, pero perfiero no depender de servicios externos. 🤔

#ollama #minicpm