It’s finished, at least partially. These are my web scraping microservices for Brazilian public exams (“concursos”). They are simple: they scrape three sources and return a JSON-like API response with more readable information.
Fell free to see in REPO: https://github.com/Dum2601/lista-concurso.git

#python
#webscrapping
#programming

Tạo ứng dụng Idealo nội bộ cho doanh nghiệp – bắt đầu từ đâu? Doanh nghiệp cần công cụ so sánh giá từ các nền tảng thương mại điện tử để phân tích cạnh tranh. Cần tư vấn giải pháp (API, web scraping) và hỗ trợ từ chuyên gia có kinh nghiệm. #KinhDoanh #CNNT #Technology #API #WebScrapping

https://www.reddit.com/r/programming/comments/1qsyp7s/quiero_hacer_un_idealo_interno_para_mi_empresa/

AlterLab - API cào dữ liệu web kết hợp proxy cá nhân (BYOP), tự động điều chỉnh cấp độ và phục hồi lỗi. Miễn phí 1000 lượt/tháng, giá linh hoạt, không khóa dịch vụ. #Scraping #API #WebScrapping #AltLab #TiếtKiệmChiPhí

https://www.reddit.com/r/SideProject/comments/1pvu87u/i_built_a_web_scraping_api_that_doesnt_lock_you/

Tôi đang quản lý nhiều scraper chạy theo lịch trình khác nhau. Mỗi khi chỉnh sửa parser, dữ liệu lại lệch nhau dù tên trường giống nhau. Tôi nên dùng kho lưu trữ cấu trúc dành riêng cho web scraping như hệ thống ống dẫn dữ liệu hay quản lý thủ công bằng version tags? #WebScrapping #QuảnLýDữLiệu #KhuônDữLiệu

https://www.reddit.com/r/selfhosted/comments/1oux7gd/whats_your_strategy_for_keeping_multiple/

Tôi đã xây dựng uAPI để chuyển đổi các trang web hỗn loạn thành hợp đồng JSON nhất quán mà bạn có thể tin cậy. uAPI cung cấp giao diện đọc ổn định cho web, trả về-envelope JSON nhất quán cho bất kỳ trang công khai nào được phép. #uAPI #JSON #HợpĐống #TrìnhDuyệt #WebScrapping #DataEngineering #MachineLearning #TrìnhXửLýDữLiệu #HọcMáy #CôngNghệ #TinHọc #TrangWeb #DữLiệu #KhoaHọcDữLiệu

https://www.reddit.com/r/SideProject/comments/1oo3yah/i_built_uapi_to_turn_chaotic_pages_into/

Inteligencia Artificial y el negocio de resolver "Capthas Cognitivos" para el Cibercrimen.

Blog personal de Chema Alonso (CDO Telefónica, 0xWord, MyPublicInbox, Singularity Hackers) sobre seguridad, hacking, hackers y Cálico Electrónico.

El lado del mal - Tu WebSite con Smart Honeypots contra el WebScrapping usando AI Labyrinth de Cloudflare https://www.elladodelmal.com/2025/03/tu-website-con-smart-honeypots-contra.html #cloudflare #WebScrapping #AI #IA #GenAI #Hardening #honeypots
Tu WebSite con Smart Honeypots contra el WebScrapping usando AI Labyrinth de Cloudflare

Blog personal de Chema Alonso (CDO Telefónica, 0xWord, MyPublicInbox, Singularity Hackers) sobre seguridad, hacking, hackers y Cálico Electrónico.

El lado del mal - Captcha Cognitivo de Twitter / X de Sentar Personas Correctamente: Probando con ChatGPT & Gemini https://www.elladodelmal.com/2025/02/captcha-cognitivo-de-twitter-x-de.html #Captcha #Cognitive #Twitter #X #ciberseguridad #Webscrapping #AI #IA #ChatGPT #Gemini
Captcha Cognitivo de Twitter / X de Sentar Personas Correctamente: Probando con ChatGPT & Gemini

Blog personal de Chema Alonso (CDO Telefónica, 0xWord, MyPublicInbox, Singularity Hackers) sobre seguridad, hacking, hackers y Cálico Electrónico.

@annearchet @scarpentier Y'a sûrement un(e) geek qui va proposer d'automatiser avec python+selenium comme je l'ai fait ici (pour automatiser la commande de crayons sur le site du cegep 😏 ). Sûr, ce n'est pas du matos érotique 🍆 mais le principe est le même: tout ce qu'un usager accomplit comme tâche via un browser peut-être automatisé... mais il faut fouiller dans le html du site pour bâtir les invocations de Selenium 😐 https://selenium-python.readthedocs.io/

#selenium #webScrapping #python

Selenium with Python — Selenium Python Bindings 2 documentation

Usar modelos LLM para rellenar datos en formularios en scripts de WebScrapping o WebScalpping y para hacer e-mail guessing con todo lo que ello implica. De eso he escrito hoy https://www.elladodelmal.com/2024/06/webscrapping-webscalping-con-genai.html #GPT #GenAI #WebScrapping #AI #Pentest #hacking
WebScrapping & WebScalping con GenAI: Formularios y Datos

Blog personal de Chema Alonso (CDO Telefónica, 0xWord, MyPublicInbox, Singularity Hackers) sobre seguridad, hacking, hackers y Cálico Electrónico.