Show HN: HideMyData – macOS PII Removal with Local AI and OCR
HideMyData는 macOS에서 동작하는 개인 식별 정보(PII) 제거 소프트웨어로, Apple Vision OCR과 OpenAI 기반의 프라이버시 필터 모델을 사용하여 기기 내에서 완전 로컬로 작동한다. PDF와 이미지 파일을 지원하며, 이름, 이메일, 전화번호 등 다양한 PII를 AI와 정규식으로 탐지 및 편집할 수 있다. 사용자는 편집 후 영구적으로 데이터를 삭제할 수 있으며, Apple Silicon 기반 macOS 26 이상에서 실행 가능하다.

https://github.com/mkbula/HideMyData

#macos #pii #ocr #privacy #localai

GitHub - mkbula/HideMyData: Native macOS PII removal software with on device Vision OCR and OpenAI privacy filter model

Native macOS PII removal software with on device Vision OCR and OpenAI privacy filter model - mkbula/HideMyData

GitHub

OneOCR — скрытая OCR внутри Windows 11

OneOCR — это набор из двух динамических библиотек и одной модели ONNX для распознавания текста в приложениях Snipping Tool и Photos в Windows 11.

https://habr.com/ru/articles/1032188/

#ocr #ml

OneOCR — скрытая OCR внутри Windows 11

OneOCR — это набор из двух динамических библиотек и одной модели ONNX для распознавания текста в приложениях Snipping Tool и Photos в Windows 11. Скажу сразу: статьи писать я...

Хабр

@correctiv_org @digiges

Cellebrite ist wahrscheinlich nicht mal #KI jenseits von #speech2text und #ocr, aber die Anwälte können darin nicht mal Entlastung suchen, weil sie 12TB nicht auswerten können. #Polizei übrigens fast auch nicht.

Zusammen mit der #Europol Schatten IT ist der Schaden für den Rechtsstaaat nicht absehbar.

@AwetTesfaiesus @GrueneBundestag

heise+ | Scanner im Test: Kompakte Digitalisierer für Akten und Briefe bis 500 Euro

Einzugscanner für Briefe und Akten arbeiten flott und belegen nur wenig Schreibtischplatz. Modelle ab 430 Euro scannen autonom zum NAS oder in die Cloud.

https://www.heise.de/tests/Scanner-im-Test-Kompakte-Digitalisierer-fuer-Akten-und-Briefe-bis-500-Euro-11157526.html?wt_mc=sm.red.ho.mastodon.mastodon.md_beitraege.md_beitraege&utm_source=mastodon

#Scanner #IT #OCR #WLAN #news

Scanner im Test: Kompakte Digitalisierer für Akten und Briefe bis 500 Euro

Einzugscanner für Briefe und Akten arbeiten flott und belegen nur wenig Schreibtischplatz. Modelle ab 430 Euro scannen autonom zum NAS oder in die Cloud.

c't Magazin
What #VLM is the best for #OCR of tricky input such as tables or just for high fidelity output in general?
Zkusil jsem #OCR a musím říci, že je je to větší zábava než crossfit.
Byl to můj první pokus a dal jsem 3 překážky z 10. Žádný extra výkon, ale úplná ostuda to taky nebyla.
#garmin #beatyesterday

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе». Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

https://habr.com/ru/companies/raft/articles/1031684/

#ocr #document #ocrтехнологии #ocr_распознавание_документов #document_parsing #распознавание_текста #обработка_документов #таблицы #сканы #imagetotext

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions . В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на...

Хабр

Efficient data digitization relies heavily on optical character recognition (OCR). Understanding its technical stages—from pre-processing to pattern matching—is key to improving automation accuracy.

Explore a detailed breakdown of the OCR workflow here: https://digi-texx.com/techblog/how-optical-character-recognition-works/

#OCR #TechStack #DataDigitization #MachineLearning

How Optical Character Recognition Works? A Complete Guide

Understanding how optical character recognition works is essential for converting printed or handwritten text into digital formats with accuracy and efficiency.

DIGI-TEXX

RT @burkov: Ich habe drei große Probleme mit Gemini. Ich hoffe, @GoogleAI hört zu:

mehr auf Arint.info

#API #Coding #Gemini #GoogleAI #LLM #OCR #arint_info

https://x.com/burkov/status/2049210437103714657#m

Arint - SEO+KI (@[email protected])

<p>RT @burkov: Ich habe drei große Probleme mit Gemini. Ich hoffe, @GoogleAI hört zu:</p> <p><a href="https://arint.info/@Arint/116497327110890025">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#API #Coding #Gemini #GoogleAI #LLM #OCR #arint_info</p> <p><a href="https://x.com/burkov/status/2049210437103714657#m">https://x.com/burkov/status/2049210437103714657#m</a></p>

Mastodon Glitch Edition
⚠️ Even small compliance failures can trigger #OCR investigations 🔍 Complaints and breach reports often lead to penalties 📂 Common #HIPAA violations: failure to provide patient records on time ⏳ Lack of safeguards and risk analysis also cited #Compliance #Healthcare #CyberSecurity 👉 https://www.netsec.news/ocr-hipaa-penalties-covered-entities/
OCR Imposes $1,165,000 in HIPAA Penalties on Four Covered Entities - NetSec.News

The U.S. Department of Health and Human Services Office for Civil Rights imposed $1,165,000 in financial penalties on four HIPAA-regulated entities to resolve potential violations ... Read more

NetSec.News