Как решать задачу NER на практике

Рассказываю, как на практике решать задачу NER. На примере извлечения сущностей из резюме пройдём путь от разметки данных до работающего API. Меньше теории, больше практики. 🔥 Начинаем 🔥

https://habr.com/ru/articles/1023552/

#NER #NLP #bert #natural_language_processing #python #как_решать_задачу_ner

Как решать задачу NER на практике

Всем привет! Меня зовут Максим. Я NLP‑инженер в red_mad_robot и автор Telegram‑канала Максим Максимов // IT, AI . Сегодня я расскажу о том, как решать задачу NER на практике....

Хабр

📣 Vortrag: Holle Meding (@hmeding) & Aurel Daugs (Digital History Berlin) sprechen bei der DHd AGKI-DH über #LLMs in der historischen Forschung.

🗓 13.04.2026 | 11:30–12:30 Uhr
💻 Zoom: https://uni-graz.zoom.us/j/69588616456?pwd=CnjYI539FaYbpnVC37v9ir8fWA2hvM.1

Im Fokus stehen: Potenziale & Grenzen von LLMs – u. a. #Chronosensitivität, #Bias, #Alignment & #Opazität.
Mit Beispielen: #NER zur Analyse von TikTok-Inhalten & #RAG auf Basis historischer Zeitungen.

#DigitalHumanities #DigitalHistory #LLM #DHd #Openaccess

Ok, ez elég jó lett: https://youtu.be/OGW9fgUpiE0
#ner
Mi vagyunk a NER

YouTube

Nächstes AGKI-DH Webinar!

Holle Meding spricht zum Thema:

"Große Sprachmodelle in den Geschichtswissenschaften – Potenziale, Grenzen und eine NER-basierte Social-Media-Analyse zu POV History Videos auf TikTok"

Montag, 13.04.2026, 11:30–12:30 Uhr

Zoom-Link: https://agki-dh.github.io

#AGKIDH #DigitalHumanities #LLM #NER #DHd2025

DHd-AG Angewandte Generative KI in den Digitalen Geisteswissenschaften (AGKI-DH)

Die AG Angewandte Generative KI in den Digitalen Geisteswissenschaften (AGKI-DH) widmet sich der Erforschung und Anwendung generativer KI, insbesondere von Large Language Models (LLMs), in den digitalen Geisteswissenschaften.

Как маскировать персональные данные на изображениях: наш эксперимент с OCR и NER

Всем привет! Меня зовут Андрей Иванов, я NLP-исследователь в R&D red_mad_robot. Мы разрабатываем систему Guardrails для защиты персональных данных (PII) и фильтрации небезопасного контента. В этой статье расскажу, как мы решали задачу точечного маскирования PII на картинках без обучения специальных визуальных детекторов. Разберём связку оптического распознавания символов (OCR) с NER-моделью, покажем метрики на реальных данных, раскроем ограничения подхода и наши решения для их преодоления.

https://habr.com/ru/companies/redmadrobot/articles/1011450/

#ai #llm #ocr #ner #pii #computer_vision #маскирование_данных #обработка_изображений #nlp #rnd

Как маскировать персональные данные на изображениях: наш эксперимент с OCR и NER

Всем привет! Меня зовут Андрей Иванов, я NLP-исследователь в R&D red_mad_robot. Мы разрабатываем систему Guardrails для защиты персональных данных (PII) и фильтрации небезопасного контента. В этой...

Хабр

Our paper "NERdME: a Named Entity Recognition Dataset for Indexing Research Artifacts in Code Repositories" by @GenAsefa Zongxiong Chen, @shufan Mary Ann Tan, Zhaotai Liu, @sonjas0815 & @lysander07 was accepted at The ACM Web Conference 2026.
...as it is still not sure whether WWW2026 will take place (in Dubai) we published the paper already in #arxiv

https://arxiv.org/abs/2603.05750

#AI #NER #NLP #researchdatamanagement @NFDI4DS @fiz_karlsruhe #semanticweb

Сравнение RuModernBERT и multilingual-e5-base для NER на русском

Однажды при мне два ИИ экcперта закусились на тему какая модель лучше извлекает именованные данные на русском языке: RuModernBERT или multilingual-e5-base. Я послушал их аргументы и решил поставить небольшой эксперимент на реальных данных (благо данных хоть отбавляй). Итак, условия NER задачи:

https://habr.com/ru/articles/1006998/

#ner #e5 #rumodernbert

Сравнение RuModernBERT и multilingual-e5-base для NER на русском

1. Введение Однажды при мне два ИИ экcперта закусились на тему какая модель лучше извлекает именованные данные на русском языке: RuModernBERT или multilingual-e5-base. Я послушал их аргументы и решил...

Хабр

Wrote an article and published a nuget package sitting here in the hospital. https://www.mostlylucid.net/blog/simple-ocr-ner-extraction
(RDP over tailscale rules 🤓)
Companion CLI and nuget packages linked at the top. Makes OCR & Named Entity Extraction SUPER EASY.

#ocrr #llm #ner

Simple OCR and NER Feature Extraction in C# with ONNX (English)

NuGet NuGet Downloads GitHub Release (CLI) As I've been building lucidRAG I'm reading social media where people keep asking the same thing. 'How do you get...

mostlylucid

NER не про токены: почему span важнее BIO

NER часто воспринимают как задачу классификации токенов: BIO-теги, последовательности меток, декодирование. Такой взгляд удобен с точки зрения моделей, но плохо отражает то, как NER работает в реальных системах. Сущности - это не токены, а фрагменты текста. Результаты работы NER-систем, как правило, представлены в виде спанов - с явными границами начала и конца (start / end) и типами сущностей. В этой статье мы разберём два уровня разметки в NER: span-level и token-level и покажем, какую роль каждый из них играет в практических пайплайнах.

https://habr.com/ru/companies/raft/articles/991404/

#ner #named_entity_recognition #аннотация_данных #машинное+обучение #machine_learning #nlp #span #token #персональные_данные #pii

NER не про токены: почему span важнее BIO

Дисклеймер . Все примеры текстов и сущностей в статье являются синтетическими и не содержат реальных персональных данных. Любые совпадения с реальностью случайны. Интро В последние годы системы...

Хабр
#news ⚡ Dax startet deutlich im Minus – Nervosität wegen Grönland-Debatte: Der Dax ist am Dienstag mit deutlichen Verlusten in den Handelstag gestartet. Gegen 9:30 Uhr wurde der deutsche Leitindex mit rund 24.... https://hubu.de/?p=311245 | #dax #groenlanddebatte #minus #ner
Dax startet deutlich im Minus - Nervosität wegen Grönland-Debatte - Hubu.de - News & FreeMail

Der Dax ist am Dienstag mit deutlichen Verlusten in den Handelstag gestartet.

Hubu.de - News & FreeMail