deRSE_2025_Poster_Ravinder

Ensuring Reproducibility in OntoClue – Vector-Based Document Similarity for Biomedical Literature – Using Docker About OntoClue SCAN ME! The OntoClue project focuses on enhancing the assessment of similarity between research documents in the biomedical field. It compares around 18 different text ...

Google Docs

[Перевод] Распознавание именованных сущностей: механизм, методики, сценарии использования и реализация

Естественные языки сложны. А когда на горизонте появляется контекст, они становятся ещё сложнее. Возьмём для примера фамилию Линкольн . Некоторые сразу подумают о шестнадцатом президенте США, выдающейся исторической фигуре. Однако для других это производитель автомобилей с тем же названием. Одно простое слово имеет разные значения. Мы, люди, без проблем различаем значения и категории. Это свидетельствует о нашем интуитивном понимании окружающего мира. Но когда дело касается компьютеров, эта, казалось бы, простая задача превращается в неоднозначную проблему. Подобные трудности подчёркивают необходимость надёжного распознавания именованных сущностей (named entity recognition, NER) — механизма, при помощи которого мы учим машины понимать различные лингвистические нюансы. В этой статье мы расскажем о том, что такое NER, о его принципах работы и о том, как оно используется в реальной жизни. Также в ней мы прольём свет на различные методики NER и способы реализации модели NER.

https://habr.com/ru/articles/776774/

#Токенизация #feature_extraction #машинное_обучение #NLP #NER #POS_tagging #word_embeddings #рекомендации_контента #GPT4 #OpenAI #BRAT #sentiment_analysis

Распознавание именованных сущностей: механизм, методики, сценарии использования и реализация

Естественные языки сложны. А когда на горизонте появляется контекст, они становятся ещё сложнее. Возьмём для примера фамилию Линкольн . Некоторые сразу подумают о шестнадцатом президенте США,...

Хабр
Bookmarked: Ancient Greek Fasttext Word Embeddings https://zenodo.org/records/7630945 #Digital_Humanities #Griechisch #Word_Embeddings
Ancient Greek Fasttext Word Embeddings

Word embeddings generated with Fasttext and 1 GB of Ancient Greek texts. These embeddings were produced for the study of social networks and social semantics in ancient Greece by the Diogenet project at the University of San Diego, California. 

Zenodo