deRSE_2025_Poster_Ravinder

Ensuring Reproducibility in OntoClue – Vector-Based Document Similarity for Biomedical Literature – Using Docker About OntoClue SCAN ME! The OntoClue project focuses on enhancing the assessment of similarity between research documents in the biomedical field. It compares around 18 different text ...

Google Docs

[ΠŸΠ΅Ρ€Π΅Π²ΠΎΠ΄] РаспознаваниС ΠΈΠΌΠ΅Π½ΠΎΠ²Π°Π½Π½Ρ‹Ρ… сущностСй: ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ, ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠΈ, сцСнарии использования ΠΈ рСализация

ЕстСствСнныС языки слоТны. А ΠΊΠΎΠ³Π΄Π° Π½Π° Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π΅ появляСтся контСкст, ΠΎΠ½ΠΈ становятся Π΅Ρ‰Ρ‘ слоТнСС. Π’ΠΎΠ·ΡŒΠΌΡ‘ΠΌ для ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° Ρ„Π°ΠΌΠΈΠ»ΠΈΡŽ Π›ΠΈΠ½ΠΊΠΎΠ»ΡŒΠ½ . НСкоторыС сразу ΠΏΠΎΠ΄ΡƒΠΌΠ°ΡŽΡ‚ ΠΎ ΡˆΠ΅ΡΡ‚Π½Π°Π΄Ρ†Π°Ρ‚ΠΎΠΌ ΠΏΡ€Π΅Π·ΠΈΠ΄Π΅Π½Ρ‚Π΅ БША, Π²Ρ‹Π΄Π°ΡŽΡ‰Π΅ΠΉΡΡ историчСской Ρ„ΠΈΠ³ΡƒΡ€Π΅. Однако для Π΄Ρ€ΡƒΠ³ΠΈΡ… это ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒ Π°Π²Ρ‚ΠΎΠΌΠΎΠ±ΠΈΠ»Π΅ΠΉ с Ρ‚Π΅ΠΌ ΠΆΠ΅ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ. Одно простоС слово ΠΈΠΌΠ΅Π΅Ρ‚ Ρ€Π°Π·Π½Ρ‹Π΅ значСния. ΠœΡ‹, люди, Π±Π΅Π· ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ Ρ€Π°Π·Π»ΠΈΡ‡Π°Π΅ΠΌ значСния ΠΈ ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ. Π­Ρ‚ΠΎ ΡΠ²ΠΈΠ΄Π΅Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΡƒΠ΅Ρ‚ ΠΎ нашСм ΠΈΠ½Ρ‚ΡƒΠΈΡ‚ΠΈΠ²Π½ΠΎΠΌ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠΈ ΠΎΠΊΡ€ΡƒΠΆΠ°ΡŽΡ‰Π΅Π³ΠΎ ΠΌΠΈΡ€Π°. Но ΠΊΠΎΠ³Π΄Π° Π΄Π΅Π»ΠΎ касаСтся ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ΠΎΠ², эта, казалось Π±Ρ‹, простая Π·Π°Π΄Π°Ρ‡Π° прСвращаСтся Π² Π½Π΅ΠΎΠ΄Π½ΠΎΠ·Π½Π°Ρ‡Π½ΡƒΡŽ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ. ΠŸΠΎΠ΄ΠΎΠ±Π½Ρ‹Π΅ трудности ΠΏΠΎΠ΄Ρ‡Ρ‘Ρ€ΠΊΠΈΠ²Π°ΡŽΡ‚ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ Π½Π°Π΄Ρ‘ΠΆΠ½ΠΎΠ³ΠΎ распознавания ΠΈΠΌΠ΅Π½ΠΎΠ²Π°Π½Π½Ρ‹Ρ… сущностСй (named entity recognition, NER) β€” ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΠ°, ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ ΠΌΡ‹ ΡƒΡ‡ΠΈΠΌ ΠΌΠ°ΡˆΠΈΠ½Ρ‹ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ лингвистичСскиС Π½ΡŽΠ°Π½ΡΡ‹. Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΌΡ‹ расскаТСм ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ NER, ΠΎ Π΅Π³ΠΎ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ°Ρ… Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΈ ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ ΠΎΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΆΠΈΠ·Π½ΠΈ. Π’Π°ΠΊΠΆΠ΅ Π² Π½Π΅ΠΉ ΠΌΡ‹ ΠΏΡ€ΠΎΠ»ΡŒΡ‘ΠΌ свСт Π½Π° Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠΈ NER ΠΈ способы Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ NER.

https://habr.com/ru/articles/776774/

#ВокСнизация #feature_extraction #машинноС_ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ #NLP #NER #POS_tagging #word_embeddings #Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΈ_ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚Π° #GPT4 #OpenAI #BRAT #sentiment_analysis

РаспознаваниС ΠΈΠΌΠ΅Π½ΠΎΠ²Π°Π½Π½Ρ‹Ρ… сущностСй: ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ, ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΈΠΊΠΈ, сцСнарии использования ΠΈ рСализация

ЕстСствСнныС языки слоТны. А ΠΊΠΎΠ³Π΄Π° Π½Π° Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π΅ появляСтся контСкст, ΠΎΠ½ΠΈ становятся Π΅Ρ‰Ρ‘ слоТнСС. Π’ΠΎΠ·ΡŒΠΌΡ‘ΠΌ для ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° Ρ„Π°ΠΌΠΈΠ»ΠΈΡŽ Π›ΠΈΠ½ΠΊΠΎΠ»ΡŒΠ½ . НСкоторыС сразу ΠΏΠΎΠ΄ΡƒΠΌΠ°ΡŽΡ‚ ΠΎ ΡˆΠ΅ΡΡ‚Π½Π°Π΄Ρ†Π°Ρ‚ΠΎΠΌ ΠΏΡ€Π΅Π·ΠΈΠ΄Π΅Π½Ρ‚Π΅ БША,...

Π₯Π°Π±Ρ€
Bookmarked: Ancient Greek Fasttext Word Embeddings https://zenodo.org/records/7630945 #Digital_Humanities #Griechisch #Word_Embeddings
Ancient Greek Fasttext Word Embeddings

Word embeddings generated with Fasttext and 1 GB of Ancient Greek texts. These embeddings were produced for the study of social networks and social semantics in ancient Greece by the Diogenet project at the University of San Diego, California. 

Zenodo