Корпус мансийского языка часть 1. Модель нейронного машинного перевода

Паща о̄лэн, Хабр! (Привет, Хабр!) На связи Югорский НИИ информационных технологий (ЮНИИИТ). Мы запускаем цикл статей о нашем большом проекте - «Корпус мансийского языка». Мансийский язык - один из коренных языков народов Севера, находящийся под угрозой исчезновения. По данным последней переписи, народ манси насчитывает менее 12.308 человек, а говорящих на данном языке еще меньше. Наш проект направлен на сохранение и цифровизацию этого языка с использованием современных технологий машинного обучения. Работы ведутся над множеством моделей машинного обучения: нейронный переводчик (NMT), система распознавания (STT) и синтеза речи (TTS), модель распознавания мансийских символов (OCR), ну и конечно же большая языковая модель способная общаться на мансийском языке (LLM). Мы планируем рассказать о каждой разработанной модели в отдельной статье, и, как вы уже поняли из названия, эта публикация посвящена нейронному переводчику с русского на мансийский язык и обратно. Что расскажем: ● Как собирали и размечали обучающие данные; ● Какие модели и подходы тестировали; ● Каких результатов удалось достичь. Итак, давайте пойдем по порядку. Как собирали и размечали обучающие данные? Первая и самая сложная задача при создании нейронного переводчика (как, впрочем, и в любой другой ML-задаче) - найти качественные данные. Для обучения NMT требуются параллельные тексты на двух языках. Если для популярных языковых пар доступны миллионы параллельных предложений, то для мансийского языка готовых корпусов нужного объема просто не существует.

https://habr.com/ru/articles/981574/

#nmt #nllb200 #мансийский_язык

Корпус мансийского языка часть 1. Модель нейронного машинного перевода

Паща о̄лэн, Хабр! (Привет, Хабр!) На связи Югорский НИИ информационных технологий (ЮНИИИТ). Мы запускаем цикл статей о нашем большом проекте - «Корпус мансийского языка». Мансийский язык - один из...

Хабр
My 'it's my mania you get the benefit' jag of crazy projects continues. This one is an EasyNMT compatible docker image.
Can translate between MANY languages (>100). super fast. GPU and CPU versions for your delectation.
#translation #nmt #docker
https://www.mostlylucid.net/blog/mostlylucid-nmt-complete-guide
https://github.com/scottgal/mostlyucid-nmt
Building mostlyLucid-NMT: A Production-Ready (EasyNMT compatible) Translation Service (English)

Scott Galloway is a lead developer and software engineer with a passion for building web applications.

Mathematics and 200-point scores are just the tip of the iceberg of NMT results. What did they really show, and do we want to see it? Read Oksana Onishchenko's article.

#NMT #education #learning #Ukraine
https://zn.ua/eng/education-mirrored-by-exams-what-we-really-see-in-the-results.html

Education Mirrored by Exams: What We Really See in the Results

The results of the 2025 NMT revealed a deep crisis in school education—massive failures in mathematics, poor knowledge of physics, and problems with logical thinking.

Зеркало недели | Дзеркало тижня | Mirror Weekly

@thelinuxEXP I really like Speech Note! It's a fantastic tool for quick and local voice transcription in multiple languages, created by @mkiol

It's incredibly handy for capturing thoughts on the go, conducting interviews, or making voice memos without worrying about language barriers. The app uses strictly locally running LLMs, and its ease of use makes it a standout choice for anyone needing offline transcription services.

I primarily use #WhisperAI for transcription and Piper for voice, but many other models are available as well.

It is available as flatpak and https://github.com/mkiol/dsnote

#TTS #transcription #TextToSpeech #translator translation #offline #machinetranslation #sailfishos #SpeechSynthesis #SpeechRecognition #speechtotext #nmt #linux-desktop #stt #asr #flatpak-applications #SpeechNote

Handbook of Neurologic Music Therapy 2nd ed. by Michael H. Thaut & Volker Hömberg

Neurologic Music Therapy (NMT) is a form of music therapy developed for people suffering from cognitive, sensory, or motor dysfunctions - arising from neurological diseases of the nervous system.

@bookstodon
#books
#nonfiction
#neurology
#MusicTherapy
#NMT
#Oxford

23.5.1939 Adolf Hitler gibt militärischer Führungsspitze in Deutschland bekannt, bei erster passender Gelegenheit Polen zu überfallen. Rede v. R. Schmundt aufgezeichnet. Schmundt-Protokoll später wichtiges Dokument im Nürnberger Prozess gegen Hauptkriegsverbrecher.

#OTD #OnThisDay #NMT #Geschichte

Neometals share price

Neometals (ASX:NMT) is an asset listed on the ASX, and part of the Materials sector. Grafa’s asset page shows Neometals’s share price, chart, trading volume, ea

Grafa
Neometals ( #NMT ) has released " Quarterly Activities/Appendix 5B Cash Flow Report " on Mon 28 Apr at 14:58 AEST #China #trading #Mining #India #Gold
https://grafa.com/asset/neometals-ltd-3343-nmt.asx?utm_source=asxmktsensitive&utm_medium=mastodon&utm_campaign=nmt.asx
Neometals share price

Neometals (ASX:NMT) is an asset listed on the ASX, and part of the Materials sector. Grafa’s asset page shows Neometals’s share price, chart, trading volume, ea

Grafa
Neometals share price

Neometals (ASX:NMT) is an asset listed on the ASX, and part of the Materials sector. Grafa’s asset page shows Neometals’s share price, chart, trading volume, ea

Grafa
Neometals ( #NMT ) has released " Exploration Update - Barrambie Gold Assays " on Thu 20 Mar at 08:17 AEST #Mining #Gold #Australia #media #Metals
https://grafa.com/asset/neometals-ltd-3343-nmt.asx?utm_source=asxmktsensitive&utm_medium=mastodon&utm_campaign=nmt.asx
Neometals share price

Neometals (ASX:NMT) is an asset listed on the ASX, and part of the Materials sector. Grafa’s asset page shows Neometals’s share price, chart, trading volume, ea

Grafa