Wiktionnaire:Actualités/134-mai-2026 — Wiktionnaire, le dictionnaire libre

Wiktionnaire

happy ten million entries to the English Wiktionary!

#Wiktionary

With all the amusing posts about Google's reaction to the word "disregard", I think this might be a good time to remind others of alternatives.

#Google #DisregardGoogle #Wiktionary

Do you use #Wikipedia, #Wiktionary, #WikimediaCommons, #Wikidata, or other #Wikimedia resources? The #WikimediaFoundation has just disbanded an entire team of staff who work closely with volunteer contributors, coincidentally while some of those same staff have been working to form a union. Volunteers from various projects are planning collective action in solidarity with the workers. On the English-language Wikipedia, this action might include an editorial strike (no new content) or making the wiki read-only. #union #solidarity

https://meta.wikimedia.org/wiki/Wiki_Workers_United

Wiki Workers United - Meta-Wiki

I think #wiktionary at least makes a bit more of an effort: to do something recklessly, without caring about anything else; to do something in a slapdash way. but maybe I would say hogwild has a bit of that connotation in English
https://id.wiktionary.org/wiki/membabi_buta

#Indonesian

membabi buta - Wikikamus bahasa Indonesia

Wikikamus

Список слов русского языка из Wiktionary и сравнение с pymorphy3 на примере Пушкина и Noize MC *

В задачах обработки естественного языка (NLP) часто требуется список слов русского языка. Такой список может использоваться как базовый фильтр для выявления неизвестных и потенциально некорректных слов. Одним из распространённых инструментов для работы с русским текстом является библиотека pymorphy (pymorphy2 / pymorphy3), основанная на корпусе русского языка OpenCorpora . Она предназначена для морфологического анализа текстов и, в том числе, позволяет проверять, известно ли слово встроенному словарю библиотеки. Однако словарь pymorphy ориентирован на нормативную лексику и морфологию. В нём отсутствует значительная часть имён собственных, топонимов, заимствований, разговорной и современной лексики. Поэтому при использовании pymorphy для фильтрации текста возникают ложные срабатывания, много редких и нестандартных слов определяются как неизвестные (что мы увидим ниже в разделе сравнения словарей). Для повышения полноты выявления неизвестных слов я решил собрать свой максимально широкий список слов русского языка для задач NLP. Такой список слов можно получить на основе данных сайта Wiktionary (Викисловарь) . Wiktionary - это открытый многоязычный словарь, в котором каждая словарная единица представлена в виде отдельной статьи. Викисловарь содержит информацию о словах различных языков, включая русский, а также сведения об их морфологических и синтаксических свойствах. * Признан минюстом РФ иностранным агентом.

https://habr.com/ru/articles/1027992/

#словарь_русского_языка #база_слов_русского_языка #список_русских_слов #Wiktionary #парсинг #дамп #nlp #извлечение_данных #pymorphy

Список слов русского языка из Wiktionary и сравнение с pymorphy3 на примере Пушкина и Noize MC *

Оглавление Введение Процесс создания словаря Попытка 1. Создание словаря на основе названий статей Викисловаря Попытка 2. Создание словаря на основе полного дампа содержимого русского Викисловаря...

Хабр

RE: https://social.vivaldi.net/@ianbetteridge/116439171244996129

This is indeed a very good article. It gives examples of problems from "AI", NFT, and VR, but its message is also applicable to... some other technology ideas.

I added a quotation from it to the English #Wiktionary entry on the verb "bogart": https://en.wiktionary.org/wiki/bogart

@apps

Love the concept. What authority are you planning to use for "real dictionary'? My preferred is #Wiktionary. And, as dictionaries do engage in bias, I am opposed to some, such as (English) Websters.

I ran into "skeeve" in a book and wasn't sure what it means. Merriam-Webster had "skeevy", and mentioned "skeeve" as its source, but didn't have an actual entry for it!

Luckily, #Wiktionary did, and the article looks good to me.

This happens to me increasingly often, even though Merriam-Webster is one of the very few, perhaps even the only commercial English dictionary that is still regularly updated.

I love Merriam-Webster very dearly, but times may be changing.

error: it should rather be "trucem" instead of "pacem" Trux, which became in English "Truce" - en.wiktionary.org/wiki/trux#La... Wow... Wiktionary in Latin !!! #VICTIONARIUM #wiktionary la.wiktionary.org/wiki/Viction...

la.wiktionary.org/wiki/Victionar...
trux - Wiktionary, the free dictionary

Wiktionary