Зачем Паустовскому облака? Узнал точно с помощью Python

Константина Паустовского называют мастером пейзажной лирики. В его произведениях природа действительно выступает не как фон событий, а как будто один из полноценных действующий персонажей. Мне стало интересно попробовать разобраться, за счет каких лексических средств писатель так здорово оперирует впечатлениями читателя.

https://habr.com/ru/articles/1012730/

#python #pymorphy2 #nlpмодели #nltk_python #литература #чтение_книг #проза #поэзия #поэзия_и_проза #писатель

Зачем Паустовскому облака? Узнал точно с помощью Python

Константина Паустовского называют мастером пейзажной лирики. В его произведениях природа действительно выступает не как фон событий, а как будто один из полноценных действующий персонажей. При этом...

Хабр

Иволга это молитва. Доказано с помощью Python

Николай Заболоцкий эмоционально переживал за атомную бомбардировку в Японии, написал стихотворение про березы и про птицу иволгу, а получилась у него молитва. Я убедился в этом с помощью Python.

https://habr.com/ru/articles/1009586/

#python #pymorphy2 #nltk_python #nlpмодели #nlp_обработка_текста #говнокод #аналитика #поэзия #проза

Иволга это молитва. Доказано с помощью Python

В этой роще березовой, Вдалеке от страданий и бед, Где колеблется розовый Немигающий утренний свет, Где прозрачной лавиною Льются листья с высоких ветвей, — Спой мне, иволга, песню пустынную, Песню...

Хабр

В эмиграции Цветаеву окружала серость и сырость. Установлено NLTK анализом с помощью Python

На примере стихотворения "Рассвет на рельсах" можно увидеть эмоции и настроения марины Цветаевой после отъезда в эмиграцию. В нём преобладают серые унылые тона. Но в то же время есть вера восстановить Россию.

https://habr.com/ru/articles/997036/

#python #nltk #nltk_python #nlpмодели #pandas #seaborn #matplotlib #чтение #поэзия #поэзия_серебряного_века

В эмиграции Цветаеву окружала серость и сырость. Установлено NLTK анализом с помощью Python

Из сырости — и стай… Еще вестями шалыми Лжет вороная сталь — Еще Москва за шпалами! Так, под упорством глаз — Владением бесплотнейшим Какая разлилась Россия — в три полотни��а! И — шире раскручу!...

Хабр

C помощью Python нашел следы Шекспира в песне Цоя

Даже беглый анализ некоторых текстов группы "Кино" наталкивает на мысль о довольно сильных символических значениях их стихотворных строк. Мне стало интересно провести сравнительный анализ текста песни Виктора Цоя и драмы Уильяма Шекспира "Гамлет" и найти пересечения, аллюзии и реминисценции в творчестве двух авторов помощью инструментов NLP на Python.

https://habr.com/ru/articles/1002004/

#говнокод #чтение #поэзия #проза #python #pymorphy2 #nltk_python #nlpмодели #nlp_обработка_текста

C помощью Python нашел следы Шекспира в песне Цоя

Ты должен быть сильным, ты должен уметь сказать: Руки прочь, прочь от меня! Ты должен быть сильным, иначе зачем тебе быть Что будет стоить тысячи слов Когда важна будет крепость руки? И вот ты стоишь...

Хабр

Лучший перевод Шекспира с точки зрения математики

За переводы сонетов Шекспира брались многие мастера и любители. Мне стало интересным провести лексико-семантический анализ нескольких переводов 74 сонета и сравнить их с оригиналом. Я взял авторов, авторитет которых как поэтов и переводчиков вне сомнения Маршака и Пастернака. И двух переводчиков, не известных как поэты - Николая Гербеля и Модеста Чайковского. Я захотел проверить, кто из переводчиков точнее всего передал смысл, ритм и эмоции оригинала, используя алгоритмы машинного обучения.

https://habr.com/ru/articles/996614/

#python #nlp #nlpмодели #nltk_python #проза #поэзия #литература_художественная #sentencetransformers #sbert

Лучший перевод Шекспира с точки зрения математики

Покоен будь: когда я буду смертью скован,      Без мысли быть опять когда-нибудь раскован,      Останутся тебе на память, милый мой,     ...

Хабр

Python не нашел глаголов у Фета

Афанасий Фет написал импрессионистскую картину в стихах. Сможет ли цифровой анализ объективно подтвердить или опровергнуть этот миф?

https://habr.com/ru/articles/995274/

#python #pymorphy #nlp #nltk_python #стихотворения #проза #чтение #литература #литература_художественная

Python не нашел глаголов у Фета

Шепот, робкое дыханье, Трели соловья, Серебро и колыханье Сонного ручья, Свет ночной, ночные тени, Тени без конца, Ряд волшебных изменений Милого лица, В дымных тучках пурпур розы, Отблеск янтаря, И...

Хабр

Пушкин против Ершова: кто победит в дуэли стилей?

Сравнил Пушкина и Ершова с помощью Python и пытался найти автора "КОнька-горбунка" среди цифр и кода.

https://habr.com/ru/articles/967162/

#python #nltk_python #tokenizer #pymorphy #matplotlib #литература #литература_художественная #литературная_страничка #литературное_творчество

Пушкин против Ершова: кто победит в дуэли стилей?

Я — цифровой гуманитарий. Я не просто читаю стихи. Я разбираю на цифры и собираю заново — чтобы увидеть то, что скрыто от глаз: ритм, лексику, синтаксис, звуковую ткань. Сегодня я сравню двух...

Хабр

Пушкин vs Лермонтов: поиск истины на Python

Можно ли с помощью Python и математических метрик лучше понять поэзию? В этой статье я покажу, как с помощью кода можно количественно сравнить стили Александра Пушкина и Михаила Лермонтова.

https://habr.com/ru/articles/965824/

#nlp #nltk_python #pymorphy2 #razdel #counter #log #matplotlib

Пушкин vs Лермонтов: поиск истины на Python

Как Python и простые метрики помогают раскрыть различия в стиле двух великих русских поэтов. Лексическое разнообразие, длина слов и предложений, частотность частей речи — всё это можно измерить и...

Хабр

Как Python раскрыл поэтический гений Маршака

Маршак хорошо переводил Шекспира, но насколько он был близок к оригиналу? Сохранен ли у него ритм, размер, смысл и структура? Установлю это математически точно с помощью Python.

https://habr.com/ru/articles/965552/

#python #nltk #nltk_python #tokenizer

Как Python раскрыл поэтический гений Маршака

Маршак почти идеально сохранил ритм, смысл и структуру оригинала. Вот как я убедился в этом с помощью Python. Я цифровой гуманитарий. Мне интересно пересечение литературы и математики. Я не просто...

Хабр

Краткий обзор токенизаторов: что это такое и зачем это надо?

Представьте себе, что вы читаете книгу и хотите найти все места, где упоминается слово "кот". Не знаю, зачем вам это, но пока остановимся на том, что вы это хотите. Вот очень надо. Так как это сделать? Вы можете просто пролистать книгу и прочитать ее с начала до конца, буквально вручную находя всех котиков, но… Это может занять много времени и усилий. Гораздо проще будет воспользоваться индексом в конце книги, где перечислены все места, где упоминается слово "кот". Проблема в том, что в обычной печатной книге такого нет, а вот если вы читаете электронку — да, вполне. Можно воспользоваться поиском по слову. Но это вы так можете, а вот компьютеры — нет. Компьютеры не могут просто прочитать текст и понять, что он означает. Они нуждаются в помощи токенизаторов, которые преобразуют текст в набор токенов, или отдельных единиц информации, которые можно анализировать и обрабатывать. Токенизация — это первый шаг в обработке текстовых данных. Без токенизации компьютеры не смогли бы понимать текст и находить в нем полезную информацию. Токенизаторы помогают преобразовать текст в данные, которые можно анализировать и использовать для решения различных задач, таких как классификация текстов, распознавание речи, машинный перевод и многие другие. Токенизаторы, подобно электронным поисковым системам для текста, помогают компьютерам эффективно найти и организовать нужную информацию, так же как электронные индексы в электронных книгах облегчают поиск конкретных фраз. Без них компьютерам было бы гораздо сложнее “понимать” и анализировать текстовые данные.

https://habr.com/ru/articles/800595/

#python #nltk_python #spacy #библиотеки_python #gensim #токенизация

Краткий обзор токенизаторов: что это такое и зачем это надо?

Представьте себе, что вы читаете книгу и хотите найти все места, где упоминается слово "кот". Не знаю, зачем вам это, но пока остановимся на том, что вы это хотите. Вот очень надо. Так как это...

Хабр