От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей

От «обезьяньей» работы к Smart-анализу: как правильно готовить данные для моделей. Что такое Exploratory Data Analysis и как избежать основных ошибок при его выполнении.

https://habr.com/ru/articles/975082/

#pandas #sklearn #data_science #exploratory_data_analysis #machine_learning #numpy #statistics #feature_engineering

От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей

Обезьянья предобработка данных Мы частенько шутим с коллегами , что любые действия можно поделить на «обезьяньи» и «smart» . Обезьянья работа - это когда ты что-то делаешь на автомате, не включая мозг...

Хабр

Разведочный анализ текстовых данных (EDA for text data)

В этой статье будет рассказано про разведочный анализ текстовых данных (EDA). Рассмотрим основные методы и этапы — от проверки данных и анализа частотности слов до тематического моделирования. Также разберем применение EDA для конкретных задач NLP, таких как классификация текстов и извлечение сущностей (NER/POS). Весь рассказ будет сопровождаться кодом на Python. 🔥 Начинаем 🔥

https://habr.com/ru/articles/964440/

#eda #разведочный_анализ_данных #nlp #exploratory_data_analysis #python #text_mining

Разведочный анализ текстовых данных (EDA for text data)

Во время работы с данными важно понять, что они собой представляют. Не всегда на первый взгляд можно понять их структуру, свойства и особенности. В частности, это...

Хабр