EDA of dataset Python
Привет, Хабр! Аналитики данных часто сталкиваются с грязными данными, которые могут существенно замедлить процесс анализа. Грязны данные – это пропущенные значения, дубликаты, неконсистентные данные. Пропущенные значения заставляют нас гадать, что же было замыслено нашим коллегой; дубликаты вводят в заблуждение, умножая одно и то же на количество их копий, а неконсистентные данные заставляют нас сомневаться в каждой цифре. Очищать грязные данные можно c Pandas . Рассмотрим основные методы.
https://habr.com/ru/articles/882588/
#анализ #анализ_данных #анализ_и_проектирование_систем #анализ_сложности_алгоритмов #анализ_трафика #анализ_кода