RANK() vs DENSE_RANK(): ошибка, которая ломает топ-N в проде

При работе с данными в SQL рано или поздно возникает задача ранжирования: топ-5 продуктов по продажам, рейтинг сотрудников по KPI, распределение клиентов по категориям. На первый взгляд RANK() и DENSE_RANK() делают почти одно и то же. На тестовых данных разница может быть вообще незаметна. Но в проде именно здесь часто начинаются ошибки: — топ-3 внезапно возвращает 5 строк; — дашборд "врёт"; — backend-логика начинает вести себя не так, как ожидалось; — запрос, который вчера работал быстро, сегодня уходит в disk spill. Две самые популярные функции для ранжирования — RANK() и DENSE_RANK() . Ниже разберём, чем они отличаются, где именно ошибаются разработчики и аналитики, и что важно понимать: не только что делает оконная функция, но и сколько она стоит на больших объёмах данных.

https://habr.com/ru/articles/1021094/

#sql #rank #dense_rank #window_functions #postgresql #оптимизация #производительность #аналитика #базы_данных #topn

RANK() vs DENSE_RANK(): ошибка, которая ломает топ-N в проде

При работе с данными в SQL рано или поздно возникает задача ранжирования: топ-5 продуктов по продажам, рейтинг сотрудников по KPI, распределение клиентов по категориям. На первый взгляд RANK() и...

Хабр

Отображение иерархии в SQL запросе

В процессе тестирования одного курса по SQL на stepik.org встретилась задача, из которой сочинилась другая, более интересная: Необходимо с помощью одного SQL запроса с использованием обобщенных табличных выражений отобразить иерархию, в соответствии с иллюстрацией выше

https://habr.com/ru/articles/810687/

#MySQL #SQL #Common_Table_Expression #CTE #with_recursive #window_functions #Оконные_функции #Иерархические_структуры_в_SQL #Обобщенные_табличные_выражения #sqlite

Отображение иерархии в SQL запросе

Предыстория В процессе тестирования одного курса по SQL на stepik.org встретилась такая задача: Вам доступна таблица Files , хранящая информацию о расположении файлов и папок внутри системы:...

Хабр