Шардированный кластер ClickHouse

Хочу рассказать, как спроектированы распределённые вычисления в ClickHouse. Вы узнаете, на что влияет схема кластера (и на что не влияет). Расскажу, как можно на ровном месте создать себе проблему при помощи всего одной таблицы Kafka и нескольких матвьюх. Поделюсь опытом про дебаг и оптимизацию SELECT-запросов к Distributed таблицам: поизучаем планы выполнения и поэксперементируем с настройками в блоке SETTINGS.

https://habr.com/ru/companies/wildberries/articles/896060/

#clickhouse #sql #bigdata #хранение_данных #data_engineering #mpp #shared_nothing

Шардированный кластер ClickHouse

Привет, Хабр! Меня зовут Артемий Кравцов, я работаю инженером в Wildberries. Про ClickHouse как MPP-систему (Massively Parallel Processing) не так много информации можно найти в...

Хабр