[Перевод] Как Netflix добивается корректной атрибуции в журналах сетевых потоков eBPF

Один неправильно «пришитый» IP — и рождается фантомная зависимость. Netflix на масштабе ≈5 млн TCP-потоков/с отказался от событийного учёта адресов и построил атрибуцию на наблюдаемых таймлайнах владения IP: eBPF-сайдкар точно метит локальную нагрузку (включая Titus и связку IPv6→IPv4 по паре IP+порт), а FlowCollector держит интервалы в памяти и рассылает их через Kafka, форвардя межрегиональные кейсы по trie из VPC-CIDR. Задержка — ~1 мин вместо 15, ложных совпадений — ноль по проверке на Zuul. В итоге flow logs стали источником истины о зависимостях и «здоровье» сети.

https://habr.com/ru/companies/otus/articles/945980/

#ebpf #flow_logs #журналы_потоков #heartbeats #наблюдаемость #observability #devops #высокие_нагрузки

Как Netflix добивается корректной атрибуции в журналах сетевых потоков eBPF

В одной из предыдущих статей мы рассказывали, как Netflix использует eBPF для масштабного сбора журналов TCP-потоков, чтобы лучше понимать состояние облачной сети. В этом материале мы разберём, как...

Хабр