Цікавий випадок сьогодні з #MongoDB. На одному із secondary в replica set раптово злетіло навантаження на диск до 80-90%. Почав копати - виявилось, що йшло створення індексу на колекції з 16 мільйонами документів (розробники додали індекс та забули попередити). На primary та hidden secodary індекс побудувався з невеликим додатковим IO, але на доступному для запитів secondary активно молотив диск, але чому так довго і так важко?
Виявилось що WiredTiger cache був заповнений під зав'язку і постійно виганяв сторінки щоб читати нові - класичний cache thrashing. В результаті система почала свапувати, своп заповнився повністю (8GB/8GB), і #MongoDB почав читати та писати через swap - звідси і дисковий ад.
Вирішення виявилось простим - вимкнути swap. До речі #claude сказав не робити цього, бо буде #OOM та mongodb процес помре першим.
Я все ж таки зробив swapoff -a. Команда працювала 1.5 години :-(
#Ubuntu поступово відвойовувала місце в свопе за рахунок зменшення дискового кешу. На скріншоті біла полоса - це коли почався процес зменшення свопа - система була перевантажена, що не могла відправляти телеметрію.
Дані повернулись в RAM і IO впав до норми буквально одразу.
Ще #claude радим поставити`vm.swappiness=1`, але не дивлячись на це система усе одно використовувала своп, бо MongoDB віджирав усю доступну памʼять від свої кеші.
Треба спробувати обмежети wiredTiger розмір кеша, щоб він не добирався до свопа.

✅ Заставить полноценный FLUX1.dev работать без OOM на картинках 1024x1024
✅ Также успешно запустить квантизированный FLUX под ROCm несмотря на то, что у Invoke в образе с ROCm поломана bitsandbytes
✅ Смириться, что генерировать в нормальном разрешении и с нормальными параметрами - это меееедленно.

#log #GenAI #Invoke #FLUX #server #AMD #ROCm #troubleshooting #memory #OOM

Next one. She's still in need of a name. I like Peaches, but I heard that's a pretty oldtimey name? #orborbmagi #oom #pixelart #魔法少女
Tapi pas banget kebangun ternyata ada satu #vm utama yang #oom alias out of memory. Gak sampe down gimana ketolong swap, tapi ya jadi padat merayap.

Dah coba tune dan relokasi beberapa container, tinggal pantau.
#pixelart #oom #goblin #魔法少女 She got a little makeover ✨

𝗙𝗿𝗲𝗲𝗸 𝗩𝗼𝗻𝗸 𝗱𝗼𝗼𝗿 𝗴𝗲𝗯𝗼𝗼𝗿𝘁𝗲 𝗻𝗲𝗲𝗳𝗷𝗲 𝘃𝗼𝗼𝗿 𝗵𝗲𝘁 𝗲𝗲𝗿𝘀𝘁 𝗼𝗼𝗺 𝗴𝗲𝘄𝗼𝗿𝗱𝗲𝗻

Freek Vonk is voor het eerst oom geworden. Op Instagram deelt hij het blije nieuws van de geboorte van zijn neefje Melle.

https://www.rtl.nl/boulevard/artikel/5545212/freek-vonk-door-geboorte-neefje-voor-het-eerst-oom-geworden

#FreekVonk #neefje #oom

Freek Vonk door geboorte neefje voor het eerst oom geworden

Freek Vonk is voor het eerst oom geworden. Op Instagram deelt hij het blije nieuws van de geboorte van zijn neefje Melle.

RTL Boulevard

Der #OOM-Killer hatte mir ein paar Tage lang mein #TOR-Relay lahmgelegt...

Aber Reboot tut gut.

Die letzten 3 Monate sind angebrochen.
Der Server ist schon gekündigt.

Damit wars das.
Hab noch ein paar private #Snowflake Proxies mit je ca. 1TB Volumen im Monat, aber mehr werd ich da nicht mehr machen.

Finally! I'm exhausted all RAM on my homelab server, trying to install some python 3.13 things via pip, which involved compilation of some C++ things from sources  

At least, I'm checked that kernel successfully kills some random processes, when it got OOM. Was very surprised, when I received some notifications on my phone about dead PostgreSQL, sshd and main nginx, lol

Still has no money to install the maximal amount of memory to my home server — 4 Gb (max for Intel Atom N2800 1866 MHz)  

#homelab #NetBSD #OOM

Cài đặt 4x RTX 3090 cho mô hình Wan2.2-TI2V-5B gặp lỗi VRAM OOM trong bước decode. #Wan2.2 #RTX3090 #VRAM #OOM #CUDA #PyTorch #MachineLearning #AI #GPUs #Docker

https://www.reddit.com/r/LocalLLaMA/comments/1ojdx3y/4x_rtx_3090_setup_for_wan22ti2v5b_fp16/

Has #OOM in #Linux been solv