A "Hurra, der Build ist wieder grün."
B: "Ja. Zurück zum Normalbetrieb."
A: "Und alles was wir tun mussten war, eine Woche gemeinsam mit @hetzner obskure Hardware-Probleme debuggen."
B: "Dieses ganze IT-Zeug war ein Fehler."

#thotleaks

... und dann fiel der Hypervisor wieder aus. Seufz. Falls jemand ein:e Technikexorzist:in kennt... #thotleaks

TL; DR: https://bugzilla.kernel.org/show_bug.cgi?id=177311

```
echo "blacklist i2c_i801" > /etc/modprobe.d/blacklist-i801-smbus.conf
update-initramfs -u -k all
reboot
```

i801_smbus produziert eine metrische Scheißtonne Interrupts, weil default-mäßig das Temperaturlimit für den entsprechenden Chip bei 0°C gesetzt wird.

Und weil Interrupts mit dem vCPU-Scheduling von QEMU um CPU-Zeit konkurrieren, sieht es in htop auf dem Hypervisor so aus, als ob die VMs die ganze CPU fressen.

Wir machen jetzt #wasmitholz. #thotleaks

177311 – crazy interrupt rate on i801_smbus

@thot War das zufällig ein Ubuntu cloud image? Sieht für mich nach der gleichen Kategorie Bug aus, den wir dort irgendwann um 2018/2019 hatten....

Edit: Nachdem ich jetzt das Ticket nochmal genauer gelesen habe, könnte das sogar exakt das Problem gewesen sein.

@agowa338 @thot Es war Debian Trixie.