Как оптимизировать код на С для x86-процессоров: подсистема кэша и памяти, инструкции AVX-512

Меня зовут Андрей Бакшаев, я ведущий инженер-программист в YADRO. Моя команда занимается разработкой и оптимизацией математических библиотек под архитектуру x86. До этого я 15 лет работал в Intel. Значительная часть моих задач заключалась в том, чтобы реализовывать некоторые алгоритмы обработки изображений и сигналов в довольно известной математической библиотеке IPP, максимально эффективно используя возможности процессоров. Я также исследовал производительность этих алгоритмов в процессорах на ранней стадии проектирования. В статье я поделюсь своим опытом оптимизации низкоуровневого кода на языке C. Рассмотрим подсистему кэша и памяти процессоров и новые инструкции AVX-512. Разберем пример ускорения копирования байтового массива данных и посмотрим, как векторизованный код позволяет сократить время работы широко используемого алгоритма замены байтов по таблице с 619 до 34 мс, то есть примерно в 18 раз.

https://habr.com/ru/companies/yadro/articles/779284/

#icelake #dsp #avx2 #avx512

Как оптимизировать код на С для x86-процессоров: подсистема кэша и памяти, инструкции AVX-512

Меня зовут Андрей Бакшаев, я ведущий инженер-программист в YADRO . Моя команда занимается разработкой и оптимизацией математических библиотек под архитектуру x86. До этого я 15 лет работал в Intel....

Хабр

Today's Flickr photo with the most hits: Greenland glaciers (taken en route Manchester - Chicago, in 2009)

#glacier #greenland #IceLake

This place in Colorado that was pretty neat 😍

#photography #photo #colorado #icelake #cold

#Intel #Xeon #IceLake vs. #AMD #EPYC #Milan Server Performance, Efficiency & Value In 2023
From this testing, AMD EPYC Milan easily led over Intel Ice Lake when it came to delivering the best performance-per-Watt. However, given all of my past testing of EPYC Milan(X) that should hardly be a surprise. AMD also generally "takes the cake" when it comes to the best value / performance-per-dollar.
https://www.phoronix.com/review/milan-icelake-servers-2023
Intel Xeon Ice Lake vs. AMD EPYC Milan Server Performance, Efficiency & Value In 2023

Small I/O Performance Boost Coming For #Intel #IceLake & #SapphireRapids Servers

-- The Linux kernel Intel P-State driver mistakenly had a check that stopped getting updated after Skylake... This patch gets rid of that HWP I/O boost guard.

https://www.phoronix.com/news/Intel-ICL-SPR-IO-Perf-Boost

Original tweet : https://twitter.com/phoronix/status/1631617190850961408

Small I/O Performance Boost Coming For Intel Ice Lake & Sapphire Rapids Servers

The @Intel 3rd Gen Xeon Scalable #Linux Performance Evolution Since Launch

-- Early 2021 at #IceLake launch versus end of 2022 with the latest #CentOS, @clearlinux & @Ubuntu releases... Nice @IntelSoftware @OpenAtIntel improvements since launch.

https://www.phoronix.com/review/xeon-icelake-eo2022

Original tweet : https://twitter.com/phoronix/status/1603025123417677826

Intel 3rd Gen Xeon Scalable Linux Performance Evolution Since Launch

Die erste Xeon-Prozessorbaureihe für Workstation-PCs setzt auf Intels "Ice Lake" und dreht die Leistungsaufnahme noch einmal ordentlich nach oben.
Intel Xeon W-3300: Workstation-Prozessoren mit bis zu 38 CPU-Kernen
Intel Xeon W-3300: Workstation-Prozessoren mit bis zu 38 CPU-Kernen

Die erste Xeon-Prozessorbaureihe für Workstation-PCs setzt auf Intels "Ice Lake" und dreht die Leistungsaufnahme noch einmal ordentlich nach oben.

Einem Intel-Leaker zufolge plant Apple fest mit einem neuen PC-basierten Mac Pro. Auch technische Details gibt es schon.
Offenbar Mac Pro mit Ice Lake Xeon W-3300 im Anmarsch
Offenbar Mac Pro mit Ice Lake Xeon W-3300 im Anmarsch

Einem Intel-Leaker zufolge plant Apple fest mit einem neuen PC-basierten Mac Pro. Auch technische Details gibt es schon.

Intel weitet die eigene 10-nm-Palette aus: Statt nur mobile Vierkerner gibt es jetzt Server-CPUs mit bis zu 40 Rechenkernen.
40-Kern-Prozessoren: Intel bringt 10-Nanometer-Xeons für (Cloud-)Server
40-Kern-Prozessoren: Intel bringt 10-Nanometer-Xeons für (Cloud-)Server

Intel weitet die eigene 10-nm-Palette aus: Statt nur mobile Vierkerner gibt es jetzt Server-CPUs mit bis zu 40 Rechenkernen.

Intel Adds Memory Encryption, Firmware Security to Ice Lake Chips - Intel's addition of memory encryption to its upcoming 3rd generation Xeon Scalable processors matc... https://threatpost.com/intel-encryption-security-ice-lake-chips/160083/ #intelplatformfirmwareresilience #speculativeexecutionflaws #totalmemoryencryption #xeonscalableplatform #chiplevelprotection #side-channelattacks #memoryencryption #vulnerabilities #intelsecurity #plundervolt #siliconchip #hardware #meltdown #icelake
Intel Adds Memory Encryption, Firmware Security to Ice Lake Chips

Intel's addition of memory encryption to its upcoming 3rd generation Xeon Scalable processors matches AMD's Secure Memory Encryption (SME) feature.

Threatpost - English - Global - threatpost.com