The Evolution of x86 SIMD: From SSE to AVX-512
https://bgslabs.org/blog/evolution-of-x86-simd/
#HackerNews #x86 #SIMD #SSE #AVX512 #technology #evolution #programming
The Evolution of x86 SIMD: From SSE to AVX-512
https://bgslabs.org/blog/evolution-of-x86-simd/
#HackerNews #x86 #SIMD #SSE #AVX512 #technology #evolution #programming
Ускорение вычислений в алгоритме DRS-виртуализации через векторизацию
Переписать решение с Python на Go и получить ускорение в 35 раз — звучит приятно. Но можно ведь пойти дальше, вспомнить о возможностях современных процессоров и увеличить отрыв Go до 200 раз! Статья написана по мотивам доклада для
https://habr.com/ru/companies/oleg-bunin/articles/980710/
#avx #avx2 #avx512 #бэкенд #разработка #go #golang #phyton #ускорение #ускорение_кода
Tạo động cơ LLM 1.58-bit chạy 117 token/giây trên 1 nhân CPU với Rust và AVX-512, nhưng bị lỗi ở lớp Activation khiến đầu ra luôn là <unk>. Cần hỗ trợ về: (1) Weight tying trong BitNet – thiếu hệ số tỉ lệ? (2) Cách scale tích lũy nguyên từ VPOPCNTDQ trước khi đưa vào RMSNorm/SiLU. Dự án mã nguồn mở, zero-copy, không heap allocation. #Rust #AVX512 #LLM #MachineLearning #AI #R3Engine #BitNet #LocalAI #HPC #Inference #trítuệnhân tạo #môhìnhtonngẫu #xửlýsongsong #tinhoccao
https://www.reddit.
AVX-512: First Impressions on Performance and Programmability
#HackerNews #AVX512 #Performance #Programmability #TechInsights
Intel CPUのAVX-512ユニットの5番ポートは物理的に遠い:文献調査編
https://qiita.com/Terminus-IMRC/items/659d4fd502a96baab9c5?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items
Full Unicode Search at 50× ICU Speed with AVX‑512
https://ashvardanian.com/posts/search-utf8/
#HackerNews #FullUnicodeSearch #AVX512 #ICUSpeed #UTF8Optimization #TechInnovation
Эпоха универсальных CPU закончилась: как выбрать между P- и E-ядрами Xeon 6
Привет! На связи Максим Башмаков. Мы в Selectel производим, собираем и внедряем в продакшен серверы на Intel ® Xeon ® 6 , используя обе архитектуры: P-ядра (Granite Rapids) и E-ядра (Sierra/Clearwater Forest). Я руковожу лабораторией тестирования «железа», и наша задача — выявлять истинные характеристики оборудования, которые, как показывают наши исследования, далеко не всегда совпадают с маркетинговыми заявлениями вендоров. Представляем вашему выжимку нашего практического опыта работы с реальными серверными нагрузками, подкрепленную результатами тестов и выводами. Подробности под катом!