https://github.com/blacksky-algorithms/atproto #reinventingthewheel #Blacksky #GitHub #techhumor #appdevelopment #HackerNews #ngated
Unconventional PostgreSQL Optimizations
https://hakibenita.com/postgresql-unconventional-optimizations
#HackerNews #PostgreSQL #Optimizations #Database #Performance #Tech #Tips #HackerNews
A detailed blog post on optimizing multi-threaded matrix multiplication for x86 processors to achieve OpenBLAS/MKL-like performance. Tags: High-performance GEMM on CPU, Fast GEMM on CPU, High-performance matrix multiplication on CPU, Fast Matrix Multiplication on CPU, Matrix multiplication in C, GEMM in C, Matrix multiplication acceleration.
Features deployed for https://apply.coop!
- Main job listing paginates 25 jobs at time for faster page loads
- Atom/RSS/JSON item titles have working location, pay range, and workplace info
- Jobs/Workplaces sitemaps to help find jobs easier via search engines
Does it matter if we are compiling with optimizations off (O0) or optimizations on (O3) if the problem is memory bound? Let’s find out…
#optimizations #performance #instructionlevelparallelism #ilp #compiler #gcc #memorybound
https://johnnysswlab.com/an-optimizing-compiler-doesnt-help-much-with-long-instruction-dependencies/
Armbian Updates: OMV support, boot improvents, Rockchip optimizations
#HackerNews #Armbian #Updates #OMV #Support #Boot #Improvements #Rockchip #Optimizations
This week, the Armbian development team pushed several noteworthy enhancements, with improvements spanning user experience, bootloader upgrades, and broader system support. Notably, this week saw the debut of OpenMediaVault in Armbian’s software installer, a move that brings plug-and-play NAS functionality to supported boards. OpenMediaVault is a feature-rich platform that enables users to turn single-board computers
Часть 3. Векторизация на Go: CGo, транзакции, компиляторы, поддержка, байтовые инструкции
В первой части статьи мы рассмотрели , как можно вручную ускорить Go-код с помощью векторизации и SIMD-инструкций, реализованных через Go-ассемблер. Написали простую, но показательно быструю реализацию sliceContains и увидели, что даже базовая векторизация может дать ускорение в 10–14 раз по сравнению со стандартной реализацией. Во второй части статьи погрузились в практическое применение SIMD в Go-ассемблере, реализовали функцию SliceContainsV1 и изучили, как с помощью VADD, VDUP и других инструкций можно добиться 10–14-кратного ускорения простых задач. Но возможности оптимизации Go-программ на этом не заканчиваются. В этой части мы пойдём дальше: рассмотрим другие техники низкоуровневой оптимизации — от использования C-кода и альтернативных компиляторов с поддержкой векторизации до работы с аппаратными транзакциями памяти на Intel. Поговорим о том, как внедрять ассемблер в продакшен-код, не боясь за его поддержку, и как обойти ограничения стандартного Go-компилятора. Привет, Хабр! Меня зовут Игорь Панасюк, я работаю в Яндекс, преподаю в ИТМО, а также в свободное время выступаю на конференциях, делюсь опытом в соцсетях и помогаю развитию Go-сообщества, веду телеграм-канал и youtube-канал. Если вы уже знакомы с базовыми техниками векторизации, эта часть поможет глубже понять, как устроены продвинутые способы ускорения Go-кода и на что стоит обратить внимание при работе с архитектурно-зависимыми оптимизациями.
https://habr.com/ru/companies/oleg-bunin/articles/905972/
#golang #optimizations #компилятор #gccgo #gollvm #ассемблер #word #byte #производительность