Akshay (@akshay_pachaar)

UnslothAI가 PyTorch의 기본 autograd 대신 OpenAI의 Triton 언어로 자체 backpropagation 커널을 구현해 성능을 높인 점을 소개한다. PyTorch Autograd와 Unsloth Triton Kernels를 비교하며, 딥러닝 학습 최적화와 커스텀 커널 설계 측면에서 주목할 만한 기술적 성과를 강조한다.

https://x.com/akshay_pachaar/status/2046205779154481522

#pytorch #triton #unsloth #autograd #deeplearning

Akshay 🚀 (@akshay_pachaar) on X

PyTorch Autograd vs. Unsloth Triton Kernels. The core engineering behind UnslothAI has always been impressive! Instead of relying on PyTorch's default autograd for backpropagation, Unsloth built their own backprop kernels from scratch in OpenAI's Triton language (a Python-based

X (formerly Twitter)
Les États-Unis admettent la perte d'un drone Triton d'une valeur de 238 millions de dollars lors d'un conflit avec l'Iran

Les États-Unis ont finalement admis la perte d'un drone MQ-4C Triton, équipé de matériel de surveillance sensible, dans le golfe Persique le 9 avril, suite à la perte soudaine et totale de son signal de suivi.

SabaNet - Yemen News Agency
Un drone MQ-4C Triton à 238M$ aurait été abattu près d’Ormuz.
https://saba.ye/fr/news3687483.htm #Space #Science #Innovation #AerospaceEngineering #Drones #ISR #Triton #NewSpace
Les États-Unis admettent la perte d'un drone Triton d'une valeur de 238 millions de dollars lors d'un conflit avec l'Iran

Les États-Unis ont finalement admis la perte d'un drone MQ-4C Triton, équipé de matériel de surveillance sensible, dans le golfe Persique le 9 avril, suite à la perte soudaine et totale de son signal de suivi.

SabaNet - Yemen News Agency
What makes this especially notable is the uncertainty: the loss is confirmed, but reporting also says there is no confirmed evidence the aircraft went down in Iranian territory.
#MQ4C #Triton #USNavy #DroneLoss #MilitaryAviation #Geopolitics #PersianGulf

Kernel-Smith: A Unified Recipe for Evolutionary Kernel Optimization

#CUDA #Triton

https://hgpu.org/?p=30721

Kernel-Smith: A Unified Recipe for Evolutionary Kernel Optimization

We present Kernel-Smith, a framework for high-performance GPU kernel and operator generation that combines a stable evaluation-driven evolutionary agent with an evolution-oriented post-training rec…

hgpu.org

[Перевод] Ускоряем игру «Жизнь» с помощью CUDA / Triton

Давайте рассмотрим реализацию конвеевской игры «Жизнь» при помощи графической карты. Я хочу поэкспериментировать с разными библиотеками и методиками, чтобы понять, как обеспечить наилучшую производительность. Начнём мы с простого и постепенно будем повышать сложность. Игра «Жизнь» — это простой клеточный автомат, поэтому она должна хорошо поддаваться GPU-ускорению. Правила просты: каждая ячейка в двухмерной сетке или жива, или мертва. На каждом шаге мы подсчитываем живых соседей ячейки (включая диагонали). Если ячейка жива, она остаётся живой, если живы два или три её соседа. В противном случае она умирает. Если клетка мертва, она оживает, если живы ровно три соседа. Из этих простых правил возникает потрясающий объём сложности, о котором написаны подробные статьи. Для простоты я буду рассматривать только сети N×N и пропущу вычисления на краях. Всё будет работать на Nvidia A40, а бенчмарк производительности я буду проводить при N=2 16 . Пока мы будем хранить каждую ячейку в виде 1 байта, поэтому весь массив займёт 4 ГБ. Весь код выложен в репозитории GitHub .

https://habr.com/ru/articles/1018126/

#cuda #triton #игра_жизнь

Ускоряем игру «Жизнь» с помощью CUDA / Triton

Давайте рассмотрим реализацию конвеевской игры «Жизнь»  при помощи графической карты. Я хочу поэкспериментировать с разными библиотеками и методиками, чтобы понять, как обеспечить наилучшую...

Хабр
Ein Dataminer hat in Update-Dateien Hinweise auf eine mögliche neue Abo-Stufe namens #Triton für den #Xbox #GamePass gefunden. #Microsoft bietet damit wohl Zugriff auf eine ganz spezielle Gruppe von Spielen. https://winfuture.de/news,157799.html?utm_source=Mastodon&utm_medium=ManualStatus&utm_campaign=SocialMedia
Xbox Game Pass: Microsoft plant wohl eine besondere neue Abo-Stufe

Nach dem Wechsel in der Chefetage von Xbox deuten interne Daten auf strukturelle Anpassungen beim Game Pass hin. In den Dateien eines aktuellen Updates verstecken sich Hinweise auf eine bislang unangekündigte Abo-Stufe mit einem speziellen Spielefokus.

WinFuture.de

DRTriton: Large-Scale Synthetic Data Reinforcement Learning for Triton Kernel Generation

#Triton #CUDA #LLM

https://hgpu.org/?p=30706

DRTriton: Large-Scale Synthetic Data Reinforcement Learning for Triton Kernel Generation

Developing efficient CUDA kernels is a fundamental yet challenging task in the generative AI industry. Recent researches leverage Large Language Models (LLMs) to automatically convert PyTorch refer…

hgpu.org

AutoKernel: Autonomous GPU Kernel Optimization via Iterative Agent-Driven Search

#CUDA #Triton #Package

https://hgpu.org/?p=30703

AutoKernel: Autonomous GPU Kernel Optimization via Iterative Agent-Driven Search

Writing high-performance GPU kernels is among the most labor-intensive tasks in machine learning systems engineering. We present AutoKernel, an open-source framework that applies an autonomous agen…

hgpu.org