Apple MLX vs. llama.cpp: compared and benchmarked [video]

Protorikis가 공개한 벤치마크 영상에서는 Apple MLX와 llama.cpp(GGUF 런타임 포함)를 실제 사용 시나리오에서 비교했다. 테스트는 MacBook Pro M3 Max 환경에서 Qwen3.6 35B 모델을 대상으로 진행되었으며, MLX가 특정 상황에서 속도 향상을 보이나, 프롬프트 캐싱 부재, 메모리 압박, 불안정한 성능 문제도 발견되었다. Ollama의 MLX 엔진(NVFP4 포함)과 LM Studio 백엔드도 함께 비교되어, GGUF와 MLX 중 선택 시 참고할 만한 실무적 인사이트를 제공한다. 이 영상은 MLX와 llama.cpp의 실제 성능 차이를 이해하고자 하는 AI 개발자에게 유용하다.

https://www.youtube.com/watch?v=ZwCbChJWXkQ

#applemlx #llama.cpp #benchmark #runtime #gguf

Apple MLX vs llama.cpp: Which is Really Faster? (4 Runtimes - Ollama Included)

YouTube

[Node.js 26.0.0 공식 출시

Node.js 26.0.0이 공식 출시되었으며, Temporal API가 기본 활성화되고 V8 엔진이 14.6으로 업그레이드되었습니다. 출시일은 2026년 5월 6일이며, 2026년 10월 LTS 전환 후 2029년 5월까지 지원될 예정입니다.

https://news.hada.io/topic?id=29253

#nodejs #javascript #temporal #v8 #runtime

Node.js 26.0.0 공식 출시 | GeekNews

주요 일정 및 지원 계획출시일: 2026년 5월 6일 공식 출시 (당초 4월 22일로 예정되었으나 Temporal API 관련 이슈로 소폭 연기)LTS 전환: 2026년 10월에 LTS로 지정될 예정지원 종료: 2029년 5월까지 유지보수 및 보안 업데이트가 제공됨주요 업데이트 및 변화Temporal API 기본 활성화: 기존 Date 객체를 보완하여 날짜

GeekNews

Show HN: Platos – like Claude Managed Agents but open-source and self-hosted
Platos는 Claude Managed Agents와 유사한 기능을 제공하는 오픈소스 AI 에이전트 런타임으로, 자체 호스팅이 가능하다. 스트리밍 채팅, 도구 호출, 다중 에이전트 지원, 내구성 실행, 멀티테넌시, 다양한 LLM 공급자 지원 등 생산 환경에 필요한 기능을 모두 포함한다. 사용자는 인프라와 데이터, 모델 선택권을 완전히 소유할 수 있으며, Docker Compose 한 번으로 쉽게 배포할 수 있다. Platos는 오픈소스 커뮤니티와 협력하며, 보안과 확장성도 고려한 설계가 돋보인다.

https://github.com/winsenlabs/platos

#opensource #aiagent #selfhosted #llm #runtime

GitHub - winsenlabs/platos: Platos is the only runtime infrastructure you will need to deploy, monitor and manage agents in production!

Platos is the only runtime infrastructure you will need to deploy, monitor and manage agents in production! - winsenlabs/platos

GitHub

Working Was the Beginning
2026년 1월부터 시작된 JavaScript 런타임 'Ant' 개발 과정에서 초기 작동 단계는 프로젝트의 시작일 뿐이며, 이후 신뢰성과 정확성을 확보하는 데 더 많은 시간이 필요하다는 점이 강조된다. Ant는 단순한 런타임을 넘어 파일 시스템, 패키지 매니저, JIT 컴파일러, 가비지 컬렉터 등 복잡한 환경과 최적화 기능을 갖춘 완전한 실행 환경으로 발전했다. 성능 향상은 단순한 단계가 아니라 아키텍처의 핵심이 되었으며, 객체 모델과 메모리 관리 등 내부 구조의 세밀한 개선이 이루어졌다. 이 과정은 작은 프로젝트가 점차 복잡한 컴파일러 및 런타임 환경으로 성장하는 전형적인 엔진 개발 과정을 보여준다.

https://themackabu.dev/blog/ant-part-two

#javascript #runtime #compiler #jit #garbagecollector

working was the beginning | themackabu.dev

In January, I wrote that I had built a JavaScript runtime in a month. The post was true, and at the time I thought it was the story...

GitHub - bring-shrubbery/ml-sharp-web: Web playground to create Gaussian Splats using Apple's ml-sharp model.

Web playground to create Gaussian Splats using Apple's ml-sharp model. - bring-shrubbery/ml-sharp-web

GitHub
GitHub - Sambigeara/pollen: Distributed WASM runtime. Workloads place themselves over a zero-trust mesh. One static binary.

Distributed WASM runtime. Workloads place themselves over a zero-trust mesh. One static binary. - Sambigeara/pollen

GitHub

Christopher Nolan Reveals ‘The Odyssey’ Is “Shorter” Than ‘Oppenheimer’ Runtime, But Still “An Epic Film”
#News #ChristopherNolan #Oppenheimer #RunTime #TheOdyssey

https://deadline.com/2026/04/christopher-nolan-odyssey-shorter-oppenheimer-runtime-1236876179/

Christopher Nolan Reveals ‘The Odyssey’ Is “Shorter” Than ‘Oppenheimer’ Runtime, But Still “An Epic Film”

Despite using more than 2 million feet of film on 'The Odyssey', Christopher Nolan is keeping the cinematic experience under three hours.

Deadline

The Mandalorian and Grogu has a runtime

#TheMandalorianandGrogu #StarWars #FanthaTracks #TheMandalorianandGrogu #runtime 

The Mandalorian and Grogu now has a run time,

Read the whole story at the below link:

https://www.fanthatracks.com/news/film-music-tv/the-mandalorian-and-grogu-has-a-runtime/

cocktail peanut (@cocktailpeanut)

AI4AnimationPy가 애니메이션 엔진 자체로 동작하는 AI 기반 프레임워크라는 설명이다. 3D 모션 에셋을 사전 생성하지 않고 런타임에 생성하는 방식으로, 애니메이션 제작 파이프라인을 바꿀 수 있는 흥미로운 AI 응용 사례다.

https://x.com/cocktailpeanut/status/2048477248437522577

#aianimation #framework #animation #runtime #3d

cocktail peanut (@cocktailpeanut) on X

It's easy to get confused what this is, so let me explain my understanding. AI4AnimationPy IS the animation engine. There is no exporting and that is the point. Instead of having to generate 3D motion assets ahead of time, this AI-powered framework generates them at runtime

X (formerly Twitter)

Saturday runtime deep dive: Go's network poller 🔍

How can you write `conn.Read(buf)` (looks blocking!) and still serve a million connections on a handful of threads?

Spoiler: a smart waiter, a little note per socket, and a careful 3-step parking dance.

Drops Monday

Want these articles directly in your inbox? Subscribe to the newsletter: https://internals-for-interns.com/newsletter/

#golang #runtime

Subscribe to the Newsletter | Internals for Interns

Get weekly deep dives into software internals delivered straight to your inbox. Learn how compilers, databases, and systems work under the hood—explained in an approachable way. What You’ll Get 📬 One email per week with a new deep dive into software internals 🎯 Focused topics like Go compiler phases, PostgreSQL query execution, Git internals, and more

Internals for Interns