xman (@xuconz)

단일 요청·단일 사용자 환경에서 배칭 없이 Qwen3.5-35B-A3B 모델을 vLLM으로 RTX PRO 6000 96GB 한 장에 구동한 벤치마크입니다. 한 프롬프트 512 토큰 생성에 3.03초(약 169 tok/s) 성능을 기록했으며, 동시 부하에서 연속 배칭을 적용하면 총 처리량은 더 증가할 것이라는 설명입니다.

https://x.com/xuconz/status/2028375501426008508

#qwen #vllm #benchmark #rtxpro6000 #throughput

xman (@xuconz) on X

@ivanfioravanti @danieltvela @alexocheema @Prince_Canuma Single request, single user — no batching at all. One prompt, 512 completion tokens, 3.03s wall clock = ~169 tok/s raw generation speed. Running Qwen3.5-35B-A3B on a single RTX PRO 6000 96GB via vLLM. With continuous batching under concurrent load, aggregate throughput would go

X (formerly Twitter)

Когда кажется, что живёшь впустую: ТОС-подход к выбору приоритета в личных задачах

Иногда в человеке возникает странное чувство. Ты вроде занят. В календаре что-то стоит. Руки что-то делают. Мозг даже устал. Но внутри — неприятное, липкое ощущение: я делаю что-то не то . Как будто ты идёшь, но не приближаешься. Как будто вместо движения — имитация движения . Как будто каждый следующий час просто откусывает кусок жизни — и не оставляет ничего, кроме “я был занят”. Я заметил это чувство и сначала попытался отмахнуться: “ну, просто устал”, “надо собраться”, “завтра будет легче”. Но оно не уходило. И тогда я сделал непривычную вещь: начал разбирать не себя, а задачу . И вдруг стало ясно: проблема не в том, что я ленивый или недостаточно дисциплинированный. Проблема в другом: у меня нет аргументов, почему я должен делать сейчас именно эту задачу. А если честных аргументов нет — появляются сомнения. И эти сомнения разъедают мотивацию намного сильнее, чем усталость. Дальше — хуже: я смотрю на список дел и вижу десятки задач. И все они… как будто равнозначны . Как выбрать?

https://habr.com/ru/articles/1002038/

#ограничение #ТОС #Теория_ограничений #Throughput #WIP #приоритизация #неопределённость #тест_гипотез #Ozon #Телеграм

Когда кажется, что живёшь впустую: ТОС-подход к выбору приоритета в личных задачах

Иногда в человеке возникает странное чувство. Ты вроде занят. В календаре что-то стоит. Руки что-то делают. Мозг даже устал. Но внутри — неприятное, липкое ощущение: я делаю что-то не то . Как будто...

Хабр

Theo - t3.gg (@theo)

작성자는 Codex로 병렬 에이전트 3개 이상을 2시간 넘게 운용했고, 할당된 윈도우(5시간)와 주간 할당량의 극한을 노려도 사용률이 낮아 한계에 도달하지 못했다는 경험을 공유합니다. Codex의 처리량·한계 관련 실사용 데이터성 메시지입니다.

https://x.com/theo/status/2023718038198251904

#codex #agents #throughput #limits

Theo - t3.gg (@theo) on X

I've had 3 or more agents running in parallel with Codex for 2+ hours. I've used 8% of my 5-hour window. 2% of my weekly. I am literally trying to hit the limits and still can't.

X (formerly Twitter)
HPN-SSH 的使用情境以及效果

以前就知道 SSH over SSH tunnel 的 latency & throughput 都不算太好 (像是透過 ProxyJump 的情境),然後也知道 HPN-SSH 有對這塊提出改善的方案,但一直都沒有研究太多。 最近剛好遇到要從台灣透過 AWS 上 us-east-1 的跳板機連到內部網路的...

Gea-Suan Lin's BLOG
Microsoft apresenta Azure HorizonDB: a nova “besta” de bases de dados PostgreSQL na cloud

 Durante a conferência Ignite, a gigante tecnológica revelou o Microsoft Azure HorizonDB, uma nova base de dados PostgreSQL na cloud que promete redefinir o des

TugaTech
brahma-firelight

A blazing-fast, fire-and-forget orchestrator built with Rust and JavaScript, designed for ultra-low-latency task routing, message triggering, and heavyweight logic execution — all without blocking. A native Rust AddOn for NodeJS, BunJS and DenoJS.. Latest version: 1.5.16, last published: a month ago. Start using brahma-firelight in your project by running `npm i brahma-firelight`. There are no other projects in the npm registry using brahma-firelight.

npm

An overengineered solution to `sort | uniq -c` with 25x throughput (hist)

https://github.com/noamteyssier/hist-rs

#HackerNews #overengineered #solution #sort #uniq #throughput #hist #GitHub #Rust

GitHub - noamteyssier/hist-rs: An efficient unique-line counter (25x over `sort | uniq -c`)

An efficient unique-line counter (25x over `sort | uniq -c`) - noamteyssier/hist-rs

GitHub
Preparing for the .NET 10 GC (DATAS) - .NET Blog

Learn how DATAS in .NET 10 adapts heap size, what changes to expect versus previous Server Garbage Collection (GC) behavior, and how to decide whether to tune or disable it.

.NET Blog
Preparing for the .NET 10 GC (DATAS) - .NET Blog

Learn how DATAS in .NET 10 adapts heap size, what changes to expect versus previous Server Garbage Collection (GC) behavior, and how to decide whether to tune or disable it.

.NET Blog