金のニワトリ (@gosrum)

RTX 5090 환경에서 Nemotron-Cascade-2-30B-A3B(Q4_K_M)의 llama-bench 결과를 공유했다. prefill은 약 13000 tps, decord는 약 285 tps로, 최신 GPU에서의 추론 성능을 보여주는 벤치마크 트윗이다.

https://x.com/gosrum/status/2035545070355792319

#nvidia #rtx5090 #llamabench #benchmark #llm

金のニワトリ (@gosrum) on X

Nemotron-Cascade-2-30B-A3B(Q4_K_M)のllama-bench結果@ RTX 5090 ・prefill:〜13000tps ・decord:〜285tps

X (formerly Twitter)

金のニワトリ (@gosrum)

vibe-local에서 Nemotron-Cascade-2-30B-A3B(Q4_K_M)을 ts-bench로 평가한 결과를 공유했다. 결론은 Qwen3.5가 더 강하다는 내용으로, 로컬 추론 모델 성능 비교와 벤치마크 결과를 다룬 기술적 ट्वीट이다.

https://x.com/gosrum/status/2035565170303676696

#nvidia #nemotron #benchmark #llm #qwen

金のニワトリ (@gosrum) on X

vibe-local + Nemotron-Cascade-2-30B-A3B(Q4_K_M)をts-benchで評価しました 結論:Qwen3.5は強い

X (formerly Twitter)

AI Notkilleveryoneism Memes (@AISafetyMemes)

2개월 만에 10배 성능 향상이 있었다는 매우 간단한 성과 공유 트윗입니다. 구체적 대상은 없지만, AI 모델이나 시스템의 빠른 개선을 시사하는 내용으로 보입니다.

https://x.com/AISafetyMemes/status/2035371517358309674

#ai #performance #improvement #benchmark

AI Notkilleveryoneism Memes ⏸️ (@AISafetyMemes) on X

***10x*** improvement in ***2 months***

X (formerly Twitter)

AmigaOS 4: AmigaDiskBench v2.6

AmigaDiskBench is a modern, high-performance disk benchmarking utility specifically designed for AmigaOS 4.1 Final Edition. It provides a robust, ReAction-based GUI to measure, analyze, and visualize the performance of various storage devices, filesystems, and hardware configurations. Version 2.6 provides comprehensive code quality audit, Amiga-style versioning, and distribution packaging.

https://www.amiga-news.de/en/news/AN-2026-03-00083-EN.html

#AmigaOS4 #benchmark

amiga-news.de - AmigaOS 4: AmigaDiskBench v2.6

Yet another #LLM #benchmark. 😉

EsoLang-Bench: Evaluating genuine reasoning in large language models via esoteric #programming languages https://esolang-bench.vercel.app/ #esolang #GenAI #AI

EsoLang-Bench: Evaluating LLMs via Esoteric Programming Languages

EsoLang-Bench: A benchmark of 80 problems across 5 esoteric languages to evaluate genuine reasoning in LLMs.

Сколько на самом деле стоит LOG_INFO(): benchmark библиотек логирования C++

Логирование есть практически в каждом C++ проекте. Почти любой сервис, демон или библиотека рано или поздно обрастает строками вроде LOG_INFO(...) или logger.debug(...) . Чаще всего библиотека выбирается по привычке или популярности — spdlog, quill, easylogging++ и т.п. При этом редко кто проверяет, какую цену приложение платит за логирование . В высоконагруженных системах логирование может выполняться:

https://habr.com/ru/articles/1012874/

#c++ #logging #benchmark #performance #spdlog #logme #quill #highperformance

Сколько на самом деле стоит LOG_INFO(): benchmark библиотек логирования C++

Логирование есть практически в каждом C++ проекте. Почти любой сервис, демон или библиотека рано или поздно обрастает строками вроде LOG_INFO(...) или logger.debug(...) . Чаще всего библиотека...

Хабр

Lossfunk (@lossfunk)

Esolang-Bench에 대한 질문에 답하며, 이 프로젝트는 호기심 기반으로 시작됐고 인간의 sample-efficiency와 OOD generalization을 이해하는 데 관심이 있었다고 설명한다. 모델이 zero/few-shot으로 얼마나 학습하는지 보는 벤치마크의 목적을 공유한다.

https://x.com/lossfunk/status/2034832598930006135

#llm #benchmark #research #generalization

Lossfunk (@lossfunk) on X

@daniel_mac8 https://t.co/76JNICAMas

X (formerly Twitter)

BullshitBench measures whether AI models challenge nonsensical prompts instead of confidently answering them, created by Peter Gostev.

https://petergpt.github.io/bullshit-benchmark/viewer/index.v2.html

https://github.com/petergpt/bullshit-benchmark

#llm #bench #ai #bullshitbench #benchmark

BullshitBench Viewer

[Cursor, 자체 개발 AI 모델 Composer 2 출시 - 프런티어급 성능에 저렴한 가격

Cursor가 자체 개발한 코딩 특화 AI 모델 Composer 2를 출시했으며, 주요 벤치마크에서 큰 성능 향상을 보였습니다. 특히 Composer 1.5에서 2로 업그레이드되면서 성능이 크게 향상되었습니다. Composer 2는 저렴한 가격과 높은 성능으로 코딩 에이전트 시장에서 경쟁력을 갖추고 있습니다.

https://news.hada.io/topic?id=27682

#cursor #composer2 #codingai #llm #benchmark

Cursor, 자체 개발 AI 모델 Composer 2 출시 - 프런티어급 성능에 저렴한 가격

<p>Cursor가 자체 개발한 코딩 특화 AI 모델 Composer 2를 공개했습니다.</p> <h2>성능</h2> <p>모든 주요 벤치마크에서 전작 대비 큰 폭의 향상을...

GeekNews