Тестирование производительности видеокарт на примере больших языковых моделей с использованием Llama.cpp

В последнее время большие языковые модели (LLM) становятся все более популярными, но для их эффективного запуска требуется значительная вычислительная мощность. Один из способов запуска LLM локально - использование библиотеки Llama.cpp . В этой статье мы рассмотрим, как тестировать производительность видеокарт для LLM с использованием инструмента llama-bench , входящего в состав Llama.cpp. Дисклеймер: Почему Llama.cpp, а не Ollama? Прежде чем мы приступим к тестированию, важно объяснить, почему мы используем Llama.cpp напрямую, а не Ollama. Ollama – это удобная надстройка, упрощающая установку и запуск LLM. Однако, она добавляет дополнительный слой абстракции, который приводит к снижению производительности и ограничивает контроль над настройками. Llama.cpp же напротив предоставляет прямой доступ к аппаратным ресурсам и позволяет максимально оптимизировать запуск LLM на вашей системе. Если ваша цель – получить максимальную производительность и точно настроить параметры, Llama.cpp – отличный выбор.

https://habr.com/ru/articles/916836/

#бенчмарки #llm #llamacpp #машинное+обучение #видеокарты #нагрузочное_тестирование

Тестирование производительности видеокарт на примере больших языковых моделей с использованием Llama.cpp

В последнее время большие языковые модели (LLM) становятся все более популярными, но для их эффективного запуска требуется значительная вычислительная мощность. Один из способов запуска LLM локально -...

Хабр

100K юзеров за 3 дня — что сломалось после релиза

Привет, Хабр! В этой статье — история запуска Telegram Mini App, куда за трое суток пришло 100.000 реальных пользователей. Покажу, как мы масштабировали Node.js приложения на многоядерных серверах, увеличивали RPS в 10 раз, боролись с N+1 проблемой в MongoDB и снижали нагрузку на CPU. А ещё расскажу как мы быстро настроили мониторинг через Grafana, подключили Cloudflare и интегрировали Sentry. Поделюсь практическими инсайтами о том, на что стоит обращать внимание в первую очередь, и как эти инструменты помогли нам оперативно находить узкие места и устранять сбои в реальном времени. Всё, о чём будет в этой статье, основано на том, что действительно сработало. Кроме того, расскажу, какие моменты мы упустили до запуска. Это разбор с цифрами, графиками и практическими выводами. Он может сэкономить вам время, нервы и деньги, если вы готовитесь к запуску Telegram Mini App или просто работаете с Node.js-приложениями, которые могут оказаться под серьёзной нагрузкой. Это вторая часть истории — про то, как мы запустились и что сломалось первым после релиза. Тут будет про то, как мы это чинили и какие решения приняли, чтобы приложение продолжало работать под нагрузкой. Первая часть про подготовку к запуску доступна здесь .

https://habr.com/ru/articles/916502/

#telegram #telegram_mini_app #nodejs #nextjs #nestjs #mongodb #нагрузочное_тестирование #масштабирование #docker #cloudflare

100K юзеров за 3 дня — что сломалось после релиза

Привет, Хабр! В этой статье — история запуска Telegram Mini App, куда за трое суток пришло 100.000 реальных пользователей. Покажу, как мы масштабировали Node.js приложения на многоядерных серверах,...

Хабр

Часть 1: 100K юзеров за 3 дня — что сломалось

Привет, Хабр! В этой статье — история запуска Telegram Mini App, куда за трое суток пришло 100.000 реальных пользователей. Покажу, как мы масштабировали Node.js приложения на многоядерных серверах, увеличивали RPS в 10 раз, боролись с N+1 проблемой в MongoDB и снижали нагрузку на CPU. А ещё расскажу как мы быстро настроили мониторинг через Grafana, подключили Cloudflare и интегрировали Sentry. Поделюсь практическими инсайтами о том, на что стоит обращать внимание в первую очередь, и как эти инструменты помогли нам оперативно находить узкие места и устранять сбои в реальном времени. Всё, о чём будет в этой статье, основано на том, что действительно сработало. Кроме того, расскажу, какие моменты мы упустили до запуска. Это разбор с цифрами, графиками и практическими выводами. Он может сэкономить вам время, нервы и деньги, если вы готовитесь к запуску Telegram Mini App или просто работаете с Node.js-приложениями, которые могут оказаться под серьёзной нагрузкой. Это первая часть истории — про то, как мы готовились к запуску, что предусматривали и на что делали ставку. Во второй части будет про то, что именно сломалось первым после релиза, как мы это чинили и какие решения приняли, чтобы приложение продолжало работать под нагрузкой.

https://habr.com/ru/articles/914606/

#telegram #telegram_mini_app #nodejs #nextjs #nestjs #mongodb #нагрузочное_тестирование #масштабирование #docker #cloudflare

Часть 1: 100K юзеров за 3 дня — что сломалось

GOAL24 Mini App Привет, Хабр! В этой статье — история запуска Telegram Mini App, куда за трое суток пришло 100 000 реальных пользователей. Покажу, как мы масштабировали Node.js приложения на...

Хабр

xk6-browser как секретное оружие для умного исследования производительности

Привет, Хабр. Меня зовут Антон, я работаю в группе нагрузочного тестирования ЮMoney и занимаюсь исследованием производительности. В статье расскажу про xk6-browser — что у нас было до него, какие у этого решения преимущества и метрики.

https://habr.com/ru/companies/yoomoney/articles/913530/

#xk6 #k6 #исследование_производительности #нагрузочное_тестирование #web_vitals

xk6-browser как секретное оружие для умного исследования производительности

Привет, Хабр. Меня зовут Антон, я работаю в группе нагрузочного тестирования ЮMoney и занимаюсь исследованием производительности. В статье расскажу про xk6-browser — что у нас было до него, какие у...

Хабр

[Перевод] Как провести бенчмарк кластера Camunda 8

«Могу ли я выполнять 10, 100 или 1000 экземпляров процессов в секунду на этом кластере Camunda 8?» Это типичный вопрос, который нам задают в последнее время, и на него можно ответить с помощью бенчмаркинга. Давайте разберёмся в этой увлекательной теме в сегодняшнем посте.

https://habr.com/ru/articles/910898/

#Camunda #Zeeby #бенчмарк #нагрузочное_тестирование #бизнеспроцессы

Как провести бенчмарк кластера Camunda 8

«Могу ли я выполнять 10, 100 или 1000 экземпляров процессов в секунду на этом кластере Camunda 8?» Это типичный вопрос, который нам задают в последнее время, и на него можно ответить с помощью...

Хабр

Нагрузочное тестирование без самообмана: как планировать фазы и правильно снимать метрики

Вам когда‑нибудь казалось, что ваша система по результатам нагрузочного тестирования «летает», а в реальном бою — вдруг не выдерживает нагрузку? На графиках всё красиво: среднее время отклика минимальное, ошибок почти нет. Но на деле сервис падает в самый неподходящий момент. В чём подвох? Часто проблема кроется в том, когда и как именно мы снимаем метрики во время тестирования. В этой статье расскажу, почему важно правильно выбирать временной диапазон для снятия показателей, и как это влияет на достоверность результатов.

https://habr.com/ru/articles/910760/

#тестирование #нагрузочное_тестирование #нагрузочные_тесты #метрики #performance_tests

Нагрузочное тестирование без самообмана: как планировать фазы и правильно снимать метрики

Вам когда‑нибудь казалось, что ваша система по результатам нагрузочного тестирования «летает», а в реальном бою — вдруг не выдерживает нагрузку? На графиках всё...

Хабр

Как понять, выдержит ли ваш сервис нагрузку: метрики, которые должен знать каждый инженер

"А сколько пользователей выдержит наш сервис?" Вопрос звучит просто, но каждый раз ставит в тупик. Его задают на демо, на встречах с заказчиками, менеджеры, иногда даже сами разработчики. Когда-то, ещё в школьные годы, я читала журнал "Хакер" и мечтала, как было бы здорово "ломать серверы" и находить их слабые места. Теперь я занимаюсь этим вполне законно - через нагрузочное тестирование. И, честно говоря, это одно из самых приятных занятий в моей работе. Видеть, как система реагирует на рост нагрузки, оптимизировать запросы, отслеживать поведение метрик в реальном времени - это настоящее инженерное удовольствие. Ведь за каждой цифрой стоят реальные пользователи, для которых важно, чтобы всё работало быстро и стабильно, даже в пиковые моменты. Тем не менее, многие команды избегают нагрузки. "Мы уже проверяли это в начале проекта - зачем снова?" "Сложно, долго, не для нас." "Сделайте отчёт, главное чтобы красиво смотрелось." А иногда - просто страшно увидеть, как система покажет себя в реальных условиях. На самом деле всё гораздо проще. Главное, понимать ключевые метрики и уметь смотреть на них не как на сухие цифры, а как на отражение реального опыта ваших пользователей.

https://habr.com/ru/articles/909002/

#нагрузочное_тестирование #нагрузочные_тесты #метрики #перфоманс #response_time #rate_limiting

Как понять, выдержит ли ваш сервис нагрузку: метрики, которые должен знать каждый инженер

"А сколько пользователей выдержит наш сервис?" Вопрос звучит просто, но каждый раз ставит в тупик. Его задают на демо, на встречах с заказчиками, менеджеры, иногда даже сами разработчики. Когда-то,...

Хабр

TRex: установка, настройка и запуск тестов производительности NGFW

Сейчас многие компании в рамках импортозамещения активно ищут замену зарубежному сетевому оборудованию. Наиболее остро вопрос замены присутствует в сегменте межсетевых экранов. Важным этапом выбора является нагрузочное тестирование, которое позволяет убедиться, справится ли устройство с обработкой боевого трафика в инфраструктуре. В прошлой статье я рассказывал про нюансы проведения пилотных проектов и описал способы нагрузочного тестирования. В этой статье я затронул практику и описал подробную настройку стенда для проведения нагрузочного тестирования. Погрузиться

https://habr.com/ru/companies/pt/articles/902930/

#trex #ngfw #настройка #нагрузочное_тестирование #стенд_для_тестировщиков #grafana #influxdb #udp #пропускная_способность #тестирование

TRex: установка, настройка и запуск тестов производительности NGFW

Всем привет! Сейчас многие компании в рамках импортозамещения активно ищут замену зарубежному сетевому оборудованию. Наиболее остро вопрос замены присутствует в сегменте межсетевых экранов....

Хабр

Реестр систем ДОМ.РФ – «единое поле координат» для управления ИТ и синхронизации с командами

Привет, Хабр! Эта статья про то, как команда корпоративной архитектуры ДОМ.РФ выстраивала управление ИТ на основе единого реестра автоматизированных систем. В ней мы поделимся опытом, как и почему и пришли к этому решению, а также расскажем про плюсы и минусы данного подхода. Предыстория Для начала объясним, что из себя представляет группа ДОМ.РФ и её ИТ-ландшафт. Группа компаний ДОМ.РФ реализует нацпроекты в области жилищного строительства с 1997 года и развивает цифровизацию российской строительной отрасли и банковской сферы. В группу входит множество направлений – от собственного банка до лифтостроительного завода. Все направления имеют ИТ-составляющую и свои оцифрованные процессы.

https://habr.com/ru/companies/domrf/articles/901434/

#тестирование #нагрузочное_тестирование #боты #тестировщик #регрессионное_тестирование #тестирование_производительности

Реестр систем ДОМ.РФ – «единое поле координат» для управления ИТ и синхронизации с командами

Привет, Хабр! Эта статья про то, как команда корпоративной архитектуры ДОМ.РФ выстраивала управление ИТ на основе единого реестра автоматизированных систем. В ней мы поделимся опытом, как и почему и...

Хабр

Задолженности в Mireapay

Деньги - кровь экономики, а кредиты - уровень сахара. Ни одна современная платёжная система не может считаться полноценной, если отсутствует возможность кредитования производства - то, без чего современное производство не может существовать в принципе. Если вам интересно, как Mireapay работает с задолженностями и сможет ли наконец автор получить твердо и четко сервис с производительностью 100 рпс, то добро пожаловать под кат! Продолжить наступление

https://habr.com/ru/articles/884116/

#postgresql #нагрузочное_тестирование #r2dbc #java #высокая_производительность #платежная_система #долги #кредиты #депозиты #кредитные_карты_и_платежные_системы

Задолженности в Mireapay

Введение Долги - важнейшая часть современной экономики, тема эта бездонна и может поглотить тысячи человекочасов, но современная платёжная система обязана уметь оперировать такими сущностями. В данной...

Хабр