Mastodawn

Bạn có đang xây dựng, đánh giá hoặc triển khai LLM? Nhóm OpenTrustLLM cần ý kiến của bạn để định hướng tính năng, UX, đánh giá và độ tin cậy. Tham gia khảo sát và có cơ hội nhận 7 ngày truy cập Claude Pro + Claude Code. 3 người trúng thưởng, kéo giải trong tuần. Cảm ơn! #OpenTrustLLM #LLM #AI #TrustLLM #KhảoSát #AICommunity #ĐánhGiá #TinCậy

https://www.reddit.com/r/LocalLLaMA/comments/1qld7ap/community_survey_opentrustllm_feature_priorities/

Habr Sep 24, 2024

[Перевод] Полный гид по бенчмаркам LLM: подробный каталог

В последние годы большие языковые модели (large language model, LLM) совершили революцию в мире искусственного интеллекта, став фундаментом для множества различных сфер, от чат-ботов до генерации контента. Однако такой прогресс несёт с собой и новые сложности; в частности, разработчикам нужно обеспечить оптимальность и этичность моделей. При выполнении этой задачи критически важны бенчмарки, представляющие собой стандартизированные способы численного измерения и сравнения моделей ИИ с целью обеспечения согласованности, надёжности и справедливости. В условиях быстрого развития LLM возможности бенчмарков тоже существенно расширились. В этом посте мы представим подробный каталог бенчмарков, разбитый на категории по сложности, динамике, целям оценки, спецификациям конечных задач и типам рисков. Понимание их различий поможет вам разобраться в бенчмарках LLM в условиях их стремительного развития.

https://habr.com/ru/articles/845510/

#Бенчмарки #LLM #AlpacaEval #MTBench #llmarena #TrustLLM #TruthfulQA #SycophancyEval #CyberSecEval

Полный гид по бенчмаркам LLM: подробный каталог

В последние годы большие языковые модели (large language model, LLM) совершили революцию в мире искусственного интеллекта, став фундаментом для множества различных сфер, от чат-ботов до генерации...

Хабр

Forschungszentrum Jülich Mar 15, 2024

#TrustLLM: The European Response to #ChatGPT 🤖💻 - In Europe, a #LargeLanguageModel (#LLM) is being developed that aims to be more reliable, open, transparent, and energy-efficient than ChatGPT. The key to this is Europe's largest computer, currently being built at @fzj_jsc in Jülich. 🏗️🖥️ #exa_JUPITER aims to become Europe's first supercomputer to break the trillion operations per second barrier.

More at @helmholtz: https://www.helmholtz.de/newsroom/artikel/trustllm-die-europaeische-antwort-auf-chatgpt/ /mb

Die europäische Antwort auf ChatGPT

In Europa entsteht ein Large Languange Model, das zuverlässiger, offener, transparenter und energiesparender sein soll als ChatGPT. Der Schlüssel

Helmholtz-Gemeinschaft Deutscher Forschungszentren