I Tested the 1-Bit LLM That Fi...
G42 just released NANDA 87B, an open-source Hindi-English model built on Llama-3.1 70B in partnership with MBZUAI and Cerebras. It promises powerful multilingual capabilities for the community. Dive into the details! #G42 #NANDA87B #Llama31 #OpenSource
🔗 https://aidailypost.com/news/g42-unveils-open-source-hindi-english-nanda-87b-built-llama-31-70b
Llama 3.1 70B đã vượt qua Claude 3.5 Sonnet trên benchmark Arena-Hard-Auto chỉ với một prompt duy nhất! Đạt 96.9% tỷ lệ thắng và chỉ 4% từ chối. Điều này chứng tỏ sức mạnh của kỹ thuật prompt engineering, không cần tinh chỉnh hay LoRA.
#AI #LLM #Llama31 #Claude35Sonnet #PromptEngineering #CôngNghệAI
https://www.reddit.com/r/LocalLLaMA/comments/1pcwffb/llama_31_70b_one_prompt_now_beats_claude_35/
🎯 Supported models include #GPT-OSS-120B, #GPT-OSS-20B, #Llama4 Maverick, #Llama4 Scout, #Llama33-70B, #Llama31-8B, #KimiK2, #Qwen3-32B
🔧 Key features: deterministic inference for faster tool-using agents, cost-effective scaling, approved tool use with clear allowlists, seamless migration capability
📋 Ready-to-use cookbook tutorials with #BrowserBase #MCP, #BrowserUse #MCP, #Exa #MCP, #Firecrawl #MCP, #HuggingFace #MCP, #Parallel #MCP, #Stripe #MCP, #Tavily #MCP
Cisco udostępnia otwarty model AI dla cyberbezpieczeństwa. Ma być skuteczniejszy niż ChatGPT
Firma Cisco zaprezentowała nową, udoskonaloną wersję swojego specjalistycznego modelu językowego do zadań z zakresu cyberbezpieczeństwa.
Nowy model, Llama-3.1-FoundationAI-SecurityLLM-instruct-8B (w skrócie Foundation-sec-8B-Instruct), został zaprojektowany tak, aby działać jak gotowy do użycia, inteligentny asystent dla analityków bezpieczeństwa, rozumiejący polecenia w języku naturalnym zaraz po uruchomieniu.
Nowa wersja jest odpowiedzią na potrzeby społeczności. Jej poprzednik, model bazowy zaprezentowany w kwietniu, udowodnił, że mały, wyspecjalizowany model (8 miliardów parametrów) potrafi w testach branżowych przewyższyć znacznie większe, uniwersalne modele językowe. Brakowało mu jednak prostoty obsługi – wymagał dodatkowej konfiguracji. Nowy Foundation-sec-8B-Instruct rozwiązuje ten problem, łącząc specjalistyczną wiedzę z elastycznością i łatwością użycia znaną z popularnych chatbotów.
Gigantyczna platforma AI pod ochroną Cisco. ClamAV przeskanuje miliony modeli
Mały, ale potężny i gotowy do działania
Foundation-sec-8B-Instruct został wytrenowany wyłącznie na danych z zakresu bezpieczeństwa, a następnie dostrojony do wykonywania poleceń. Dzięki temu potrafi bez dodatkowego treningu realizować takie zadania jak tworzenie podsumowań, analiza sentymentu czy odpowiadanie na złożone pytania dotyczące cyberbezpieczeństwa. Model rozumie role w konwersacji, co pozwala na prowadzenie rozbudowanych dialogów i tworzenie zautomatyzowanych agentów.
Kluczową zaletą jest jego kompaktowa architektura. Model może być uruchomiony na pojedynczym procesorze graficznym (GPU), co czyni go dostępnym także dla organizacji o ograniczonych zasobach sprzętowych. Jest to w pełni otwarte oprogramowanie (open-source), co pozwala na jego wdrażanie lokalnie, w środowiskach odizolowanych od internetu (air-gapped) czy na urządzeniach brzegowych, bez uzależniania się od jednego dostawcy.
Praktyczne zastosowania w SOC i AppSec
Model został już przetestowany w realnych warunkach przez zespoły bezpieczeństwa, w tym w Cisco CSIRT i Cisco XDR. W centrach operacji bezpieczeństwa (SOC) wykorzystano go do klasyfikacji alertów, mapowania wskaźników zagrożeń do taktyk z bazy MITRE ATT&CK czy rekonstrukcji osi czasu incydentów, co znacząco przyspieszyło proces analizy i zredukowało liczbę fałszywych alarmów.
Z kolei zespoły odpowiedzialne za bezpieczeństwo aplikacji (AppSec) użyły modelu do symulacji ścieżek ataku, analizy kodu pod kątem wytycznych OWASP i generowania niestandardowych scenariuszy testowych, co pozwoliło na bardziej proaktywne podejście do zabezpieczania oprogramowania.
Plany na przyszłość
Cisco zapowiada dalszy, intensywny rozwój modelu. W planach jest m.in. rozszerzenie okna kontekstu do 16 tysięcy tokenów (co pozwoli analizować całe zbiory logów), obsługa wejść multimodalnych (np. zrzutów ekranu i logów w jednej konwersacji) oraz stworzenie jeszcze potężniejszej wersji o wielkości 70 miliardów parametrów.
Model Foundation-sec-8B-Instruct jest już publicznie dostępny na platformie Hugging Face, wraz z pełną dokumentacją i przykładami zastosowań.
Sztuczna inteligencja to miecz obosieczny dla naszej cyfrowej tożsamości. Nowy raport Cisco
#AI #AppSec #Cisco #cyberbezpieczeństwo #HuggingFace #Llama31 #LLM #MITREATTCK #modelJęzykowy #news #openSource #SoC #sztucznaInteligencja
EXO Labs ha creado un clúster con cuatro Mac Mini M4 y un MacBook Pro M4 para ejecutar localmente LLMs IA como Llama-3.1 405B de Meta, Nemotron 70B de Nvidia y Qwen 2.5 Coder-32B de Alibaba Cloud
#InteligenciaArtificial #LLM #LLMs #opensource #tech #Llama31 #qwen25 #Nemotron70b #AI #MacMini #MacBookPro
https://mecambioamac.com/exo-labs-conecto-cuatro-mac-mini-m4-para-ejecutar-llama-3-3-70b-de-meta/
Основы промптинга и математические возможности моделей Llama
Меня зовут Грибанов Никита, я Data Scientist в отделе R`n`D&ML компании Raft Digital Solutions, и сегодня я расскажу о больших языковых моделях. На данный момент в мире их существует уже более 39 тысяч! Далее буду называть их хайповым названием LLM (Large Language Model). В этой статье вы сначала узнаете новые или освежите в памяти уже известные вам основы общения с языковыми моделями. Затем разберёте пару реальных примеров настройки запросов и увидите математические возможности Llama 3.2 3B в сравнении с Llama 3.1 8B. Для достижения хороших результатов при решении различных задач с помощью LLM, с ними как и с людьми, нужно уметь правильно общаться. Как же это сделать?
https://habr.com/ru/companies/raft/articles/863478/
#llama32 #llama31 #llm #prompt #promptengineering #mathematics #begginers
Как мы обучали LLM для поиска уязвимостей в смарт-контрактах Solidity
Наша команда в Positive Technologies занимается анализом безопасности смарт-контрактов, исследованием уязвимостей и разработкой инструментов для их обнаружения. Идея использовать LLM для анализа смарт-контрактов Solidity показалась крайне заманчивой. Загрузить код, запустить модель — и она сама находит уязвимости, генерирует отчет, а иногда даже предлагает исправления. Звучит отлично! Но, как показал мой опыт, между «звучит» и «работает» лежит огромная пропасть.
https://habr.com/ru/companies/pt/articles/860476/
#llm #lora #blockchain #solidity #уязвимости #llama31 #chatgpt #промпт