G42 just released NANDA 87B, an open-source Hindi-English model built on Llama-3.1 70B in partnership with MBZUAI and Cerebras. It promises powerful multilingual capabilities for the community. Dive into the details! #G42 #NANDA87B #Llama31 #OpenSource

🔗 https://aidailypost.com/news/g42-unveils-open-source-hindi-english-nanda-87b-built-llama-31-70b

Llama 3.1 70B đã vượt qua Claude 3.5 Sonnet trên benchmark Arena-Hard-Auto chỉ với một prompt duy nhất! Đạt 96.9% tỷ lệ thắng và chỉ 4% từ chối. Điều này chứng tỏ sức mạnh của kỹ thuật prompt engineering, không cần tinh chỉnh hay LoRA.

#AI #LLM #Llama31 #Claude35Sonnet #PromptEngineering #CôngNghệAI

https://www.reddit.com/r/LocalLLaMA/comments/1pcwffb/llama_31_70b_one_prompt_now_beats_claude_35/

🎯 Supported models include #GPT-OSS-120B, #GPT-OSS-20B, #Llama4 Maverick, #Llama4 Scout, #Llama33-70B, #Llama31-8B, #KimiK2, #Qwen3-32B

🔧 Key features: deterministic inference for faster tool-using agents, cost-effective scaling, approved tool use with clear allowlists, seamless migration capability

📋 Ready-to-use cookbook tutorials with #BrowserBase #MCP, #BrowserUse #MCP, #Exa #MCP, #Firecrawl #MCP, #HuggingFace #MCP, #Parallel #MCP, #Stripe #MCP, #Tavily #MCP

Cisco udostępnia otwarty model AI dla cyberbezpieczeństwa. Ma być skuteczniejszy niż ChatGPT

Firma Cisco zaprezentowała nową, udoskonaloną wersję swojego specjalistycznego modelu językowego do zadań z zakresu cyberbezpieczeństwa.

Nowy model, Llama-3.1-FoundationAI-SecurityLLM-instruct-8B (w skrócie Foundation-sec-8B-Instruct), został zaprojektowany tak, aby działać jak gotowy do użycia, inteligentny asystent dla analityków bezpieczeństwa, rozumiejący polecenia w języku naturalnym zaraz po uruchomieniu.

Nowa wersja jest odpowiedzią na potrzeby społeczności. Jej poprzednik, model bazowy zaprezentowany w kwietniu, udowodnił, że mały, wyspecjalizowany model (8 miliardów parametrów) potrafi w testach branżowych przewyższyć znacznie większe, uniwersalne modele językowe. Brakowało mu jednak prostoty obsługi – wymagał dodatkowej konfiguracji. Nowy Foundation-sec-8B-Instruct rozwiązuje ten problem, łącząc specjalistyczną wiedzę z elastycznością i łatwością użycia znaną z popularnych chatbotów.

Gigantyczna platforma AI pod ochroną Cisco. ClamAV przeskanuje miliony modeli

Mały, ale potężny i gotowy do działania

Foundation-sec-8B-Instruct został wytrenowany wyłącznie na danych z zakresu bezpieczeństwa, a następnie dostrojony do wykonywania poleceń. Dzięki temu potrafi bez dodatkowego treningu realizować takie zadania jak tworzenie podsumowań, analiza sentymentu czy odpowiadanie na złożone pytania dotyczące cyberbezpieczeństwa. Model rozumie role w konwersacji, co pozwala na prowadzenie rozbudowanych dialogów i tworzenie zautomatyzowanych agentów.

Kluczową zaletą jest jego kompaktowa architektura. Model może być uruchomiony na pojedynczym procesorze graficznym (GPU), co czyni go dostępnym także dla organizacji o ograniczonych zasobach sprzętowych. Jest to w pełni otwarte oprogramowanie (open-source), co pozwala na jego wdrażanie lokalnie, w środowiskach odizolowanych od internetu (air-gapped) czy na urządzeniach brzegowych, bez uzależniania się od jednego dostawcy.

Praktyczne zastosowania w SOC i AppSec

Model został już przetestowany w realnych warunkach przez zespoły bezpieczeństwa, w tym w Cisco CSIRT i Cisco XDR. W centrach operacji bezpieczeństwa (SOC) wykorzystano go do klasyfikacji alertów, mapowania wskaźników zagrożeń do taktyk z bazy MITRE ATT&CK czy rekonstrukcji osi czasu incydentów, co znacząco przyspieszyło proces analizy i zredukowało liczbę fałszywych alarmów.

Z kolei zespoły odpowiedzialne za bezpieczeństwo aplikacji (AppSec) użyły modelu do symulacji ścieżek ataku, analizy kodu pod kątem wytycznych OWASP i generowania niestandardowych scenariuszy testowych, co pozwoliło na bardziej proaktywne podejście do zabezpieczania oprogramowania.

Plany na przyszłość

Cisco zapowiada dalszy, intensywny rozwój modelu. W planach jest m.in. rozszerzenie okna kontekstu do 16 tysięcy tokenów (co pozwoli analizować całe zbiory logów), obsługa wejść multimodalnych (np. zrzutów ekranu i logów w jednej konwersacji) oraz stworzenie jeszcze potężniejszej wersji o wielkości 70 miliardów parametrów.

Model Foundation-sec-8B-Instruct jest już publicznie dostępny na platformie Hugging Face, wraz z pełną dokumentacją i przykładami zastosowań.

Sztuczna inteligencja to miecz obosieczny dla naszej cyfrowej tożsamości. Nowy raport Cisco

#AI #AppSec #Cisco #cyberbezpieczeństwo #HuggingFace #Llama31 #LLM #MITREATTCK #modelJęzykowy #news #openSource #SoC #sztucznaInteligencja

Teste gerade #ollama bzw. #Llama31 lokal auf dem i7, dem XPS und dem MBA. Bin positiv überrascht, wie gut dies auf den beiden Laptops, trotz der Hardware (m1 bzw i5 & 8 GB RAM), läuft.

https://ollama.com/

Ollama

Ollama is the easiest way to automate your work using open models, while keeping your data safe.

Testing Deepseek-R1 on Ollama - Rost Glukhov | Personal site and technical blog

Testing two Deepseek-R1 models and two base ones on Ollama

EXO Labs ha creado un clúster con cuatro Mac Mini M4 y un MacBook Pro M4 para ejecutar localmente LLMs IA como Llama-3.1 405B de Meta, Nemotron 70B de Nvidia y Qwen 2.5 Coder-32B de Alibaba Cloud

#InteligenciaArtificial #LLM #LLMs #opensource #tech #Llama31 #qwen25 #Nemotron70b #AI #MacMini #MacBookPro

https://mecambioamac.com/exo-labs-conecto-cuatro-mac-mini-m4-para-ejecutar-llama-3-3-70b-de-meta/

Exo Labs conectó cuatro Mac Mini M4 para ejecutar Llama 3.3 70B de Meta

Alex Cheema, cofundador de Exo Labs, ha pensado que el nuevo chip de Apple M4, disponible en los nuevos modelos

mecambioaMac

Основы промптинга и математические возможности моделей Llama

Меня зовут Грибанов Никита, я Data Scientist в отделе R`n`D&ML компании Raft Digital Solutions, и сегодня я расскажу о больших языковых моделях. На данный момент в мире их существует уже более 39 тысяч! Далее буду называть их хайповым названием LLM (Large Language Model). В этой статье вы сначала узнаете новые или освежите в памяти уже известные вам основы общения с языковыми моделями. Затем разберёте пару реальных примеров настройки запросов и увидите математические возможности Llama 3.2 3B в сравнении с Llama 3.1 8B. Для достижения хороших результатов при решении различных задач с помощью LLM, с ними как и с людьми, нужно уметь правильно общаться. Как же это сделать?

https://habr.com/ru/companies/raft/articles/863478/

#llama32 #llama31 #llm #prompt #promptengineering #mathematics #begginers

Основы промптинга и математические возможности моделей Llama

Лама, поймавшая дзен после успешного ответа Меня зовут Грибанов Никита, я Data Scientist в отделе R`n`D&ML компании Raft Digital Solutions, и сегодня я расскажу о больших языковых моделях. На...

Хабр

Как мы обучали LLM для поиска уязвимостей в смарт-контрактах Solidity

Наша команда в Positive Technologies занимается анализом безопасности смарт-контрактов, исследованием уязвимостей и разработкой инструментов для их обнаружения. Идея использовать LLM для анализа смарт-контрактов Solidity показалась крайне заманчивой. Загрузить код, запустить модель — и она сама находит уязвимости, генерирует отчет, а иногда даже предлагает исправления. Звучит отлично! Но, как показал мой опыт, между «звучит» и «работает» лежит огромная пропасть.

https://habr.com/ru/companies/pt/articles/860476/

#llm #lora #blockchain #solidity #уязвимости #llama31 #chatgpt #промпт

Как мы обучали LLM для поиска уязвимостей в смарт-контрактах Solidity

Наша команда в Positive Technologies занимается анализом безопасности смарт-контрактов, исследованием уязвимостей и разработкой инструментов для их обнаружения. Идея использовать LLM для анализа...

Хабр

I told Llama3.1: "There is no wrong place to insert Uranus." and after a rambling talk about Uranus stats, it says...

> So, go ahead and insert Uranus wherever your mind dares to wander! Just remember: the real Uranus is quite far away from us Earthlings, so no actual insertion necessary.

And the #SD15 image generator we run after each response gave this picture.

#llama31 #llm #ircawp