GPT-OSS representa el movimiento de la IA de código abierto para el desarrollo de software. 💻⚙️ En lugar de depender de APIs cerradas y de pago, este ecosistema impulsa modelos abiertos (como DeepSeek-Coder o CodeLlama) y herramientas de orquestación para programar, auditar y desplegar código de forma local, garantizando privacidad absoluta y personalización en tus propios servidores. 🤖🔓

#GPTOSS #OpenSource #IA #Developers #DevOps #MachineLearning

Развиваем ИИ-платформу в 1С

Статья о том, как мы пришли к ИИ для 1С и что из этого вышло. Материал получился про попытку собрать полноценную ИИ-платформу для работы с учетными данными. Расскажу, зачем нам понадобился MCP, как мы связали его с 1С:Шина, почему отдельно уперлись в права доступа и как в итоге устроили агента внутри 1С. Также покажу, где видим место для skills, RAG и OCR, и что пока не стали отдавать модели на самостоятельное выполнение.

https://habr.com/ru/companies/cinimex/articles/1046197/

#1с #иипомощник #mcpserver #function_calling #агент #rag #ocr #права_доступа #локальные_модели #gptoss

Развиваем ИИ-платформу в 1С

Привет! Я - Роман Коротаев, ресурсный руководитель направления 1С в компании Синимекс. В этом материале хочу рассказать, как мы пришли к ИИ для 1С и что из этого вышло. Материал получился про попытку...

Хабр

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сложилась жесткая классификация по количеству параметров: 7B, 8B, 32B. Она же создает иллюзию, что модели одной весовой категории обладают сопоставимыми аналитическими, генеративными и логическими характеристиками, что в корне противоречит современным эмпирическим наблюдениям. Но действительно ли «вес» модели все еще определяет ее качество в 2026 году? Или компактная архитектура способна конкурировать с гигантами, требующими H100 и сотни гигабайт VRAM? В этой статье мы не будем рассуждать об этом абстрактно: возьмем реальные модели из каталога FMC и посмотрим на практике, как размер влияет на качество reasoning, генерации и прикладную эффективность — и влияет ли вообще.

https://habr.com/ru/companies/selectel/articles/1043278/

#mlops #selectel #llmмодели #qwen #phi4 #mistral #gptoss #deepseek #ai #aiагенты

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сложилась жесткая классификация по количеству...

Хабр

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сложилась жесткая классификация по количеству параметров: 7B, 8B, 32B. Она же создает иллюзию, что модели одной весовой категории обладают сопоставимыми аналитическими, генеративными и логическими характеристиками, что в корне противоречит современным эмпирическим наблюдениям. Но действительно ли «вес» модели все еще определяет ее качество в 2026 году? Или компактная архитектура способна конкурировать с гигантами, требующими H100 и сотни гигабайт VRAM? В этой статье мы не будем рассуждать об этом абстрактно: возьмем реальные модели из каталога FMC и посмотрим на практике, как размер влияет на качество reasoning, генерации и прикладную эффективность — и влияет ли вообще.

https://habr.com/ru/companies/selectel/articles/1043278/

#mlops #selectel #llmмодели #qwen #phi4 #mistral #gptoss #deepseek #ai #aiагенты

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

Последние годы развитие LLM шло по пути экстенсивного масштабирования: считалось, что чем больше весов и данных, тем умнее модель. В индустрии даже сложилась жесткая классификация по количеству...

Хабр

Neste vídeo, eu testei diferentes modelos de inteligência artificial rodando localmente no Linux Mint utilizando o LM Studio.
O objetivo foi verificar se essas IAs conseguem responder corretamente perguntas simples — desde fatos pouco conhecidos, como o primeiro vocalista do Iron Maiden, até informações mais populares, como quem criou o kernel Linux.

Link: https://youtu.be/F8A2Yx4an_M

#inteligenciaartificial #lmstudio #ialocal #ibmgranite #gptoss #googlegemma #qwen #rx550 #linux

RT @witcheer: GPT-OSS-20B im Detail: 8 Coding-Aufgaben, 8 Durchläufe, 1,8 GB VRAM. Einrichtung: RTX 4060 Ti 8GB, WSL2, llama-server mit ncmoe=30, Pi Coding Agent. Das Modell nutzt 1,8 GB VRAM und 10 GB Host-RAM. Ergebnis: 8/8 bestanden. Jede Aufgabe produzierte funktionierenden, getesteten Code. Zusammen mit dem ursprünglichen Benchmark (portscout + logpulse) sind das 10/10 abgeschlossene agentic Aufgaben auf Consumer-Hardware. (alle Prompts finden Sie auf Hugging Face). Was ich herausfand: Kontexteffizienz: 6-48 % des 32K-Fensters pro Aufgabe genutzt. Keine Aufgabe erschöpfte den Kontext. Der schwierigste Prompt (Multi-Module mit topologischer Sortierung) nutzte 47,6 %. Selbstkorrektur funktioniert: Das Modell fand und behob seine eigenen Fehler 7 Mal über 8 Aufgaben hinweg. Die Richtung der topologischen Sortierung war umgekehrt, behoben. printf-Formatzeichenfolge fehlte %s, behoben. sed-Zitierung war falsch, behoben. Keine halluzinierten APIs: Prompt 5 war eine Falle: „Verwenden Sie nur die Standardbibliothek.“ Das Modell nutzte echte Module (http.client, json, time, urllib.parse). Keine erfundenen Convenience-Wrapper. Gefundene Schwächen: Edit-Tool hat Schwierigkeiten: Exakte String-Matching für das Edit-Tool schlägt wiederholt fehl. Das Modell benötigt 3-4 Versuche, bevor es auf vollständige Datei-Neuschreibungen zurückgreift. Dies ist teilweise ein Problem auf Agent-Seite (Pi's Edit-Tool erfordert exaktes Matching), nicht rein ein Modellproblem. Verschwendung bei Verzeichnis-Scans: Führt „ls -R ~“ vom Home-Verzeichnis aus und spuckt 11K+ Zeilen in den Kontext aus. Passierte bei 2 v…

mehr auf Arint.info

#AIResearch #CodingAgent #GPTOSS #LLMbenchmarking #MoeArchitecture #Quantization #arint_info

https://x.com/witcheer/status/2056830610044490020#m

Arint - SEO+KI (@[email protected])

<p>RT @witcheer: GPT-OSS-20B im Detail: 8 Coding-Aufgaben, 8 Durchläufe, 1,8 GB VRAM. Einrichtung: RTX 4060 Ti 8GB, WSL2, llama-server mit ncmoe=30, Pi Coding Agent. Das Modell nutzt 1,8 GB VRAM und 10 GB Host-RAM. Ergebnis: 8/8 bestanden. Jede Aufgabe produzierte funktionierenden, getesteten Code. Zusammen mit dem ursprünglichen Benchmark (portscout + logpulse) sind das 10/10 abgeschlossene agentic Aufgaben auf Consumer-Hardware. (alle Prompts finden Sie auf Hugging Face). Was ich herausfand: Kontexteffizienz: 6-48 % des 32K-Fensters pro Aufgabe genutzt. Keine Aufgabe erschöpfte den Kontext. Der schwierigste Prompt (Multi-Module mit topologischer Sortierung) nutzte 47,6 %. Selbstkorrektur funktioniert: Das Modell fand und behob seine eigenen Fehler 7 Mal über 8 Aufgaben hinweg. Die Richtung der topologischen Sortierung war umgekehrt, behoben. printf-Formatzeichenfolge fehlte %s, behoben. sed-Zitierung war falsch, behoben. Keine halluzinierten APIs: Prompt 5 war eine Falle: „Verwenden Sie nur die Standardbibliothek.“ Das Modell nutzte echte Module (http.client, json, time, urllib.parse). Keine erfundenen Convenience-Wrapper. Gefundene Schwächen: Edit-Tool hat Schwierigkeiten: Exakte String-Matching für das Edit-Tool schlägt wiederholt fehl. Das Modell benötigt 3-4 Versuche, bevor es auf vollständige Datei-Neuschreibungen zurückgreift. Dies ist teilweise ein Problem auf Agent-Seite (Pi's Edit-Tool erfordert exaktes Matching), nicht rein ein Modellproblem. Verschwendung bei Verzeichnis-Scans: Führt „ls -R ~“ vom Home-Verzeichnis aus und spuckt 11K+ Zeilen in den Kontext aus. Passierte bei 2 v…</p> <p><a href="https://arint.info/@Arint/116606326926091852">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AIResearch #CodingAgent #GPTOSS #LLMbenchmarking #MoeArchitecture #Quantization #arint_info</p> <p><a href="https://x.com/witcheer/status/2056830610044490020#m">https://x.com/witcheer/status/2056830610044490020#m</a></p>

Mastodon Glitch Edition

New week, more slides: Run LLMs Locally

Now with LFM 2 and new slides for using Transformers.js with WebGPU for Privacy Filter, Function Calling and Embeddings, running completely in your browser.

https://codeberg.org/thbley/talks/raw/branch/main/Run_LLMs_Locally_2026_ThomasBley.pdf

#ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

TUTORIAL - Passo a passo: IA local no Linux com LM Studio

Neste vídeo, você vai aprender como rodar inteligência artificial localmente no seu Linux usando o LM Studio.

Se você quer mais controle, mais privacidade e rodar IA direto no seu computador, esse guia é pra você.

Link: https://youtu.be/M7jR2BIuGyQ

#debian #debian13 #lmstudio #ialocal #ibmgranite #gptoss #googlegemma #qwen #rx550 #linux

New week, new slides: Run LLMs Locally

Now including Nemotron 3 Nano Omni from Nvidia, Llama.cpp built-in tools and new slides about using Transformers.js with WebGPU for Image Recognition and OCR.

https://codeberg.org/thbley/talks/raw/branch/main/Run_LLMs_Locally_2026_ThomasBley.pdf

#ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

🔧 Fine-tunable on domain-specific data — adapts to medical, legal or enterprise environments where generic rules fail. Based on the open #gptoss model family. Available on #HuggingFace under Apache 2.0

🚨 Caveat: #PrivacyFilter is a redaction & data minimization aid — NOT a compliance guarantee. It should be one layer in a holistic #privacybydesign approach. Always combine with human review for high-stakes use cases
https://openai.com/index/introducing-openai-privacy-filter/

Introducing OpenAI Privacy Filter

OpenAI Privacy Filter is an open-weight model for detecting and redacting personally identifiable information (PII) in text with state-of-the-art accuracy

OpenAI