Ich bin seit 20 Jahren Software-Entwickler im E-Business-Bereich.
Dass kein Teilsystem in der Lage sein darf, das Gesamtunternehmen und insbesondere das Kerngeschäft lahmzulegen, ist ein derart basaler Grundsatz, dass man ihn noch nicht mal aufschreiben muss.
#Fehler können passieren - dafür baut man unabhängige #Redundanzen und #Fallback-Lösungen ein, deren Anwendung zur täglichen Routine gehört.

Warum gibt es das bei der #Bahn nicht?

#Fehlerresilienz

Зачем GenAI-ассистенту platform logic: как управлять источниками, evidence и ответами

GenAI-ассистент может довольно быстро начать отвечать "по теме": находить релевантные фрагменты, собирать уверенный текст и создавать ощущение, что система уже работает. Если подключить LLM к корпоративным документам через RAG, подобрать параметры поиска, немного почистить контекст и добавить хороший prompt, первые результаты часто выглядят обнадеживающе. Пользователи начинают пробовать систему, появляются первые метрики использования, а сама идея быстро кажется готовой к расширению. Но для продуктового контура этого недостаточно. Проблема не только в том, может ли модель сформировать релевантный ответ. Проблема в том, является ли поведение системы ожидаемым, проверяемым и управляемым. Можно получить ассистента, который уверенно отвечает на вопросы, но при этом плохо контролируется в деталях: какие источники он использовал, достаточно ли найденной информации для ответа, можно ли показывать ответ пользователю, где безопаснее остановиться и дать ограниченный ответ (fallback), как проверяется качество, кто управляет ссылками на источники и что происходит при неполных, устаревших или плохо структурированных данных. В этой статье я разбираю не готовый "рецепт правильного GenAI-ассистента", а результаты и выводы из проверки на малом контролируемом прототипе: какие решения появляются вокруг GenAI-системы, когда она должна не просто отвечать, а вести себя управляемо. Фокус будет не на том, как "улучшить prompt" или выбрать модель побольше, а на том, как система управляет ответом после retrieval:

https://habr.com/ru/articles/1050848/

#GenAI #RAG #LLM #AI_Platform #retrieval #evidence #fallback #observability #quality_gates #enterprise_AI

Зачем GenAI-ассистенту platform logic: как управлять источниками, evidence и ответами

GenAI-ассистент может довольно быстро начать отвечать "по теме": находить релевантные фрагменты, собирать уверенный текст и создавать ощущение, что система уже работает. Если подключить LLM к...

Хабр

@PC_Fluesterer Auf jeden Fall unprofessionell, schlecht designed, schlecht gemacht und sowas von nicht zeitgemäß. Dabei weiß man doch schon lange, wie man hohe Verfügbarkeit, Redundanz und Ausfallsicherheit in der IT architekturell erlangt und, daß diese Komponenten nicht optional sind.

#itsec #performance #ausfallsicherheit #redundanz #failover #fallback #verfügbarkeit #devops #itarchitektur #togaf #rechenzentrum #spof #singlepointoffailure #bottleneck

Пять LLM-провайдеров через один openai-клиент

У нас почти каждая заметная операция в продукте идёт через LLM: генерация follow-up, сборка КП, скоринг, саммари звонков. Пока провайдер один — это бомба замедленного действия. Он ложится по 503, упирается в рейт-лимит, или цена улетает, потому что дешёвый разбор команды почему-то крутится через флагманскую модель. Поэтому мы сделали тонкий роутер. Не фреймворк, не «оркестратор агентов» — примерно 500 строк на NestJS, которые переезжают между нашими продуктами без правок. Расскажу, что внутри и на чём набили шишки.

https://habr.com/ru/articles/1046902/

#LLM #fallback #OpenAI #ИИагенты

Пять LLM-провайдеров через один openai-клиент

У нас почти каждая заметная операция в продукте идёт через LLM: генерация follow-up, сборка КП, скоринг, саммари звонков. Пока провайдер один — это бомба замедленного действия. Он ложится по 503,...

Хабр

Как я довёл расходы на LLM до нуля: почему на бесплатных тарифах параллелизм — враг

Это продолжение первой статьи про Briefka — там я описывал самого бота и базовую архитектуру каскада LLM-провайдеров. За прошедшие 4 месяца бот органически вырос с 59 до 84 пользователей, и именно на этом масштабе бесплатный каскад начал срываться на платного провайдера. Расскажу, почему так вышло и как я вернул расходы к нулю — с цифрами и кодом. Код ниже — реальные фрагменты из боевого Briefka, слегка сокращённые для читаемости: убраны логирование и сбор статистики.

https://habr.com/ru/articles/1044546/

#llm #ratelimit #asyncio #telegrambot #groq #deepseek #fallback #circuit_breaker

Как я довёл расходы на LLM до нуля: почему на бесплатных тарифах параллелизм — враг

Это продолжение первой статьи про Briefka — там я описывал самого бота и базовую архитектуру каскада LLM-провайдеров. За прошедшие 4 месяца бот органически вырос с 59 до 84 пользователей, и именно на...

Хабр

@jela Was ich nicht verstehe: "Ist nicht per eMail erreichbar", oft ist auch die website down und die Telefonie. Dabei ist es sehr einfach für den #Desasterfall ein #fallback vorzuhalten, zu geringen Kosten. Dazu ein Notfall-Kommunikationsplan, 1, 2 Übungen im Jahr...

In jedem Amt
- ein Smartphone
- ein Notebook mit LTE
- eine eMail Adresse über einen (un)managed Server im Netz

Die Notfall Kontaktdaten auf einer Website im Netz.

#itsec #itsecurity #offentlicher #kommune #verwaltung #hack

Majority of Manitobans want to abandon time changes, survey suggests
A majority of Manitobans no longer want to fall back or spring ahead, a new survey suggests.
https://www.cbc.ca/news/canada/manitoba/survey-time-change-9.7213495?cmp=rss
Days of time change 'pretty much at the end' in Manitoba, premier suggests
Manitoba's premier is moving the needle a tick closer toward ditching the spring forward, fall back ritual, in a move that could usher in a "Prairie time zone."
https://www.cbc.ca/news/canada/manitoba/time-change-kinew-9.7176389?cmp=rss
Days of time change 'pretty much at the end' in Manitoba, premier suggests
Manitoba's premier is moving the needle a tick closer toward ditching the spring forward, fall back ritual, in a move that could usher in a "Prairie time zone."
https://www.cbc.ca/news/canada/manitoba/time-change-kinew-9.7176389?cmp=rss
Lomatogonium rotatum, our uncommon Marsh Felwort, blooming along the South Platte near Garo #nativeplants #FallBackFlowers #FallBack to Sep. 9 🌿 The blooms will continue until the world improves