Про дежурства замолвим-ка слово

Возможно, вы знаете таких программистов, которые никогда не сталкивались с такой практикой, как "дежурства". Я до определённого момента в своей карьере тоже, думал, что знаю такого (конкртно - себя). Но всему приходит своё время, и на одной из работ пришлось подежурить и мне. До того момента, я только слышал от других об их недовольстве дежурствами. Все рассказчики, как анекдот, повторяли одну и ту же историю про ночные звонки дежурному, который не может проснуться. Этой статьёй хочу добавить немного красок на холст, чтобы у соискателей стало немного больше понимания о том, что можно спросить на собеседовании на собеседовании и как можно интерпретировать ответы на эти вопросы. Как я понимал "идеальное дежурство" програмиста, работающего 5 дней в неделю по 8 часов: Вариант №1: Программист назначается "дежурным" на время с 9 до 18 (ну, или в те часы, когда он работает). Если какая-то экстренная ситуация требует внимания дежурного за пределами рабочего времени, это время согласовывается с ним, фиксируется и оплачиваеся деньгами или отгулами (читаем ТК РФ). Вариант №2: Программист назначается "дежурным" на "сутки через трое". Т.е. работает 24 часа, а потом 72 часа отдыхает от работы (тоже соответствует ТК РФ). Что должен делать дежурный программист на идеальном дежурстве: 1) Он следит за состоянием приложения (или нескольких), в разработке (поддержке) которых он участвует. 2) Если приложение перестаёт нормально работать, дежурный:

https://habr.com/ru/articles/882506/

#дежурства_в_разработке #sreпроцессы

Про дежурства замолвим-ка слово

Возможно, вы знаете таких программистов, которые никогда не сталкивались с такой практикой, как "дежурства". Я до определённого момента в своей карьере тоже, думал, что знаю такого (конкртно - себя)....

Хабр

tokeon.ru: почему SRE?

Из истории вопроса Когда-то давным-давно не было никакой технической поддержки и была одна только разработка… И никто, кроме разработчиков, толком не знал как работает продукт. И никто, кроме разработчиков, не мог ответить на вопросы о продукте. Но когда разработчики отвечали на вопросы о продукте - они не могли ничего разрабатывать. И теряли навыки. И продукт не развивался. И будили разработчиков по ночам, если продукт ломался. И не нравилось это разработчикам. Так образовалась техническая поддержка. Специальные люди, которые поддерживали пользователей продукта, помогали с внедрением, прибегали тушить пожары, когда всё шло совсем не так, как должно было. Классическая поддержка Чтобы навести в работе технической поддержки порядок, придумали стандарт ITIL, внутри него расписали разные уровни поддержки, описали контракт поддержки через SLA. Так образовалась классическая поддержка, для работы которой надо:

https://habr.com/ru/articles/849366/

#sre #sreпроцессы #itil

tokeon.ru: почему SRE?

Из истории вопроса Когда-то давным-давно не было никакой технической поддержки и была одна только разработка… И никто, кроме разработчиков, толком не знал как работает продукт. И никто, кроме...

Хабр

Что и зачем почитать DevSecOps-у: личный опыт

Знания — сила! А актуальные и понятно преподнесенные знания — и вовсе на вес золота! Я решил рассказать про книги, которые показались мне, как руководителю отдела поддержки инфраструктуры сервисов (Head of Security Services Infrastructure) в «Лаборатории Касперского», полезными. Перед вами — «опорная» литература DevSecOps. Я разберу основные темы, связанные с работой девопсов и девсекопсов – и пройдусь по релевантным изданиям для этих специалистов. Расскажу, как конкретно эта литература повлияла на мою карьеру, а значит — может повлиять и на вашу :) Дисклеймер: Если вас, как специалистов, сформировали какие-то другие книги по той же тематике — обязательно пишите в комментариях!

https://habr.com/ru/companies/kaspersky/articles/845458/

#devops #devsecops #secops #ops #network #infrastructure #linux #docker #k8s #кибербезопасность #unix #сетевые_технологии #сетевая_инфраструктура #kubernetes #terraform #sre #sreпроцессы #книги #книги_по_администрированию #книги_по_программированию

Что и зачем почитать DevSecOps-у: личный опыт

Знания — сила! А актуальные и понятно преподнесенные знания — и вовсе на вес золота! Я решил рассказать про книги, которые показались мне, как руководителю отдела поддержки инфраструктуры сервисов...

Хабр

Подходы к наблюдаемости от Т-Банка

Всем привет. Меня зовут Дима, в Т-Банке я руковожу Центром надежности информационных систем. Мы проводим консультирование, обучаем и внедряем SRE-практики, нанимаем и аттестуем инженеров. В общем, делаем все, чтобы помочь командам Т-Банка — а их уже более 2500 — разрабатывать надежные сервисы для всех категорий пользователей и при этом крепко спать по ночам. Мониторинг ИТ-систем — важнейшая составляющая надежности. Расскажу о том, какие подходы мы использовали, как и почему пришли к нынешнему состоянию и как планируем развиваться дальше.

https://habr.com/ru/companies/tbank/articles/827470/

#sre #sreпроцессы #monitoring

Подходы к наблюдаемости от Т-Банка

Всем привет. Меня зовут Дима, в Т-Банке я руковожу Центром надежности информационных систем. Мы проводим консультирование, обучаем и внедряем SRE-практики, нанимаем и аттестуем инженеров. В общем,...

Хабр

[Перевод] Уровни серьёзности инцидентов для онлайн-платформ

Классификация инцидентов по степени серьёзности – ключевой момент в управлении инцидентами. Она нужна, чтобы SRE команда могла быстро и эффективно устранять неполадки в сложных системах и минимизировать их влияние на клиентов. В этой статье описана система SEV (Security Evaluation Version), которая помогает стандартизировать процесс устранения проблем, быстрее восстановить работу системы и уведомить о происшествии всех, кого это касается, в зависимости от серьёзности инцидента.

https://habr.com/ru/companies/slurm/articles/795291/

#sre #sreинженер #sreпроцессы #site_reliability_engineer #инцидентменеджмент #инциденты

Уровни серьёзности инцидентов для онлайн-платформ

Классификация инцидентов по степени серьёзности – ключевой момент в управлении инцидентами. Она нужна, чтобы SRE команда могла быстро и эффективно устранять неполадки в сложных системах и...

Хабр

[Перевод] Как реализован SRE подход в Power BI

Команда Power BI рассказала, как она обеспечивает надёжную, производительную и масштабируемую работу своего сервиса. В этой статье вы узнаете, как в Power BI устроен мониторинг состояния сервиса, как SRE команды устраняют инциденты и принимают меры по улучшению сервисов.

https://habr.com/ru/companies/slurm/articles/792520/

#sre #sreинженер #sreпроцессы #sreкоманды #site_reliability_engineer #itинфраструктура #инцидентменеджмент #инциденты

Как реализован SRE подход в Power BI

Команда Power BI рассказала, как она обеспечивает надёжную, производительную и масштабируемую работу своего сервиса. В этой статье вы узнаете, как в Power BI устроен мониторинг состояния сервиса, как...

Хабр