2017-09-28: как ломаются сложные системы

Из ленты: MaksWiki — Блог:Максима Цепкова [ru]

Выношу из поста на FB, чтобы сохранить ссылку на статью

Просторы интернета иногда выносят совершенно замечательные находки. Например, эта статья 1998 года, переведенная на русский в 2009 о том, что сбои — неотъемлемый и непрерывно проявляющийся атрибут сложных систем. В них встроены механизмы от сбоев, позволяющие функционировать игнорируя единичные сбои, устранение которых экономически не оправдано. И поэтому всегда идет баланс между операционной функцией и защитной, основная цель которой — не допустить катастрофу, и потому никогда не работают с полной производительностью. Читайте!

Как ломаются сложные системы

Мой коммент из обсуждения здесь тоже сохраню. Статья действительно старая, и аксиома из теории систем как бы известно. Только вот почему-то люди не проектируют тот софт, который разрабатывают как часть сложной системы, которая постоянно сбоит и которую надо восстанавливать. Всякое резервное копирование — да, а вот сама разрабатываемая система — любой архитектор уверен, что она сбоить не будет, и, более того, практик такого проектирования сбоящих систем — нет. Вот об этом статья заставила задуматься…

Из репоста Никита Зимин Вот это просто вау. Очень близко к тому как я представляю себе работу даже не столь уж сложных систем как например какое-нибудь SaaS приложение.

Источник