Имя: Пароль:
1C
 
Как правильно выполнять отчет о ошибках и не надоесть человеку?
0 H A D G E H O G s
 
11.08.16
19:33
Дня доброго.
Есть железяка в сети, которая может отправлять отчет в виде письма на ящик о своем состоянии. Железяка может работать, не работать и работать с предупреждением (этот момент опустим, работает жеж). Железяка может начать работать после сбоя самостоятельно, а может и нет. Сбой может происходить циклически. Сбой, включение в работу, сбой, включение в работу, .и.т.д.

Мне представляется правильной стратегией следующая:
1) Железяка работает, ничего не происходит.
2) Как только железяка прекратила работать, она отправляет письмо админу, что она не работает.
3) Включается таймер, задаваемый админом (по дефолту 15 минут), по истечению которого:
а) Если больше сбоев не было и железяка работает - приходит письмо о том, что все нормально, возврат в пункт 1.
б) Если железяка работает но были еще сбои за эти 15 минут - приходит письмо о циклическом сбое, железяка считается нерабочей.
в) Если железяка не работает - приходит информация о нерабочей железяке.

Как такая концепция в целом? Надо ли после 2 письма заново включать таймер и слать 3,4,5 письма в надежде на то, что железяка когда нибудь заработает? Не задолбает ли это админа и не будет это интерпретироваться как инф. мусор?
б) Если с момента первого сбоя был еще один сбой - приходит письмо о том, что был циклический сбой
1 H A D G E H O G s
 
11.08.16
19:34
В конце фразу
"б) Если с момента первого сбоя был еще один сбой - приходит письмо о том, что был циклический сбой"
считать опечаткой.
2 shuhard
 
11.08.16
19:41
(0) нечёткое ТЗ, ты забыл указать какой интервал является критическим для бизнеса, если он больше 15 минут, то в день идёт один рапорт о всех сбоях



если остановка критическая то должно быть два письма, 3 и дальше - флюд
3 H A D G E H O G s
 
11.08.16
19:44
(2) ммм. зависит от времени рабочего дня. От пары минут до получаса.
4 H A D G E H O G s
 
11.08.16
19:45
Тоесть, два письма?
5 Garykom
 
гуру
11.08.16
19:57
Мыло уже не модно, сча в тренде в телеграм писать...
6 Зая Бусечка
 
11.08.16
19:57
По емейлу при ходит письмо "У нас не работает электронная почта и интернет!!"
7 Garykom
 
гуру
11.08.16
19:58
(5) и отвечать в телеграме ботом на запросы
типа сбои были? И в ответ отчет
8 H A D G E H O G s
 
11.08.16
20:01
(5) Пофиг куда писать. Главное когда и сколько.
9 Garykom
 
гуру
11.08.16
20:34
(8) Сделай бота, чтобы команды понимал по мылу или мессенджеру. И этими командами настраивался как нуна когда, сколько и т.д. писать.
10 shuhard
 
11.08.16
20:34
(4)да, останов и критическая ошибка
(8) фискальный след тоже важен, почта видится оптимальным каналом
11 VladZ
 
11.08.16
20:37
(0) Зачем так усложнять? Сменился режим (работает / не работает) - пришло письмо. А дальше пусть получатель анализирует сам: периодический это сбой или нет.
12 ifso
 
11.08.16
20:44
изобретается лог + анализатор лога + индикатор, не?
13 vs84
 
11.08.16
20:46
(0) если я правильно понял, то только информация в п.п 3б и 3в является существенной. Если  верно, то слать только в этих случаях. Исхожу из предположения, что эти оповещения должны побудить админа (или кого-то еще) к какому-то оперативному действию, т.е. в этом их смысл.
Если просто копить статистику для постфактумного анализа периодического, тогда пофиг.
14 mistеr
 
11.08.16
20:47
(11) +1. Для этого и придумали всякие средства мониторинга. А в железке чем проще логика, тем надежнее.
15 H A D G E H O G s
 
11.08.16
20:48
(13) 3а - это чтобы админ не волновался, починилось без него.
16 VladZ
 
11.08.16
20:49
Ну а если потом нужно анализировать причины - нужен лог. И, желательно, анализатор лога. В общем, не нужно все в одну кучу валить. Это разные понятия.