8[12:50] dvolodin: Я придумал тему для обсуждения
8[12:54] dvolodin: и вот второе пятничное
8[12:54] dvolodin: я сделал uptime discovery
8[12:54] dvolodin: настраивается как и другие методы
8[12:54] dvolodin: дергает uptime с железки
8[12:55] dvolodin: и ведет две коллекции в базе -- Uptime и Reboot
8[12:56] dvolodin: https://bitbucket.org/nocproject/noc/commits/f600c32c18f52341c2cefa273db078e48a03e7e4
8[12:56] dvolodin: в uptime попадут интервалы непрерывной работы
8[12:57] dvolodin: в reboot, соответсвенно - если просекли, что uptime упал
8[12:58] dvolodin: метод тривиальный, грузит систему минимально
8[12:58] dvolodin: позволяет отловить проблемы, связанные с постоянными перезагрузками
При раннем запуске (фиг знает, сколько с тех пор поменяли) успел словить занесение в uptime одного устройства более одного раза (в одной записи аптайм обновлялся, в другой - вроде как нет). Соответсвенно, имелся ложный reboot в соответствующей коллекции.
На 2015.05.20 наблюдаю в uptimes 5 записей по одному устройству.
upd: Изучил новую гадость в монге, написал запрос:
10 Comments
Unknown User (tsergey)
https:
//bitbucket.org/nocproject/noc/commits/f600c32c18f52341c2cefa273db078e48a03e7e4
Unknown User (tsergey)
добавляем
Unknown User (tsergey)
включается:
Service Activation \ Setup \ Managed Object Profiles
Unknown User (tsergey)
проверить, реализован ли метод для оборудования:
Service Activation \ Managed Object \
MO + Edit \ Scripts \ get_uptime:
Unknown User (tsergey)
проверить что не так со скриптом:
под "noc"
noc@noc:/opt/noc$ ./noc debug-script -c "community" get_uptime "MO"
Unknown User (tsergey)
Unknown User (tsergey)
Unknown User (tsergey)
Добавили отчет
Fault Management \ Reports \ Reboots
Unknown User (evyscr)
При раннем запуске (фиг знает, сколько с тех пор поменяли) успел словить занесение в uptime одного устройства более одного раза (в одной записи аптайм обновлялся, в другой - вроде как нет). Соответсвенно, имелся ложный reboot в соответствующей коллекции.
На 2015.05.20 наблюдаю в uptimes 5 записей по одному устройству.
upd: Изучил новую гадость в монге, написал запрос:
Что-то дофига девайсов вспыло. Например, девайс с годичным аптаймом имеет 13 записей в uptimes и 12 в reboots.
upd2:. Утверждается, что пофиксили.
Unknown User (tsergey)
При выяснение проблем с большим количеством джобов была рекомендация выставить
Service Activation \ Setup \ Managed Object Profiles — Профиль — Uptime Discovery: Min. interval = 300