Ad Widget

Collapse

Мониторинг smart - свежие решения?

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • ksv
    Member
    • May 2015
    • 58

    #1

    Мониторинг smart - свежие решения?

    Привет!
    Натяльника озадачил мониторить смарт в локальной сети на Windows рабочих станциях (потом и на Unix 100 пудов озадачит).
    Не вижу что-то конкретного в документации zabbix про SMART. Есть статьи разных самоделкиных и разных лет, даже тут на форуме писали скрипты итп.. но по видимому ребята просто в данной предметной области плотно работают... я то так уже, тот кто скручивает вместе написанною конструкцию.
    Возможно есть статьи которые достойны рекомендации?
    В данном контексте идёт речь не о SNMP (тут я так понимаю когда аппаратного RAID касается) а об утилитах которые Zabbix.agent опрашивает и каких то прямых запросах zabbix.agent (если есть такие)!
  • yukra
    Senior Member
    • Apr 2013
    • 1359

    #2
    Originally posted by ksv
    Привет!
    Натяльника озадачил мониторить смарт в локальной сети на Windows рабочих станциях (потом и на Unix 100 пудов озадачит).
    Не вижу что-то конкретного в документации zabbix про SMART. Есть статьи разных самоделкиных и разных лет, даже тут на форуме писали скрипты итп.. но по видимому ребята просто в данной предметной области плотно работают... я то так уже, тот кто скручивает вместе написанною конструкцию.
    Возможно есть статьи которые достойны рекомендации?
    В данном контексте идёт речь не о SNMP (тут я так понимаю когда аппаратного RAID касается) а об утилитах которые Zabbix.agent опрашивает и каких то прямых запросах zabbix.agent (если есть такие)!
    Есть проблема в том, что каждый производитель дисков имеет свой взгляд на то, как именно нужно интерпретировать данные smart, например почти у всех рост RAW_VALUE у параметра Raw_Read_Error_Rate означает что диск начинает накрываться, однако например Seagate туда пишет совершенно другое число.
    Из-за этого smart может показать только след. информаци: 1) Диск вроде как жив-здоров.
    2) Диск вроде как собирается умирать
    3) Диск сдох.

    В связи с этим у себя отказался от мониторинга смарта zabbix'ом, и смотрю в него только глазами, в случае если диск вылетает из рэйда.

    Вот тут можно почитать подробней "на что обращать внимание" http://www.ixbt.com/storage/hdd-smart-testing.shtml

    Ну а тех. часть: берем любые утилиту, показывающую смарт в консольке (smartctl из пакета smartmontool имеется как для линукса, так и для винды).

    Comment

    • ksv
      Member
      • May 2015
      • 58

      #3
      Originally posted by yukra
      Есть проблема в том, что каждый производитель дисков имеет свой взгляд на то, как именно нужно интерпретировать данные smart, например почти у всех рост RAW_VALUE у параметра Raw_Read_Error_Rate означает что диск начинает накрываться, однако например Seagate туда пишет совершенно другое число.
      Из-за этого smart может показать только след. информаци: 1) Диск вроде как жив-здоров.
      2) Диск вроде как собирается умирать
      3) Диск сдох.

      В связи с этим у себя отказался от мониторинга смарта zabbix'ом, и смотрю в него только глазами, в случае если диск вылетает из рэйда.

      Вот тут можно почитать подробней "на что обращать внимание" http://www.ixbt.com/storage/hdd-smart-testing.shtml

      Ну а тех. часть: берем любые утилиту, показывающую смарт в консольке (smartctl из пакета smartmontool имеется как для линукса, так и для винды).
      Советуешь в программе просматривать? Просто предполагается, что рабочих станций много и за каждой надо присматривать ( у меня программисты которые что-то регулярно делают и сохраняют рабочие моменты локально), не смотря на то, что разрулил бэкапы с каждой машине утилиткой robocopy и не плохо получилось так (уже и пригодилась раз).
      Last edited by ksv; 22-09-2015, 08:57.

      Comment

      • yukra
        Senior Member
        • Apr 2013
        • 1359

        #4
        Originally posted by ksv
        Советуешь в программе просматривать? Просто предполагается, что рабочих станций много и за каждой надо присматривать ( у меня программисты которые что-то регулярно делают и сохраняют рабочие моменты локально), не смотря на то, что разрулил бэкапы с каждой машине утилиткой robocopy и не плохо получилось так (уже и пригодилась раз).
        Ээ ... нет. Советую прочитать статью, понять что "нет 1 параметра, по которому можно точно сказать "диск умрет в течении недели"" и принять решение "пишем скрипт, ориентируемся на вот этот и вон тот параметр, если они достигают значение X и Y, то меняем диск", сесть и написать пару скриптов с использованием smartmontool ... или принять решение "бить програмистов больно больно, если вечером от них не прилетает коммит, например по ЗП за день" и менять диски по мере выхода из строя.

        Comment

        • ksv
          Member
          • May 2015
          • 58

          #5
          Originally posted by yukra
          Ээ ... нет. Советую прочитать статью, понять что "нет 1 параметра, по которому можно точно сказать "диск умрет в течении недели"" и принять решение "пишем скрипт, ориентируемся на вот этот и вон тот параметр, если они достигают значение x и y, то меняем диск", сесть и написать пару скриптов с использованием smartmontool ... или принять решение "бить програмистов больно больно, если вечером от них не прилетает коммит, например по ЗП за день" и менять диски по мере выхода из строя.
          Ок - сейчас изучим! Спасибо!

          Comment

          • hard
            Member
            • Feb 2013
            • 65

            #6
            Для Windows посмотрите тут http://www.thewindowsclub.com/hard-disk-drive-health

            Comment

            • brood
              Junior Member
              • Jul 2015
              • 5

              #7
              Originally posted by hard
              Для windows посмотрите тут http://www.thewindowsclub.com/hard-disk-drive-health
              Отличная утилита, спасибо за ссылку!

              Comment

              • ksv
                Member
                • May 2015
                • 58

                #8
                А я Victoria 4.47 for x64 по диску прошёлся согласно этой статье:
                http://www.ixbt.com/storage/hdd-smart-testing.shtml
                которую рекомендовали выше..
                кароче у меня диск ЗОМБИ блин
                при том конкретный

                Comment

                • ksv
                  Member
                  • May 2015
                  • 58

                  #9
                  Originally posted by hard
                  Для windows посмотрите тут http://www.thewindowsclub.com/hard-disk-drive-health
                  Она позволяет куда то скидывать статус диска для дальнейшего анализа?
                  Т.е с ней можно создать триггер + который будет анализировать эти данные?

                  Comment

                  • sadman
                    Senior Member
                    • Dec 2010
                    • 1611

                    #10
                    Originally posted by ksv
                    Она позволяет куда то скидывать статус диска для дальнейшего анализа?
                    Т.е с ней можно создать триггер + который будет анализировать эти данные?
                    wmi.get[<пространство_имен>,<запрос>]
                    Примеры:
                    wmi.get[root\cimv2,select status from Win32_DiskDrive where Name like '%PHYSICALDRIVE0%'] - возвращает состояние первого физического диска

                    Comment

                    Working...