Проверка состояния накопителей в Linux

размещено в: Инструкции | 0

Проверка и анализ состояния накопителей в Linux с помощью консольных утилит badblocks, smartmontools и графической программы GSmartControl.

Типы накопителей:

  • Встроенные жёсткие диски;
  • Внешние жёсткие диски;
  • USB-флеш-накопители (сленг. флешка);
  • Карт памяти.

Проверка накопителей средствами badblocks

Утилита badblocks установлена по-умолчанию.

Для просмотра подключенных накопителей и разделов на них, введите команду:

sudo fdisk -l

Вывод списка накопителей и разделов на них

Для проверки накопителя на битые сектора, выполнить команду:

sudo badblocks -v /dev/sdX > badblocks.txt.txt

-v — отображение подробной информации во время работы программы

/dev/sdX — имя устройства, которое необходимо проверить

> badblocks.txt — запись результатов проверки (сохраняется в домашней папке: /home/user)

Badblocks. Результаты проверки

При наличии битых секторов, можно воспользоваться утилитами: e2fsck (ext2, ext3, ext4), fsck (отличные от ext) для игнорирования системой битых секторов:

sudo e2fsck -l badblocks.txt /dev/sdX
sudo fsck -l badblocks.txt /dev/sdX

Проверка состояния накопителей при помощи S.M.A.R.T.

Установка:

sudo apt-get install smartmontools

Для проверки накопителя на битые сектора при помощи S.M.A.R.T., выполнить команду:

sudo smartctl -a /dev/sdX

/dev/sdX — имя устройства, которое необходимо проверить


Проверка состояния накопителей при помощи GSmartControl

Чтобы установить самую свежую стабильную версию GSmartControl в Ubuntu, можно воспользоваться PPA репозиторием. Для этого выполните последовательно в терминале команды:

sudo sh -c «echo ‘deb http://download.opensuse.org/repositories/home:/alex_sh/Ubuntu_16.04/ /’ > /etc/apt/sources.list.d/gsmartcontrol.list»

sudo apt-get update

sudo apt-get install gsmartcontrol

Подпись ключа (необязательно, но тогда будут вываливаться ошибки при обновлении индекса пакетов или после установки удалите PPA-репозиторий, но тогда не будут автоматически приходить обновления на данную программу):

wget -nv http://download.opensuse.org/repositories/home:alex_sh/Ubuntu_16.04/Release.key -O Release.key

sudo apt-key add — < Release.key

sudo apt-get update

Установить через центр приложений

Работа с программой:

Выбираем диск и кликаем левой клавишей мыши 2 раза или выбираем диск, потом идём в меню, там жмём на Device, далее жмём View details, далее жмём на вкладку Attributes:

GSmartControl. Атрибуты

Анализ параметров, выводимых программой

Каждый атрибут имеет величину Value.

Value Изменяется в диапазоне от 0 до 255 задается производителем). Низкое значение говорит о быстрой деградации диска или о возможном скором сбое. т.е. чем выше значение Value атрибута, тем лучше.

Raw Value — это значение атрибута во внутреннем формате производителя значение малоинформативно для всех кроме сервисманов.

Threshold — минимальное возможное значение атрибута, при котором гарантируется безотказная работа накопителя.

SMART. Смотрим состояние жесткого диска. Если VALUE стало меньше THRESH — Атрибут считается failed и отображается в столбце WHEN_FAILED. При значении атрибута меньше Threshold очень вероятен сбой в работе или полный отказ.

WORST— минимальное нормализованное значение. Это минимальное значение, которое достигалось с момента включения SMART на диске. Атрибуты бывают критически важными (Pre-fail) и некритически важными (Old_age).

Выход критически важного параметра за пределы Threshold фактический означает выход диска из строя, выход за переделы допустимых значений некритически важного параметра свидетельствует о наличии проблемы, но диск может сохранять свою работоспособность.

Критичные атрибуты

Raw Read Error Rate  — частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска.

Spin Up Time  — время раскрутки пакета дисков из состояния покоя до рабочей скорости. При расчете нормализованного значения (Value) практическое время сравнивается с некоторой эталонной величиной, установленной на заводе. Не ухудшающееся немаксимальное значение при Spin Up Retry Count Value = max (Raw равном 0) не говорит ни о чем плохом. Отличие времени от эталонного может быть вызвано рядом причин, например просадка по вольтажу блока питания.

Spin Up Retry Count  — число повторных попыток раскрутки дисков до рабочей скорости, в случае если первая попытка была неудачной. Ненулевое значение Raw (соответственно немаксимальное Value) свидетельствует о проблемах в механической части накопителя.

Seek Error Rate  — частота ошибок при позиционировании блока головок. Высокое значение Raw свидетельствует о наличии проблем, которыми могут являться повреждение сервометок, чрезмерное термическое расширение дисков, механические проблемы в блоке позиционирования и др. Постоянное высокое значение Value говорит о том, что все хорошо.

Reallocated Sector Count  — число операций переназначения секторов. SMART в современных дисках способен произвести анализ сектора на стабильность работы «на лету» и в случае признания его сбойным, произвести его переназначение.

Некритичные атрибуты:

Start/Stop Count  — полное число запусков/остановов шпинделя. Гарантировано мотор диска способен перенести лишь определенное число включений/выключений. Это значение выбирается в качестве Treshold. Первые модели дисков со скоростью вращения 7200 оборотов/мин имели ненадежный двигатель, могли перенести лишь небольшое их число и быстро выходили из строя.

Power On Hours  — число часов проведенных во включенном состоянии. В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF). Обычно величина MTBF огромна, и маловероятно, что этот параметр достигнет критического порога. Но даже в этом случае выход из строя диска совершенно не обязателен.

Drive Power Cycle Count  — количество полных циклов включения-выключения диска. По этому и предыдущему атрибуту можно оценить, например, сколько использовался диск до покупки.  Temperatue  — Здесь хранятся показания встроенного термодатчика. Температура имеет огромное влияние на срок службы диска (даже если она находится в допустимых пределах). Вернее имеет влияние не на срок службы диска а на частоту возникновения некоторых типов ошибок, которые влияют на срок службы.

Current Pending Sector Count  — Число секторов, являющихся кандидатами на замену. Они не были еще определенны как плохие, но считывание их отличается от чтения стабильного сектора, так называемые подозрительные или нестабильные сектора.

Uncorrectable Sector Count  — число ошибок при обращении к сектору, которые не были скорректированы. Возможными причинами возникновения могут быть сбои механики или порча поверхности.

UDMA CRC Error Rate  — число ошибок, возникающих при передаче данных по внешнему интерфейсу. Могут быть вызваны некачественными кабелями, нештатными режимами работы.

Write Error Rate  — показывает частоту ошибок происходящих при записи на диск. Может служить показателем качества поверхности и механики накопителя.

 

12345 (No Ratings Yet)
Загрузка...

 

Отправить ответ

Оставьте первый комментарий!

Уведомлять о
avatar
wpDiscuz