- Linux: проверка диска
- Что такое битые блоки и почему они появляются
- Проверка диска Linux
- Badblocks
- GParted
- Smartmontools
- Safecopy
- Что делать, если обнаружена ошибка в системной программе Ubuntu
- Заключение
- 8 советов для решения проблем с диском Linux и Unix
- 1. Ошибка: Нет свободного места на устройстве
- Решение проблемы, когда диск полон:
- 2. Файловая система находится в режиме только для чтения
- 3. Проблема с дескриптором
- 4. Жесткий диск умирает
- 5. Диску или серверу сильно жарко.
- проблемы с жестким диском
- говорит
Linux: проверка диска
Компьютер представляет собой устройство, работа которого основана на взаимодействии множества компонентов. Со временем они могут вызывать сбои в работе. Одной из частых причин неполноценной работы машины становятся битые сектора на диске, поэтому периодически его нужно тестировать. Linux предоставляет для этого все возможности.
Что такое битые блоки и почему они появляются
Блок (сектор) – это маленькая ячейка диска, на которой в виде битов (0 и 1) хранится информация. Когда системе не удается записать очередной бит в ячейку, говорят о битом секторе. Причин возникновения таких блоков может быть несколько:
- брак при производстве;
- отключение питания в процессе записи информации;
- физический износ диска.
Изначально практически на всех носителях имеются нарушения. Со временем их количество может увеличиваться, что говорит о скором выходе устройства из строя. В Linux тестировать диск на ошибки возможно несколькими способами.
Проверка диска Linux
На ядре Linux работает несколько ОС, среди которых Ubuntu и Debian. Процедура проверки диска универсальная и подходит для каждой из них. О том, что носитель пора тестировать, стоит задуматься, когда на дисковую систему оказывается большая нагрузка, скорость работы с носителем (запись/чтение) значительно уменьшилась, либо эти процедуры и вовсе вызывают ошибки.
Многие знакомы с программой на Windows – Victoria HDD. Разработчики позаботились о написании ее аналогов для Linux.
Badblocks
Badblocks – дисковая утилита, имеющаяся в Ubuntu и других дистрибутивах Linux по умолчанию. Программа позволяет тестировать как жесткий диск, так и внешние накопители.
Перед тем, как тестировать диск в Linux следует проверить, какие накопители подключены к системе, с помощью утилиты fdisk-l. Она также покажет имеющиеся на них разделы.
Теперь можно приступать к непосредственному тестированию на битые сектора. Работа Badblocks организовывается следующим образом:
В записи используются следующие команды и операнды:·
- -v – выводит подробный отчет о проведенной проверке;·
- /dev/sdk 1 – проверяемый раздел;·
- bsector.txt – запись результатов в текстовый файл.
Если при проверке диска нашлись битые блоки, нужно запустить утилиту fsck, либо e2fsck, в зависимости от используемой файловой системы. Они ограничат запись информации в нерабочие сектора. В случае файловых систем ext2, ext3 или ext4 выполняется следующая команда:
В противном случае:
Параметр -l указывает программе, что битые блоки перечислены в файле bsector.txt, и исключать нужно именно их.
GParted
Утилита проверяет файловую систему Linux, не прибегая к текстовому интерфейсу.
Инструмент изначально не содержится в дистрибутивах операционной системы, поэтому ее необходимо установить, выполнив команду:
В главном окне приложения отображаются доступные диски. О том, что носитель пора тестировать, понятно по восклицательному знаку, расположенному рядом с его именем. Запуск проверки производится путем щелчка по пункту «Проверка на ошибки» в подменю «Раздел», расположенном на панели сверху. Предварительно выбирается нужный диск. По завершении сканирования утилита выведет результат.
Проверка HDD и других запоминающих устройств приложением GParted доступна для пользователей ОС Ubuntu, FreeBSD, Centos, Debian и других и других дистрибутивов, работающих на ядре Linux.
Smartmontools
Инструмент позволяет тестировать файловую систему с большей надежностью. В современных жестких дисках имеется встроенный модуль самоконтроля S. M. A. R. T., который анализирует данные накопителя и помогает определить неисправность на первоначальной стадии. Smartmontools предназначен для работы с этим модулем.
Запуск установки производится через терминал:
- apt install smartmontools – для Ubuntu/Debian;
- yum install smartmontools – для CentOS.
Для просмотра информации о состоянии жесткого диска, вводится строка:
Проверка на ошибки занимает различное время, в зависимости от объема диска. По окончании программа выведет результат о наличии битых секторов, либо их отсутствии.
Утилита имеет и другие параметры: -a, —all, -x, —xall. Для получения дополнительной информации вызывается справка:
Safecopy
Когда возникает потребность тестировать винчестер в Linux, стоит быть готовым к любому результату.
Приложение Safecopy копирует данные с поврежденного устройства на рабочее. Источником могут быть как жесткие диски, так и съемные носители. Этот инструмент игнорирует ошибки ввода/вывода, чтения, битые блоки, продолжая беспрерывно работать. Скорость выполнения максимально возможная, которую обеспечивает компьютер.
Для установки Safecopy на Linux в терминал вводится строка:
Сканирование запускается командой:
Здесь первый путь обозначает поврежденный диск, второй – директорию, куда сохранятся файлы.
Программа способна создать образ файловой системы нестабильно работающего запоминающего устройства.
Что делать, если обнаружена ошибка в системной программе Ubuntu
Установка нового программного обеспечения или изменения системных настроек могут вызвать сообщение «Обнаружена ошибка в системной программе». Многие его игнорируют, так как на общей работе оно не отражается.
С проблемой обычно сталкиваются пользователи Ubuntu версии 16.04. Тестировать HDD в этом случае нет необходимости, так как проблема скорее заключается именно в программном сбое. Сообщение оповещает о непредвиденном завершении работы программы и предлагает отправить отчет разработчикам. При согласии откроется окно браузера, где требуется заполнить форму из 4 шагов. Такой вариант вызывает сложности и не гарантирует исчезновения ошибки.
Второй способ поможет избежать появления сообщения лишь в том случае, если оно вызывается одной и той же программой. Для этого при очередном оповещении нужно установить галку на опцию «Не показывать больше для этой программы».
Третий метод – отключить утилиту Apport, которая отвечает в Linux за сбор информации и отправку отчетов. Такой подход полностью исключит всплывание окон с ошибками. Возможно отключение только показа уведомлений, оставляя службу сбора в рабочем состоянии. Для этого необходимо выполнить:
gsettings set com.ubuntu.update-notifier show-apport-crashes false
Данные продолжат собираться в папке /var/crash. Их периодически необходимо чистить, чтобы они не заполняли дисковое пространство:
Для полного отключения служб Apport, в терминал вводится запись:
В появившемся тексте значение поля enable меняется с 1 на 0. В дальнейшем, чтобы снова включить службу, возвращаются настройки по умолчанию.
Заключение
Для предотвращения потери файлов жесткий диск и съемные носители рекомендуется периодически тестировать. Linux предлагает несколько подходов к решению задачи. На выбор предоставляется перечень утилит, которые выявляют поврежденные сектора и обеспечивают перенос информации на нормально функционирующее устройство.
Источник
8 советов для решения проблем с диском Linux и Unix
Can’t write to the hard disk — (не могу записать на жесткий диск) на Linux/Unix системах. Получали такое сообщение? Хотите проверить поврежден ли диск или нет? Хотите понять почему получили сообщение «диск переполнен»? Попробуйте эти 8мь советов, что бы решить проблему с диском.
1. Ошибка: Нет свободного места на устройстве
Когда диск полон на Unix-подобной системе вы получите сообщение об ошибке на экране. Вот например
Первым шагом является запуск команды DF, чтобы узнать информацию об общем пространстве и свободном пространстве в файловой системе, включая разделы:
Или попробуйте читаемый формат
Решение проблемы, когда диск полон:
Сжатие журналов и других файлов используя GZIP или bzip2
Удалить ненужные файлы с помощью команды rm на Unix-подобной системе
Перемещение файлов на другой раздел системы или внешний жесткий диск, используя Rsync команду:
Узнайте самые большие каталоги или файлы которые используют дисковое пространство на Unix-подобных systesm:
Обрезать конкретный файл. Это полезно для файла журнала:
truncate -s 0 /ftpusers/ftp.upload.log
Найти и удалить большие файлы, которые открыты, но были удалены на Linux или Unix:
2. Файловая система находится в режиме только для чтения
Вы можете в конечном итоге получить такое сообщение об ошибке следующим образом, когда вы пытаетесь создать файл или сохранить файл:
Запустите команду монтирования, чтобы узнать, файловая система смонтирована в режиме только чтение:
Чтобы устранить эту проблему, просто перемонтировать файловую систему в режиме чтения-записи:
3. Проблема с дескриптором
Иногда, DF команда сообщает, что есть достаточно свободного места, но система утверждает, файловая система заполнена. Вы должны проверить inode, которые идентифицируют файл и его атрибуты на файловых системах с помощью следующей команды:
Если 100% ваших дескрипторов используются, попробуйте следующие варианты:
- Найти ненужных файлов и удалять или перемещать на другой сервер.
- Найти нежелательные большие файлы и удалить или переместить на другой сервер.
4. Жесткий диск умирает
Ошибки ввода / вывода в лог-файл (например, /var/log/messages) указывает, что что-то не так с жестким диском, и это может быть сбой. Вы можете проверить жесткий диск на наличие ошибок, используя команду smartctl. Синтаксис:
Вы также можете использовать «Disk Utility», чтобы получить ту же информацию
5. Диску или серверу сильно жарко.
Высокие температуры могут привести к плохому функционированию. Так что вам нужно поддерживать нужной температуры сервера и диска. Высокие температуры могут привести к завершении работы сервера или повреждения системы и файлов на диске. Только современные жесткие диски имеют датчик температуры. Hddtemp поддерживает чтение SMART информации от SCSI-диски тоже. Hddtemp может работать как простой инструмент командной строки или как демон, чтобы получить информацию от всех серверов:
Источник
проблемы с жестким диском
ребята, помогите! замучился уже ве переустанавливать. жесткий диск на теробайт. форматну командой dd if=/dev/zero of=/dev/sda, накачу свеженький дебиан, и через недельку комп жалуется на ошибки жесткого диска при включении, что-то вроде systemd-fsck /dev/sda1 ВЫКИНЬ-СВОЙ-ВИНТ-НА МУСОРКУ systemd-fsck /dev/sda3 ВЫКИНЬ-СВОЙ-ВИНТ-НА МУСОРКУ и так при работе виснет наглухо. на 1м разделе корень, на 3м домашний каталог. а на 2м свап. бывали только обрывы питания, но скачков не могло быть, потому что компьютер подключен через стабилизатор (это вам не сетевой фильтр) неужели винту хана? нет ли какого решения, кроме замены винта?
говорит
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-3.16.0-4-amd64] (local build) Copyright (C) 2002-14, Bruce Allen, Christian Franke, http://www.smartmontools.org
ATA device successfully opened
Use ‘smartctl -a’ (or ‘-x’) to print SMART (and more) information
извиняюсь за кашу в посте, почему-то перено строк затерлись
smartctl -a /dev/sda smartctl 6.4 2014-10-07 r4002 [x86_64-linux-3.16.0-4-amd64] (local build) Copyright (C) 2002-14, Bruce Allen, Christian Franke, http://www.smartmontools.org
=== START OF INFORMATION SECTION === Model Family: Western Digital Caviar Blue (SATA 6Gb/s) Device Model: WDC WD10EZEX-00BN5A0 Serial Number: WD-WCC3F3883017 LU WWN Device Id: 5 0014ee 25f654af2 Firmware Version: 01.01A01 User Capacity: 1 000 204 886 016 bytes [1,00 TB] Sector Sizes: 512 bytes logical, 4096 bytes physical Rotation Rate: 7200 rpm Device is: In smartctl database [for details use: -P show] ATA Version is: ACS-2, ACS-3 T13/2161-D revision 3b SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Sun Mar 22 16:21:56 2015 MSK SMART support is: Available — device has SMART capability. SMART support is: Enabled
=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED
General SMART Values: Offline data collection status: (0x84) Offline data collection activity was suspended by an interrupting command from host. Auto Offline Data Collection: Enabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: (11280) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 117) minutes. Conveyance self-test routine recommended polling time: ( 5) minutes. SCT capabilities: (0x3035) SCT Status supported. SCT Feature Control supported. SCT Data Table supported.
SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always — 0 3 Spin_Up_Time 0x0027 175 174 021 Pre-fail Always — 2250 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always — 73 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always — 0 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always — 0 9 Power_On_Hours 0x0032 091 091 000 Old_age Always — 7150 10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always — 0 11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always — 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always — 64 192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always — 48 193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always — 117 194 Temperature_Celsius 0x0022 106 088 000 Old_age Always — 37 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always — 0 197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always — 0 198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline — 0 199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always — 0 200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline — 0
SMART Error Log Version: 1 No Errors Logged
SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 5268 — # 2 Conveyance offline Completed without error 00% 5266 — # 3 Short offline Completed without error 00% 5266 — # 4 Extended offline Aborted by host 80% 4570 —
SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
smartctl -a /dev/sda1 smartctl 6.4 2014-10-07 r4002 [x86_64-linux-3.16.0-4-amd64] (local build) Copyright (C) 2002-14, Bruce Allen, Christian Franke, http://www.smartmontools.org
=== START OF INFORMATION SECTION === Model Family: Western Digital Caviar Blue (SATA 6Gb/s) Device Model: WDC WD10EZEX-00BN5A0 Serial Number: WD-WCC3F3883017 LU WWN Device Id: 5 0014ee 25f654af2 Firmware Version: 01.01A01 User Capacity: 1 000 204 886 016 bytes [1,00 TB] Sector Sizes: 512 bytes logical, 4096 bytes physical Rotation Rate: 7200 rpm Device is: In smartctl database [for details use: -P show] ATA Version is: ACS-2, ACS-3 T13/2161-D revision 3b SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Sun Mar 22 16:27:07 2015 MSK SMART support is: Available — device has SMART capability. SMART support is: Enabled
=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED
General SMART Values: Offline data collection status: (0x84) Offline data collection activity was suspended by an interrupting command from host. Auto Offline Data Collection: Enabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: (11280) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 117) minutes. Conveyance self-test routine recommended polling time: ( 5) minutes. SCT capabilities: (0x3035) SCT Status supported. SCT Feature Control supported. SCT Data Table supported.
SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always — 0 3 Spin_Up_Time 0x0027 175 174 021 Pre-fail Always — 2250 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always — 73 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always — 0 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always — 0 9 Power_On_Hours 0x0032 091 091 000 Old_age Always — 7150 10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always — 0 11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always — 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always — 64 192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always — 48 193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always — 117 194 Temperature_Celsius 0x0022 104 088 000 Old_age Always — 39 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always — 0 197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always — 0 198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline — 0 199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always — 0 200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline — 0
SMART Error Log Version: 1 No Errors Logged
SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 5268 — # 2 Conveyance offline Completed without error 00% 5266 — # 3 Short offline Completed without error 00% 5266 — # 4 Extended offline Aborted by host 80% 4570 —
SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
Источник