Failed command read dma linux

Arch Linux

You are not logged in.

#1 2014-12-07 07:31:05

[SOLVED] libata: status failed command: READ DMA

acquired a new amd R7 SSD to boost up my asus 1000H experience (it quiet actually does the double of the rotating seagate integrated) and are watching those errormessages during boot.

The Last 3 Lines are for the support if i have to return the drive. (Nobody wants to know his car will explode for sure and ride it until it realy does)

No occasional Errors.
The drive doesn’t spit out errors if plugged through multiple 2,5» to usb adaptors (diversing brands also), it isn’t affected by the actual kernel since i started with 3.16 and upgraded lately to 3.17 and the error-message persists in similar matters.
Using a different PC (wortmann/clevo 1547p) results in no error-messages (same procedure 3.16 and .17 kernel, internal SATA and external through the adaptors).
If i use the delivered HDD, the various other 2,5» HDD’s lying around my table or whatever doesn’t result in error-messages either, thus i think the sata-port isn’t damaged on the pc-side. Blowing dust from the connectors and ensuring the drive was in place [check!]

I tried both multiple times, with live and resident OS.
No bad sectors, last time trimmed: 05122014.

To conclude: the Error-messages do not impose a threat on the performance, they are simply annoying :s Googling did reveal similar problems and error messages but never as is, so i consider myself a postworthy case.

I’m using openrc.
P.S. on systemd it also spits out the errors above

Solution:
I read in the libata-sourcecode and greped the error messages in the ata part of the kernel sources and got some known issues with OCZ-SSD’s in combination with DMA.
Disabling of DMA solved the problem and rendered the drive access ultra slow, so i searched anew, another read in the sources brought me to the assumption that something with AHCI could be wrong, i googled and revealed
https://www.bios-mods.com/forum/Thread- … eePC-1000H
which proposes a bios-mod which enables AHCI-capabilities already present on the ASUS1000H.
/*not encouraging to upgrade your bios, consider your case!*/

I changed the bios to the modded one and alas the error is gone, the speed is remarkably better.

Sadly i’m not able to explain the issue or the solution technically correct.

With kind regards, frig

Last edited by frig (2015-01-13 02:46:07)

Источник

[HDD] failed command: READ DMA EXT

Доброого времени суток.

Заметил в логах следующее:

Обратил внимание на это когда обнаружил редкие фризы чтения с этого диска.

На smartctl -H /dev/sda ругани нет, но на тесты результат такой:

Готовиться к худшему ?

Сейчас ищу бэды.

PS НЖМД — WD green 1TB, фс — reiserfs ошибок не находит

1. Попробуй поменяй кабель.

2. Попробуй переключить режимы IDE/AHCI/RAID

Для начала просто вынуть и вставить кабель обратно — иногда помогает.

Тоже хотел написать о кабеле, но похоже это таки не кабель, а винт. Поясню почему, у меня как раз на днях отвалился кабель, так ошибок было много, но других.

Вот — host bus error

В тоже самое время у меня grep media /var/log/messages* не выдает ничего, а в данном случае именно media error.

Поэтому таки да, готовится к худшему.

> Тоже хотел написать о кабеле, но похоже это таки не кабель, а винт

Почему похоже — так и есть, винт сообщает о media error

Почему похоже — так и есть, винт сообщает о media error

Ну я это и имею ввиду, а «похоже» — это на случайный 0.001% вероятности «всякое бывает, мало ли».

Только вчера подобное у себя исправлял (успешно). MHDD восстановил три софт-бэда.

Вот есть подозрение, что это софт-бэды, вообще, разбираться стал после того как грохнулась корневая фс из-за плохого контакта на разъёме питания.

badblocks /dev/sda3 (именно раздел, а не всё устройство) находил бэды. На расстройствах снёс всю фс (тем более, что там всё старое было и пришло время переделать кое-что), бэды исчезли.

В данном случае всё несколько сложнее ибо на разделе данных гигов на 800, действительно нужного из этого не так много, но всё же не хотелось бы терять, а забэкапить пока некуда. Попробую с mhdd поколдовать.

+ спокойствие SMART’а наводит на мысли, как что определится — отпишусь.

MHDD с ремапом — долго конечно, но что делать.
badblocks достаточно тупая вещь т.к. не показывает характер повреждений. В моём случае было несколько жестких перезагрузок как раз из-за проблем с разъемом питания.

У меня ошибки UNC (Unrecoverable?) бывают на винчестерах с бэдами. Большинство лечится MHDD или Викторией с Erase Delays

MHDD проблем не нашёл, дело в фс. поиграюсь намедни.

Значит, проблема в интерфейсе, но никак не в ФС. Они на разных уровнях

>>MHDD проблем не нашёл, дело в фс. поиграюсь намедни.

Значит, проблема в интерфейсе, но никак не в ФС. Они на разных уровнях

Не факт. Диск мог ремапнуть проблемный сектор. Media error не может быть из-за интерфейса или ФС (если это, конечно, не баг в драйвере).

Вроде ничего не ремапнуто и видно, что свежие тесты проходят без выявления ошибок, смущает только Offline_Uncorrectable = 4, то есть, если не ошибаюсь, есть (или когда-то были) 4 сектора, доступ к которым замедлен. Попробую провести long-тест, но сейчас никаких проблем нет.

Кстати, ошибки начали проявляться после проблем с питанием и только когда пытался качать с торрентов то, что качалось в момент сбоя питания. И потом в закачке были обнаружены ошибки. Сейчас проблем вроде нет.

В общем, железячных проблем с винчестером не нашёл, даже значение Offline_Uncorrectable обнулилось. Однако ж недавно (по мере заполнения винчестера )вот что в логах обнаружил:

Я так понимаю, что когда нжмд испытывал проблемы с питанием (а в это время на него производилась запись), он мусору набросал в незаполненное пространство, а по мере заполнения диска вылезают подобные ошибки, надо было с самого начала сделать

—scan-whole-partition, -S This option causes —rebuild-tree to scan the whole partition but not only the used space on the partition

Источник

[РЕШЕНО] Failed command: READ DMA

# 5 лет, 5 месяцев назад (отредактировано 5 лет, 5 месяцев назад) Здравствуйте!
Есть свежеустановленная система ArchLinux(поставлены только base, base-devl, grub-bios), при попытке загрузиться в неё вижу сообщение
и дальше система не грузится(доходит до kernel panic).

Сообщение возникает при попытке подмонтировать разделы tmp, var, home, boot, в общем всего кроме root — root монтируется удачно и fsck его проверяет. SmartMonTools ни каких ошибок не показывает, mHDD говорит что hdd просто идеальный. Пробовал файловые системы ext4 и ext3.
При использовании ext4 с параметром ядра libata.force=noncq ещё есть вот такая вот ошибка
Грешу на ядро арча, тк если установить RFRemix(Fedora) 23 — всё работает просто идеально.

Прошу совета в какую сторону копать. Заранее спасибо!
HDD: SAMSUNG Spinpoint M8 ST1000LM024 (HN-M101MBB)
Kernel: 4.4.5-1
Notebook: Lenovo P585
smartctl -a /dev/sda1
Interrupted (host reset) — при повторном сканировании выключили ноут.

Дык, включите ноут и проведите тесты до конца. Ваша ошибка четко указывает на железные проблемы.
Либо форматируйте с проверкой на бедблоки, но все равно это ненадолго. (ИМХО)
# 5 лет, 5 месяцев назад (отредактировано 5 лет, 5 месяцев назад)

kurych
Дык, включите ноут и проведите тесты до конца. Ваша ошибка четко указывает на железные проблемы.
Либо форматируйте с проверкой на бедблоки, но все равно это ненадолго. (ИМХО)

говорит (0/0/0 errors)

По поводу тестов — это был повторный который оборвали.
Если проблема явно железная(я тоже сначала к этому склонялся), то почему Ф23 нормально стартует и ни на что не ругается?

# 5 лет, 5 месяцев назад (отредактировано 5 лет, 5 месяцев назад) и проблема решилась)
P.S. косяк ядра 4.5 и AMD A* CPU

© 2006-2021, Русскоязычное сообщество Arch Linux.
Название и логотип Arch Linux ™ являются признанными торговыми марками.
Linux ® — зарегистрированная торговая марка Linus Torvalds и LMI.

Источник

Проблемы с жестким диском SATA

Уже пару месяцев время от времени наблюдаю такие сообщения на текстовую консоль и в syslog :

При этом комп подвисает, иногда наглухо, приходится ресетить. Естественно, в ext3 при этом появляются пробелмы, они лечатся fsck, который никаких бэдов на диске не находит.

Поиск в инете по названиям/кодам ошибок почти ничего не дал, нашел только, что дело может быть в SATA кабеле. Поменял сам кабель, воткнул в другой разьем на плате — все равно иногда появляется эта ботва, правда гораздо реже.

Что это может быть? Контроллер на материнке? На самом диске? Какие-то проблемы в ОС/драйверах, которые это провоцируют?

система Debian 6.0.3, ядро 2.6.32-5-686

Проверь кабельки, жельтенькие или красненькие. вдруг кто-то пытался их перерезать ну и быстренько переноси свою помойку на другой винт.

В моем случае это как раз эти кабельки болтались, винт был в норме.

Бери-ка кабелёчки только с металлич. зажимочками, чтобы не болталися.

Контроллер на материнке? На самом диске? Какие-то проблемы в ОС/драйверах, которые это провоцируют?

А вот все вышеперечисленное!

Контроллер на материнке может сдохнуть. Могут микротрещины на маме быть.

Контроллер на жестком дохнет — нефиг делать. Самый прикольный случай — был искровой контакт на разъеме питания диска. Вылечилось пайкой.

Проблемы в драйверах могут быть. И проверить можно только методом проб и ошибок с заменой либо гугленьем с версией ядра и версией контроллера.

fsck, который никаких бэдов на диске не находит.

fsck не ищет на дисках бэды (если не считать e2fsck с параметром -c).

Загляните в его SMART. Убедитесь в том, что шлейфы целы.

кабельки питания? кабель данных SATA один и он красный. бекап в процессе 🙂

Увы, гугление с версией ядра и номерами ошибок ничего не дало, с контроллером попробую.

Метод проб и ошибок это хорошо, но у меня нет под рукой другой материнки/другого компа, другой диск есть, но он IDE и еще более старый и подозрительный 🙂

Других поводов менять диск нет, места пока хватает, и не хочется выкидывать деньги просто так. Тогда уж проще надежнее сразу новый комп покупать и ставить на него ОС заново, перенося только данные.

Источник

unixforum.org

Форум для пользователей UNIX-подобных систем

  • Темы без ответов
  • Активные темы
  • Поиск
  • Статус форума

Решено: Ошибки при загрузке — что-то про DMA (помогите расследовать)

Модератор: Bizdelnick

Решено: Ошибки при загрузке — что-то про DMA

Сообщение dergachev » 04.05.2010 21:18

При этом недавно накрылась windows 7: сначала стала просто грузиться по десять минут, потом при загрузке давала какой-то input-output error; а вот в разных линуксах при загрузке стали сыпаться примерно такие ошибки, хотя потом всё идеально работает. Причем при подключении одного конкретного диска они тоже порой сыпятся где-то по десять минут прежде чем что-либо начнет работать, а если его не подключать (то есть не монтировать) — только то, что показано выше.

Re: Решено: Ошибки при загрузке — что-то про DMA

Сообщение xoomer » 05.05.2010 00:14

dergachev, а если попробовать вbIключить UDMA и включить режим PIO на всех дисках?

знать бbI, что значит ata2.01 — ето как я понимаю накопитель на 4-м коннекторе SATA ?? (возможно, ошибаюсь)

Что я бbI сделал:
— насчет PIO я уже писал
— попробовал бbI отключить вторую ветку SATA-контроллера
— и подумал бbI о сохранении даннbIх на жестких дисках и о сохранении самих жестких дисков. Желательно бbI старbIй диск для разбора етого всего дела, т.к. я понимаю проблема не в HDD, а в чем-то другом.

Источник

Читайте также:  Аналог vsco для windows phone
Оцените статью