LINUX.ORG.RU

[ReiserFS] Ненависть ненависть ненависть

 


0

0

Ни с того ни с сего раздел на 80Гб с рейзером стал странно себя вести: несколько файлов стало без размера, аттрибутов и вообще перестали читаться. Reiserfsck нашел эти ошибки, и потребовал чтобы его запустили с --rebuild-tree. Запустил, и после 20 часов нулевой стадии "Loading on-disk bitmap" и 20 минут первой reiserfsck выдал "try_to_insert_pointer_to_leaf: bad search result. Aborted", оставив фс в неюзабельном состоянии. Естественно при повторной попытке он начал все с самого начала и предстоит еще 20 часов чтения. Вот и как после такого можно даже задумываться о том, чтобы использовать эту фс в чем-нибудь серьезном? Вот благо раздел с не особо важной информацией был. И наверняка при второй попытке будет тоже самое.

Вопрос: неужели все так плохо и рейзер такой шлак? Можно ли как-нибудь ускорить нулевую стадию (читает со скоростью всего 1мб/сек где-то)?

anonymous

Может быть у тебя что-то с диском? У меня 0 стадия ребилда проходит за 1.5 часа максимум.

Redfoxnet
()

1. Что ты с ним делал?
2. С какими опциями форматировал? 
3. Что с винтом? 
4. о_О 
5. Ужас! 
6. У меня работает уже года четыре машинка(в технаре работал - до сих пор пашет, ибо файлопомойка жива) 
7. Де-то тут ПРОФИТ :D

wyldrodney
()

>неужели все так плохо и рейзер такой шлак?

Шлак - железо. Или ты думаешь ext3 на битых винтах нормально себя ведет?

iRunix ★★★★
()

Винт лучше проверь сначала.

anonymous
()
Ответ на: комментарий от wyldrodney

1. Файлы только скидывал, работало месяца 3.
2. С дефолтными
3. Жив здоров, бедов нет. Хотя посмотрев с помощью badblocks обнаруживаю что скорость такая же мизерная. Перегрузил - нормально стало. Странно.
4. !!!
5. Ненависть!
6. У меня на одном серваке тоже давно стоит, но без таких проблем. Хотя один раз таки пришлось перестроить через rebuild-tree.

В логах на счет девайса чисто, на беды не похоже. Какой-то странный глюк.

anonymous
()
Ответ на: комментарий от anonymous

> Хотя посмотрев с помощью badblocks

Ты смеёшься, штоле? Хотя бы smartctl -t long прогони. badblocks - практически бесполезная вата из древних времен.

anonymous
()

У меня весь диск под рейзером, без деления на разделы, корень и все. Так-то работает быстро. Но иногда начинает ни с того, ни с сего шуршать винтом, иногда задумывается на дисковых операциях. Диск на 40 Гб.

hibou ★★★★★
()
Ответ на: комментарий от anonymous

Мистика...

Во нанонимус выше посоветовал как проверить. Думаю стоит посмотреть.

Я бы ещё грешил на сам дистр. Вот у меня Убунты и Мандривы просто не могут отформатировать один раздел. Мгновенно выходят, говоря что всё сделано, а на самом деле - ничего. Даже файлы остаются. С Дебианом и ЗыЗЕй такого нет. Может тебе дистр "покачественней" взять :)

Не ради холивара, но факт разной работы имеется %)

wyldrodney
()

Отформатируй полностью винт (а лучше забей его чем-нить перед форматированием, нуликами/единичками там).

Проблема простая - релокейт бэдов хард делает сам только при записи в этот кластер.

А так - просто долго не может прочитать. Не переживай, райзер тут ни при чем - другие ФС на битых хардах так же плохо работают.

anonymous
()
Ответ на: комментарий от anonymous

# badblocks -c 256 -v /dev/hda
Checking blocks 0 to 195360983
Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found.

# smartctl --test=long /dev/hda
[...]
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 111 minutes for test to complete.
[...]
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
[...]
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     15616         -

Так что это скорее что-то с рейзером, диск то жив здоров.

anonymous
()
Ответ на: комментарий от sda00

Debian Etch, сбоивший раздел на единственном оставшемся pata диске, в системе еще 5 sata винчестеров. Проц корка дуо E8200. Система в глюках памяти и т.п. никогда не была замечена, аптаймы месяцами с перерывами на апгрейды. Раздел использовался для хранения бекапов, и как следствие на нем милионы мелких файликов (почему я и решил делать его на рейзере).

Да, возможно имел место какой-то аппаратный сбой винчестера, но единственное тому свидетельство - медленная скорость работы до перезагрузки.

anonymous
()
Ответ на: комментарий от Valmont

Тест, пройденный без ошибок, недостаточно вразумителен?

P.S. reiserfsck таки починил раздел, наплодив с десяток файлов размером в несколько тысяч терабайт каждый, а также скинув 10к файлов в lost+found.

anonymous
()
Ответ на: комментарий от Valmont

Model Family:     Seagate Barracuda 7200.7 and 7200.7 Plus family
Device Model:     ST3200822A
Serial Number:    5LJ0YCE1
Firmware Version: 3.01
User Capacity:    200.049.647.616 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   6
ATA Standard is:  ATA/ATAPI-6 T13 1410D revision 2
Local Time is:    Thu Dec 25 01:43:37 2008 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 ( 430) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        No General Purpose Logging support.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 111) minutes.

anonymous
()
Ответ на: комментарий от anonymous

SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 053 049 006 Pre-fail Always - 49519856 3 Spin_Up_Time 0x0003 097 096 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 571 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 1 7 Seek_Error_Rate 0x000f 088 060 030 Pre-fail Always - 712930947 9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15622 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 553 194 Temperature_Celsius 0x0022 049 060 000 Old_age Always - 49 195 Hardware_ECC_Recovered 0x001a 053 049 000 Old_age Always - 49519856 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0 202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0

SMART Error Log Version: 1 No Errors Logged

SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 15616 -

SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.

Reallocated_Sector_Ct уже давным давно такое, остальные счетчики ошибок вижу что здоровые, но работать это винту не особо мешает.

anonymous
()
Ответ на: комментарий от anonymous

Пардон
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   053   049   006    Pre-fail  Always       -       49519856
  3 Spin_Up_Time            0x0003   097   096   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       571
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       1
  7 Seek_Error_Rate         0x000f   088   060   030    Pre-fail  Always       -       712930947
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       15622
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       553
194 Temperature_Celsius     0x0022   049   060   000    Old_age   Always       -       49
195 Hardware_ECC_Recovered  0x001a   053   049   000    Old_age   Always       -       49519856
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     15616         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Reallocated_Sector_Ct уже давным давно такое, остальные счетчики ошибок вижу что здоровые, но работать это винту не особо мешает.

anonymous
()

Да что вы с райзером-то вытворяете?
У меня одна машина уже года четыре с корнём и шарами на reiserfs пашет. И с розетки её выдирают два раза в неделю стабильно - ничего не крешиться.

Снимайте файло на другой винт, можно даже через livecd.

Форматировать по-новой и тестить-тестить-тестить.

belomor
()
Ответ на: комментарий от anonymous

> 1 Raw_Read_Error_Rate 0x000f 053 049 006 Pre-fail Always - 49519856

Это с диском все нормально?

> 7 Seek_Error_Rate 0x000f 088 060 030 Pre-fail Always - 712930947


Вы его постоянно трясете во время чтения/записи?

> 195 Hardware_ECC_Recovered 0x001a 053 049 000 Old_age Always - 49519856


Весьма показательно.

> 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0

> 202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0


Про эти параметры ничего не знаю, но радости они не прибавляют.

andreyu ★★★★★
()
Ответ на: комментарий от andreyu

  Не скажу что такие показатели радуют, но на целостности записанных данных они не сказываются.
Или рейзер принципиально нельзя применять, когда ошибки аппаратно исправляются?

  Это вполне типичные показатели для винчестеров с таким временем работы.  Для сравнения откопал на паре машин такое:

Device Model:     ST3802110A
Seek_Error_Rate         0x000f   089   062   030    Pre-fail  Always       -       896223085
Hardware_ECC_Recovered  0x001a   066   047   000    Old_age   Always       -       137726277
Power_On_Hours          0x0032   082   082   000    Old_age   Always       -       16210

и
Device Model:     ST3120814A
Seek_Error_Rate         0x000f   086   062   030    Pre-fail  Always       -       412126719
Hardware_ECC_Recovered  0x001a   061   051   000    Old_age   Always       -       189239511
Power_On_Hours          0x0032   096   096   000    Old_age   Always       -       3636

Но нашелся и такой раритет:
Device Model:     WDC WD100BB-75AUA1
Serial Number:    WD-WMA6Y3687465
Firmware Version: 18.20D18
User Capacity:    10.005.037.056 bytes
  1 Raw_Read_Error_Rate     0x000b   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   109   103   021    Pre-fail  Always       -       1958
  4 Start_Stop_Count        0x0032   097   097   040    Old_age   Always       -       3417
  5 Reallocated_Sector_Ct   0x0032   200   200   112    Old_age   Always       -       0
  7 Seek_Error_Rate         0x000b   200   200   051    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   067   067   000    Old_age   Always       -       24292
 10 Spin_Retry_Count        0x0013   100   067   051    Pre-fail  Always       -       2
 11 Calibration_Retry_Count 0x0013   100   100   051    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3151
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0012   200   200   000    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x000a   200   253   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0009   200   200   051    Pre-fail  Offline      -       0

Видимо последний делали на века.

Так вот ни на одном из перечисленных ничего подобного не встречалось.

anonymous
()
Ответ на: комментарий от anonymous

>Power_On_Hours 0x0032 096 096 000 Old_age Always - 3636

Счетчик походу через 0 перешел, ибо он пашет уже не меньше двух лет нон-стопом. А скорее всего значительно больше.

anonymous
()
Ответ на: комментарий от belomor

Походу рейзер не очень любит когда файлов много. На этом разделе их почти 2 миллиона, из них около 300к меньше килобайта, и 900к менее 4 килобайт. Есть каталоги по 20, 40+к файлов.

Ранее, когда мне встречались подобные ошибки (файлы, которые невозможно прочитать, и требование ребилда дерева фс), такое также встречалось в каталогах на 20к+ файлов.

anonymous
()
Ответ на: комментарий от anonymous

>Походу рейзер не очень любит когда файлов много.

Походу, он один из лучших, если не лучший, справляется с тоннами мелочи :)

KRoN73 ★★★★★
()
Ответ на: комментарий от KRoN73

Tail-packing да, приятно. А вот надежность как-то не ахти...

anonymous
()
Ответ на: комментарий от belomor

> Форматировать по-новой и тестить-тестить-тестить.

может лучше использовать уже протестированное ? (ext3)

Reset ★★★★★
()

1. берется винт большой без нечитаемых секторов

2. туда копируется с помощью dd содержимое дохлого 80ГБ винта в файл. если не сможет скопировать, пропускаем нечитаемое и копируем дальше :) как это сделать хз, я свой аналог dd писал который это умеет :)

3. файл делается loopback-устройством программой losetup

4. раздел на этом lo-устройстве проверяется и ремонтируется как обычно

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.