LINUX.ORG.RU
ФорумTalks

[наброс][файловые системы][надёжность] #Ext4 подвела…

 ,


0

2
File ??? (inode #18051, mod time Fri Feb 18 03:03:58 2011) 
  has 1 multiply-claimed block(s), shared with 6 file(s):
	??? (inode #296979, mod time Fri Feb 18 03:03:58 2011)
	... (inode #295379, mod time Fri Feb 18 03:03:58 2011)
	/www/.maildir/new/1297987438.V803I40843M183636.aviaport (inode #264259, mod time Fri Feb 18 03:03:58 2011)
	??? (inode #83267, mod time Fri Feb 18 03:03:58 2011)
	??? (inode #62163, mod time Fri Feb 18 03:03:58 2011)
	??? (inode #16179, mod time Fri Feb 18 03:03:58 2011)
Clone multiply-claimed blocks? yes

Перехвалил я ext4. При отрубании питания у хостера вылетели тонны сбоев на /var. Конечно, случай пока единственный, но на reiserfs за несколько лет и многие десятки, если не сотни нештатных отрубаний таких потерь не было.

Что умиляет — over9k ошибок в совершенно статических файлах, которые никем не трогались и не менялись…

★★★★★

Ответ на: комментарий от KRoN73

Честно говоря не знаю современного положения дел, поэтому обзора по текущим ДЦ дать не могу. Лично моя помойка стоит в wahome.ru, я в целом доволен.

true_admin ★★★★★
()
Ответ на: комментарий от KRoN73

Вот только за много лет практики с reiserfs таких сбоев не было.

А у меня было. И очень круто. Самое обидное, что тихое обнуление некоторых файлов было замечено слишком поздно, и резервные копии совершенно не помогли.

Deleted
()
Ответ на: комментарий от DNA_Seq

> От кешировния записи могут пропасть данные на любой системе

Данные. Но не нарушать же из-за этого целостность файловой системы

namezys ★★★★
()
Ответ на: комментарий от unanimous

>А то может она просто по-тихому сливает твои данные в /dev/null, а ты наивно об этом не знаешь.

Да. Но если за 5 лет работы на этой системе и ещё за два года после переноса её данных на другую систему ничего не пропало — то можно с уверенностью считать, что ничего не «сливалось» :)

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

> Но если за 5 лет работы на этой системе и ещё за два года после переноса её данных на другую систему ничего не пропало — то можно с уверенностью считать, что ничего не «сливалось» :)

У тебя есть _убедительные_ данные о том, что ничего не пропало. Хотя бы там контрольные суммы менеджером пакетов проверенные (rpm такое может, как остальные — не знаю).

И ты не ответил на первую часть вопроса — о причинах устойчивости. Как ты понимаешь, «нахаляву» ничего не бывает и должно рассматриваться исключительно как твоя персональная удача.

unanimous ★★★★★
()
Ответ на: комментарий от GotF

Надо было монтировать с data=journal, если часто электричество кончается.

Не надо! Это опция будет удалена из ядра. Вместо нее есть barriers.

Deleted
()

Диск проверяется уже четыре часа. Что оно там столько времени делает-то??

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

> На упавшем сейчас сервере она полтора года простояла без нареканий

Судя по сроку ядрышко сильно старое. Это чо за сервер такой, что и ext4 есть и года 1.5 стоит? Я бы ваще на ядрах 28-31 не стал ext4 юзать. А 32 выйти то вышло, но в отполировали не сразу и в приличные дистры типа шляпы или дебиана попало сильно позже.

Lordwind ★★★★★
()
Ответ на: комментарий от KRoN73

>> Диск проверяется уже четыре часа. Что оно там столько времени делает-то??

Многовато. Вполне вероятно, от ФС там мало что останется.

GotF ★★★★★
()
Ответ на: комментарий от DNA_Seq

>> Журналирование данных тем способом, которым оно реализовано в ext3, не гарантирует их сохранность

Ты уверен, что понимаешь, о чём говоришь? Хотелось бы видеть какое-то обоснование для такого заявления.

GotF ★★★★★
()

ext3 наше ффсио

// тред не читал

tailgunner ★★★★★
()

Кстати, такой вопрос — если прервать проверку — оно нормально переживёт? :)

А то не в screen'е запустил, нужно переходить на другую машину.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от GotF

Журналирование данных гарантирует их сохранность только при хранении журнала на отдельном разделе а лучше диске, хоть и безопаснее журналирования только операций

DNA_Seq ★★☆☆☆
()
Ответ на: комментарий от KRoN73

Вопрос - ты запустил fsck.ext4 или fsck.ext3? Я как-то проверил ext4 последним. Моторная память, блин. Проверяло как раз очень долго и очень много правило. Потом пришёл в себя запустил fsck.ext4 - проверка пролетела за несколько минут, как ext4 и положено. Кстати, данные от «чужой» проверки не пострадали

router ★★★★★
()
Ответ на: комментарий от router

А почему ты вообще запускаешь fsck.ext*, а не просто fsck? Или суперблок поврежден настолько, что тип ФС уже не определить?

unanimous ★★★★★
()
Ответ на: комментарий от DNA_Seq

>> Журналирование данных гарантирует их сохранность только при хранении журнала на отдельном разделе а лучше диске

Впервые слышу, если честно. Пруф?

GotF ★★★★★
()
Ответ на: комментарий от DNA_Seq

>Журналирование данных

нету никакого журналирования данных. Журналируются только метаданные ФС. И это делается для того, чтобы в случае проблем, можно было быстро выявить незавершенные транзакции и быстро устранить неконсистентность ФС (а не как в FAT32, пробегать по «всем файлам» на разделе и искать осиротевшие кластеры или цепочки из них)

n_play
()
Ответ на: комментарий от router

>Вопрос - ты запустил fsck.ext4 или fsck.ext3?

Я e2fsck запустил, как оно мне посоветовало в dmesg'е или где-то ещё там, не помню :)

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от anonymous

>> Надо было использовать ext3
И ждать, ждать, ждать, ждать…

wintrolls ☆☆
()
Ответ на: комментарий от n_play

>> нету никакого журналирования данных. Журналируются только метаданные ФС.

Лолшто?

GotF ★★★★★
()
Ответ на: комментарий от DNA_Seq

>> Го ту википедия

Это слив?

И таки если ты утверждаешь, что журналирование в Ext порочно неумением использовать внешний журнал, то у меня для тебя плохие новости, потому что оно его умеет.

GotF ★★★★★
()
Ответ на: комментарий от KRoN73

:D Тогда, скорее всего, данные не пострадали, зато ближайшие несколько часов оно будет вырезать всякие расширенные возможности ext4. Я бы прервал проверку и запустил fsck.ext4

router ★★★★★
()
Ответ на: комментарий от unanimous

>А почему ты вообще запускаешь fsck.ext*, а не просто fsck? Или суперблок поврежден настолько, что тип ФС уже не определить?

Я хитрый и осторожный. Потому что один раз уже подложил свинью самому себе.

router ★★★★★
()
Ответ на: комментарий от router

>:D Тогда, скорее всего, данные не пострадали, зато ближайшие несколько часов оно будет вырезать всякие расширенные возможности ext4.

?

«e2fsck is used to check the ext2/ext3/ext4 family of file systems»

KRoN73 ★★★★★
() автор топика

нет по-прежнему систем кроме райзера (

anon1984
()

у меня довольно часто вырубается питание и несколько раз в системник попадала молния. 4 винта все с ext3. серьёзных потерь не было ни разу с 2007.

AGUtilities ★★★
()
Ответ на: комментарий от router

> Потому что один раз уже подложил свинью самому себе.

перепутав fsck.ext3 с fsck.ext4?

unanimous ★★★★★
()
Ответ на: комментарий от KRoN73

> это первый отказ у хостера за последние лет пять, наверное. Но машина посыпалась сразу.

Много вариантов:
— хостинг на виртуальной машине на эмулируемом диске запись в который кешируется в хостовой ОС.
— хотсер конкретно облажался и батарейка на RAID котроллере года два как не работала.
...

Eshkin_kot ★★
()
Ответ на: комментарий от router

>Тогда умолкаю и с интересом жду результата :)

Нажал Ctrl-C полчаса назад. До сих пор работает :) То ли ждёт удобного случая, чтобы завершиться, то ли игнорирует Ctrl-C. Более жёстко останавливать уже точно не рискну :) Пусть копается…

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от Eshkin_kot

>Много вариантов

Железка своя. Co-location.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от KRoN73

> e2fsck уже полтора часа работает. Интересно, долго ещё?

Это значит, что писец данным. Наверняка каждый файл индивидуально обрабатывает, разрывает ссылки с inode (даже те, что по факту как бы сохранились, но e2fsck считает их в чём-то повреждёнными).

Сам недавно переводил сайт на новый сервер, а бэкапы настроить не успел. Потерял в итоге месяц работы, теперь ежедневно всё бэкапится разными способами на разные тачки. ФС - ext3, данные - мясо, но в моём случае проблема была хардверная - отказал винт.

karbofos
()

Перехвалил я ext4. При отрубании питания у хостера вылетели тонны сбоев на /var. Конечно, случай пока единственный, но на reiserfs за несколько лет и многие десятки, если не сотни нештатных отрубаний таких потерь не было.

На одной из предыдущих работ было развёрнуто около тыщи серверов на говножелезе в местах с обычным бытовым питанием. Проблем с внезапным ребутом железа или отрубанием электричества было море, были перепробованы все популярные файловые системы (ext3, reiserfs, xfs, jfs), в итоге остановились (вернулись) на ext3 для рутового раздела, ибо система на ней, в среднем, лучше переживала сбои.

Для данных использовалась xfs, которая при обнаружении критических проблем просто грохалась и создавалась заново.

mv ★★★★★
()

У меня один вопрос =]

Почему ты таки использовал ext4, учитывая успешный опыт с reiserfs?

neocrust ★★★★★
()
Ответ на: комментарий от mv

>в итоге остановились (вернулись) на ext3 для рутового раздела

Рутовый-то раздел у меня цел :) Только /var заглючил.

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от neocrust

>Почему ты таки использовал ext4, учитывая успешный опыт с reiserfs?

ext4 заметно быстрее. Меньше вводит машину в iowait на интенсивных операциях. И до сегодняшнего дня опыт ext4 тоже был успешный. Так что при конфигурировании новых серверов вопрос был очевиден :D



Впрочем, если новый сервер буду делать, всё равно ext4 возьму…

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от desruptor

>> Альтернативы? :)

Требования? :)


Честный безлимит, не более 2400руб/мес., не чаще одного сбоя по питанию в 5 лет :)

KRoN73 ★★★★★
() автор топика
Ответ на: комментарий от mv

> около тыщи серверов на говножелезе в местах с обычным бытовым питанием

Если не секрет, что гоняли на них?

Manhunt ★★★★★
()
Ответ на: комментарий от desruptor

>Колокейшн или аренда?

Колокейшн. Стандартный 1U. Блок питания, ЕМНИП, 280Вт. Короче, меньше, чем 350Вт, после которых у Агавы доплата за электроэнергию начинается :)

KRoN73 ★★★★★
() автор топика

>>но на reiserfs за несколько лет и многие десятки, если не сотни нештатных отрубаний таких потерь не было.

это что же с машиной делать надо было?

zloy_linuxoid
()

ни разу не сыпалась ни ext2 ни ext3 ни ext4. Уж сколько я комп ни резетил. Эт опросто карма.

dikiy ★★☆☆☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.