LINUX.ORG.RU
ФорумAdmin

Система гонит, после скачки все стопорится

 


1

1

Не могу загрузить большие файлы(>500mb). После загрузки примерно 300mb начинаются тормоза, файл очень долго грузится, хотя и не прерывается и ошибок нет, другие конекты затыкаются, все висит.
В логах включил дебаг 10, ничего подозрительного нет

Entering Passive Mode
in dir_check_full(): path
passive data connection opened - local
passive data connection opened - remote
in dir_check_full(): 
dispatching LOG_CMD command 'MLSD' to mod_facts
потом ничего не идет, файл закачивается


Клиент - встроенный в MC

UPD. Дело не в FTP, пробовал загружать гигабайтный файл http://speedtest.ftp.otenet.gr/files/test1Gb.db через wget, доходит до ~34% и система впадает в ступор. Не работают команды mc, man wget и т.д. Консольно в каком то подвешеном состоянии. Отмирает через минуту где-то

★★★★

Последнее исправление: gobot (всего исправлений: 1)

Заливаю файлы с одной машины на другую в одном датацентре, иногда файл 500 мегов заливается за 5 сек., иногда затыкается на 90%

gobot ★★★★
() автор топика
Ответ на: комментарий от gobot

и все же не у всех убунту

можно tcpdump когда начинает тормозить.. И было бы интересно посмотреть что говорит команда

ftp ip_сервера

когда происходит зависание

r0ck3r ★★★★★
()
Ответ на: комментарий от r0ck3r

Проблема как удалось выяснить не в ftp, попробовал файл загрузить по http, затыкается после 800 мегов загрузки и скорость падает на порядок(до 60-238KB/s), потом снова разгоняется до 1mbps и снова затык на 20-60 сек. Что может быть?

gobot ★★★★
() автор топика
Ответ на: комментарий от gobot

Причем после скачки система стопорится, не работают команды mc, man wget, консоль просто висит

gobot ★★★★
() автор топика
Ответ на: комментарий от h578b1bde

SMART Error Log Version: 1
No Errors Logged

gobot ★★★★
() автор топика
Ответ на: комментарий от h578b1bde

А если с сетью проблемы как определить? Запускал пинг на пол часа, потерянных пакетов 0%

gobot ★★★★
() автор топика
Ответ на: комментарий от onlybugs

хах, я даже установить не могу

sudo apt-get install iperf
Reading package lists... Error!
E: Unable to synchronize mmap - msync (5: Input/output error)

gobot ★★★★
() автор топика

Сейчас система перешла Read-only

cannot create temp file for here-document: Read-only file system

Само по себе... Что за х

gobot ★★★★
() автор топика
Ответ на: комментарий от h578b1bde

В syslog вот что заметил

Feb  3 16:58:22 2 kernel: [ 7474.518327] EXT4-fs warning (device sda2): ext4_end_bio:317: I/O error -5 writing to inode 56627671 (offset 41943040 size 4141056 starting block 231207424)
Feb  3 16:58:22 2 kernel: [ 7474.518517] sd 0:0:0:0: [sda]
Feb  3 16:58:22 2 kernel: [ 7474.518521] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Feb  3 16:58:22 2 kernel: [ 7474.518525] sd 0:0:0:0: [sda] CDB:
Feb  3 16:58:22 2 kernel: [ 7474.518528] Write(10): 2a 00 6e 3f 90 00 00 04 00 00
Feb  3 16:58:22 2 kernel: [ 7474.518540] end_request: I/O error, dev sda, sector 1849659392
Feb  3 16:58:22 2 kernel: [ 7474.588683] EXT4-fs warning (device sda2): ext4_end_bio:317: I/O error -5 writing to inode 56627671 (offset 41943040 size 4141056 starting block 231207552)
Feb  3 16:58:22 2 kernel: [ 7474.588866] sd 0:0:0:0: [sda]
Feb  3 16:58:22 2 kernel: [ 7474.588870] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Feb  3 16:58:22 2 kernel: [ 7474.588874] sd 0:0:0:0: [sda] CDB:
Feb  3 16:58:22 2 kernel: [ 7474.588876] Write(10): 2a 00 6e 3f 94 00 00 03 98 00
Feb  3 16:58:22 2 kernel: [ 7474.588889] end_request: I/O error, dev sda, sector 1849660416
Feb  3 16:58:22 2 kernel: [ 7474.659033] EXT4-fs warning (device sda2): ext4_end_bio:317: I/O error -5 writing to inode 56627671 (offset 41943040 size 4141056 starting block 231207667)
Feb  3 16:58:22 2 kernel: [ 7474.659204] sd 0:0:0:0: [sda]
Feb  3 16:58:22 2 kernel: [ 7474.659208] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Feb  3 16:58:22 2 kernel: [ 7474.659212] sd 0:0:0:0: [sda] CDB:
Feb  3 16:58:22 2 kernel: [ 7474.659214] Write(10): 2a 00 6e 3f 97 f8 00 00 08 00
Feb  3 16:58:22 2 kernel: [ 7474.659227] end_request: I/O error, dev sda, sector 1849661432
Feb  3 16:58:22 2 kernel: [ 7474.729371] EXT4-fs warning (device sda2): ext4_end_bio:317: I/O error -5 writing to inode 56627671 (offset 46133248 size 4096 starting block 231207680)
Feb  3 16:58:22 2 kernel: [ 7474.729400] sd 0:0:0:0: [sda]
Feb  3 16:58:22 2 kernel: [ 7474.729404] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Feb  3 16:58:22 2 kernel: [ 7474.729408] sd 0:0:0:0: [sda] CDB:
Feb  3 16:58:22 2 kernel: [ 7474.729410] Write(10): 2a 00 3a 0a 46 20 00 00 58 00
Feb  3 16:58:22 2 kernel: [ 7474.729422] end_request: I/O error, dev sda, sector 973751840


Диск подыхает?

gobot ★★★★
() автор топика
Ответ на: комментарий от h578b1bde
=== START OF INFORMATION SECTION ===
Device Model:     HGST HTE721010A9E630
Serial Number:    JR10034M223SLK
LU WWN Device Id: 5 000cca 8a8dd25de
Firmware Version: JB0OA3M0
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA8-ACS T13/1699-D revision 6
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Fri Feb  3 17:14:19 2017 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                (   45) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 173) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   062    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   040    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   100   100   033    Pre-fail  Always       -       1
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       6
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   040    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   087   087   000    Old_age   Always       -       6048
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       4
191 G-Sense_Error_Rate      0x000a   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       3
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       79
194 Temperature_Celsius     0x0002   193   193   000    Old_age   Always       -       31 (Min/Max 18/33)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       36
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0
223 Load_Retry_Count        0x000a   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%        91         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

gobot ★★★★
() автор топика
Ответ на: комментарий от h578b1bde

Ноутбук же - для такого винта это норма. Надо mhdd пройтись, можно исправить, эсли контроллер винта поддерживается...

timdorohin ★★★★
()
Ответ на: комментарий от h578b1bde

Да не, если он крошится, лучше заменить я думаю. Написал уже в супорт...

gobot ★★★★
() автор топика

уважаемые специалисты как у меня дела?

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   119   095   006    Pre-fail  Always       -       203238417
  3 Spin_Up_Time            0x0003   096   095   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   097   097   020    Old_age   Always       -       3858
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   071   060   030    Pre-fail  Always       -       142142626791
  9 Power_On_Hours          0x0032   086   086   000    Old_age   Always       -       12440
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   020    Old_age   Always       -       3813
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   060   042   045    Old_age   Always   In_the_past 40 (Min/Max 33/40)
194 Temperature_Celsius     0x0022   040   058   000    Old_age   Always       -       40 (0 15 0 0 0)
195 Hardware_ECC_Recovered  0x001a   078   054   000    Old_age   Always       -       150503106
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   184   000    Old_age   Always       -       193
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 Data_Address_Mark_Errs  0x0032   100   253   000    Old_age   Always       -       0
это не ноутбук

amd_amd ★★★★★
()
Ответ на: комментарий от gobot

Возможно ли сделать с моего бракованного диска полную копию на новый?

Попробовать можно. Способов куча — начиная от tar и заканчивая какой-нибудь clonezilla.

h578b1bde ★☆
()
Последнее исправление: h578b1bde (всего исправлений: 1)
Ответ на: комментарий от h578b1bde

SATA-кабель менял?

в смысле менял? винчестер как переходящее знамя - живет уже в 3-ем блоке, естественно иногда кабеля туда сюда - тусуются

amd_amd ★★★★★
()
Ответ на: комментарий от amd_amd

в смысле менял? винчестер как переходящее знамя - живет уже в 3-ем блоке, естественно иногда кабеля туда сюда - тусуются

Я бы понаблюдал за значениями атрибутов ошибок, если продолжат расти — заменил бы кабель.

h578b1bde ★☆
()
Ответ на: комментарий от gobot

Понятно, спасибо!

Только будь готов к тому что некоторые файлы всё же могут оказаться битыми.

h578b1bde ★☆
()
Ответ на: комментарий от h578b1bde

Я не знаю точно, просто сказали, что нужно заменить вентиляторы. Причем менять будут хз сколько ( Наверное решают вопрос с поставщиками...

As specified in the status, it is not an issue with the disk.
We have to replace all fans on our servers.

gobot ★★★★
() автор топика

Что-то не верю я, что проблема с охлаждением.

Посмотрите, не завышен ли у вас лимит «грязных» страниц page cache'а.

Попробуйте выставить такие параметры /proc/sys через sysctl и повторите тест:

sysctl -w vm.dirty_bytes=104857600
sysctl -w vm.dirty_background_bytes=52428800

zuzzas
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.