Skocz do zawartości
Zaloguj się, aby obserwować  
Gość nrm

hdd error ?!?

Polecane posty

Gość normanos

Oct 15 04:09:12 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action x0												  
Oct 15 04:09:12 kernel: ata1.00: BMDMA stat 0x24																				   
Oct 15 04:09:12 kernel: ata1.00: cmd 25/00:38:08:65:c2/00:00:46:00:00/e0 tag 0 dma 28672 in										
Oct 15 04:09:12 kernel:		  res 51/40:00:35:65:c2/40:00:46:00:00/00 Emask 0x9 (media error)								   
Oct 15 04:09:12 kernel: ata1.00: status: { DRDY ERR }																			  
Oct 15 04:09:12 kernel: ata1.00: error: { UNC }																					
Oct 15 04:09:12 kernel: ata1.00: configured for UDMA/133																		   
Oct 15 04:09:12 kernel: ata1: EH complete																						  
Oct 15 04:09:16 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0												  
Oct 15 04:09:16 kernel: ata1.00: BMDMA stat 0x24																				   
Oct 15 04:09:16 kernel: ata1.00: cmd 25/00:38:08:65:c2/00:00:46:00:00/e0 tag 0 dma 28672 in										
Oct 15 04:09:16 kernel:		  res 51/40:00:35:65:c2/40:00:46:00:00/00 Emask 0x9 (media error)								   
Oct 15 04:09:16 kernel: ata1.00: status: { DRDY ERR }																			  
Oct 15 04:09:16 kernel: ata1.00: error: { UNC }																					
Oct 15 04:09:16 kernel: ata1.00: configured for UDMA/133																		   
Oct 15 04:09:16 kernel: ata1: EH complete																						  
Oct 15 04:09:19 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0												  
Oct 15 04:09:19 kernel: ata1.00: BMDMA stat 0x24																				   
Oct 15 04:09:19 kernel: ata1.00: cmd 25/00:38:08:65:c2/00:00:46:00:00/e0 tag 0 dma 28672 in										
Oct 15 04:09:19 kernel:		  res 51/40:00:35:65:c2/40:00:46:00:00/00 Emask 0x9 (media error)								   
Oct 15 04:09:19 kernel: ata1.00: status: { DRDY ERR }																			  
Oct 15 04:09:19 kernel: ata1.00: error: { UNC }																					
Oct 15 04:09:19 kernel: ata1.00: configured for UDMA/133																		   
Oct 15 04:09:19 kernel: ata1: EH complete																						  
Oct 15 04:09:22 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0												  
Oct 15 04:09:22 kernel: ata1.00: BMDMA stat 0x24																				   
Oct 15 04:09:22 kernel: ata1.00: cmd 25/00:38:08:65:c2/00:00:46:00:00/e0 tag 0 dma 28672 in										
Oct 15 04:09:22 kernel:		  res 51/40:00:35:65:c2/40:00:46:00:00/00 Emask 0x9 (media error)								   
Oct 15 04:09:22 kernel: ata1.00: status: { DRDY ERR }																			  
Oct 15 04:09:22 kernel: ata1.00: error: { UNC }																					
Oct 15 04:09:22 kernel: ata1.00: configured for UDMA/133																		   
Oct 15 04:09:22 kernel: ata1: EH complete																						  
Oct 15 04:09:25 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0 
Oct 15 04:09:28 kernel: ata1.00: BMDMA stat 0x24																				   
Oct 15 04:09:28 kernel: ata1.00: cmd 25/00:38:08:65:c2/00:00:46:00:00/e0 tag 0 dma 28672 in										
Oct 15 04:09:28 kernel:		  res 51/40:00:35:65:c2/40:00:46:00:00/00 Emask 0x9 (media error)								   
Oct 15 04:09:28 kernel: ata1.00: status: { DRDY ERR }																			  
Oct 15 04:09:28 kernel: ata1.00: error: { UNC }																					
Oct 15 04:09:29 kernel: ata1.00: configured for UDMA/133																		   
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE,SUGGEST_OK							   
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] Sense Key : Medium Error [current] [descriptor]										  
Oct 15 04:09:29 kernel: Descriptor sense data with sense descriptors (in hex):													 
Oct 15 04:09:29 kernel:		 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00													
Oct 15 04:09:29 kernel:		 46 c2 65 35																						
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] Add. Sense: Unrecovered read error - auto reallocate failed							  
Oct 15 04:09:29 kernel: end_request: I/O error, dev sda, sector 1187145013														 
Oct 15 04:09:29 kernel: raid1: sda2: rescheduling sector 1180847488																
Oct 15 04:09:29 kernel: ata1: EH complete																						  
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] 1465149168 512-byte hardware sectors (750156 MB)										 
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] Write Protect is off																	 
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00																  
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA					
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] 1465149168 512-byte hardware sectors (750156 MB)										 
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] Write Protect is off																	 
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00																  
Oct 15 04:09:29 kernel: sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA					
Oct 15 04:09:41 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0												  
Oct 15 04:09:41 kernel: ata1.00: BMDMA stat 0x24								
Oct 15 04:09:41 kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0												  
Oct 15 04:09:41 kernel: ata1.00: BMDMA stat 0x24																				   
Oct 15 04:09:41 kernel: ata1.00: cmd 25/00:08:30:65:c2/00:00:46:00:00/e0 tag 0 dma 4096 in										 
Oct 15 04:09:41 kernel:		  res 51/40:00:35:65:c2/40:00:46:00:00/00 Emask 0x9 (media error)								   
Oct 15 04:09:41 kernel: ata1.00: status: { DRDY ERR }																			  
Oct 15 04:09:41 kernel: ata1.00: error: { UNC }																					
Oct 15 04:09:41 kernel: ata1.00: configured for UDMA/133																		   
Oct 15 04:09:41 kernel: ata1: EH complete

 

serwer (ovh superplan) mi padł w nocy, to są ostatnie komunikaty w logach. niestety nie znam się na tym, widzę, że jakieś problemy z HDD ale co konkretnie o to już chciałbym spytać jakiegoś mastaha :P mam zacząć się martwić? :/

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość normanos

nie umiem obsłużyć tego toola :/

 

smartctl --all /dev/md2
Smartctl: please specify device type with the -d option.
VALID ARGUMENTS ARE: ata, scsi, marvell, 3ware,N, cciss,N

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość patrick

Znaczy nie chodzi o macierze programowe mdX, a dyski czyli /dev/sda /dev/sdb.

Tryb rescue ovh, generuję chyba jak dobrze pamiętam logi smarta via www.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
nie umiem obsłużyć tego toola :/

 

smartctl --all /dev/md2
Smartctl: please specify device type with the -d option.
VALID ARGUMENTS ARE: ata, scsi, marvell, 3ware,N, cciss,N

 

na 99% dysk uwalony

 

zobacz

 

smartctl -d ata -a /dev/sda

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
na 99% dysk uwalony

 

ja bym powiedział, że podany wyżej wycinek wiadomości kernela

 

 

plus informacja, że sprawa się tyczy maszyny w OVH, daja nie 99, a 101% pewności ;)

 

w OVH dyski padają jeden za drugim, ja osobiście jeszcze nie maiłem przyjemności

 

na 5 maszyn dostać takiej, co problemów z dyskami nie miała...

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość normanos
smartctl version 5.36 [x86_64-unknown-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:	 ST3750330AS
Serial Number:	5QK0EXP5
Firmware Version: SD15
User Capacity:	750,156,374,016 bytes
Device is:		Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  Not recognized. Minor revision code: 0x29
Local Time is:	Sun Nov  2 12:09:02 2008 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
				was completed without error.
				Auto Offline Data Collection: Enabled.
Self-test execution status:	  (   0)	The previous self-test routine completed
				without error or no self-test has ever 
				been run.
Total time to complete Offline 
data collection: 		 ( 634) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
				Auto Offline data collection on/off support.
				Suspend Offline collection upon new
				command.
				Offline surface scan supported.
				Self-test supported.
				Conveyance Self-test supported.
				Selective Self-test supported.
SMART capabilities:			(0x0003)	Saves SMART data before entering
				power-saving mode.
				Supports SMART auto save timer.
Error logging capability:		(0x01)	Error logging supported.
				General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 ( 178) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME		  FLAG	 VALUE WORST THRESH TYPE	  UPDATED  WHEN_FAILED RAW_VALUE
 1 Raw_Read_Error_Rate	 0x000f   114   099   006	Pre-fail  Always	   -	   60151267
 3 Spin_Up_Time			0x0003   095   094   000	Pre-fail  Always	   -	   0
 4 Start_Stop_Count		0x0032   100   100   020	Old_age   Always	   -	   14
 5 Reallocated_Sector_Ct   0x0033   100   100   036	Pre-fail  Always	   -	   0
 7 Seek_Error_Rate		 0x000f   078   060   030	Pre-fail  Always	   -	   8716963970
 9 Power_On_Hours		  0x0032   098   098   000	Old_age   Always	   -	   1916
10 Spin_Retry_Count		0x0013   100   100   097	Pre-fail  Always	   -	   0
12 Power_Cycle_Count	   0x0032   100   100   020	Old_age   Always	   -	   14
184 Unknown_Attribute	   0x0032   100   100   099	Old_age   Always	   -	   0
187 Unknown_Attribute	   0x0032   100   100   000	Old_age   Always	   -	   0
188 Unknown_Attribute	   0x0032   100   100   000	Old_age   Always	   -	   0
189 Unknown_Attribute	   0x003a   100   100   000	Old_age   Always	   -	   0
190 Unknown_Attribute	   0x0022   074   061   045	Old_age   Always	   -	   639041562
194 Temperature_Celsius	 0x0022   026   040   000	Old_age   Always	   -	   26 (Lifetime Min/Max 0/19)
195 Hardware_ECC_Recovered  0x001a   043   018   000	Old_age   Always	   -	   60151267
197 Current_Pending_Sector  0x0012   100   100   000	Old_age   Always	   -	   0
198 Offline_Uncorrectable   0x0010   100   100   000	Old_age   Offline	  -	   0
199 UDMA_CRC_Error_Count	0x003e   200   200   000	Old_age   Always	   -	   0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


SMART Selective self-test log data structure revision number 1
SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
1		0		0  Not_testing
2		0		0  Not_testing
3		0		0  Not_testing
4		0		0  Not_testing
5		0		0  Not_testing
Selective self-test flags (0x0):
 After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość patrick

Tak w ovh są awarie dysków, ja z tego co pamiętam to zaliczyłem w sumie chyba 3 plus jedna coś z płytą główną/cpu.

 

@normanos ok jest, w podanym smart logu.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
A jakiś pomysł jak sprawdzać te dyski USB, które oferują?

 

ja zawsze do sprawdzania dysku używam 'dd' z opcją zapisu i odczytu. Każdy sektor/blok dysku jest wtedy sprawdzany. Warunek jest tylko taki, że nie moze na tym dysku stać system.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
@normanos ok jest, w podanym smart logu.

1 Raw_Read_Error_Rate 0x000f 114 099 006 Pre-fail Always - 60151267

7 Seek_Error_Rate 0x000f 078 060 030 Pre-fail Always - 8716963970

195 Hardware_ECC_Recovered 0x001a 043 018 000 Old_age Always - 60151267

 

To na pewno nie jest ok.

Raczej dysk do wymiany..

 

Pozdrawiam,

krzaq.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Bądź aktywny! Zaloguj się lub utwórz konto

Tylko zarejestrowani użytkownicy mogą komentować zawartość tej strony

Utwórz konto

Zarejestruj nowe konto, to proste!

Zarejestruj nowe konto

Zaloguj się

Posiadasz własne konto? Użyj go!

Zaloguj się

Zaloguj się, aby obserwować  

×