Serverino impallato

Problemi e discussioni inerenti al networking, ai server, backup dati e alla sicurezza in generale
Rispondi
Lke
Novello Arciere
Messaggi: 26
Iscritto il: 21 gennaio 2010, 16:43

Messaggio da Lke » 15 giugno 2010, 9:31

Come molti altri, uso un pentium 3 come serverino per torrent e plowshare.

Vi accedo tramite ssh, visto che non monta scheda video o quant altro.

E' attiva anche l'interfaccia web wTorrent per rTorrent.

Veniamo al problema: ultimamente capita sempre più spesso che, dopo essere stato acceso durante la notte, alla mattina lo trovo inaccessibile sia da wtorrent che da ssh e la lucina dell'HD davanti (l'unica che ho lasciato collegata) è spenta.

Intuisco che sia impallato, ma non capisco il motivo.

E' quasi un mese che è attivo (non 24/24) e il suo sporco lavoro lo ha fatto...

Se può essere utile posso collegare al volo momentaneamente una scheda video e un monitor.

Edit: ero collegato con ssh e screen si è chiuso con signal 7: Googlando ho trovato questo: "SIGBUS 10,7,10 Core Bus error (bad memory access)"
Ultima modifica di Lke il 15 giugno 2010, 10:17, modificato 1 volta in totale.

aleph
Robin Hood
Messaggi: 1530
Iscritto il: 12 febbraio 2008, 16:30
Contatta:

Messaggio da aleph » 15 giugno 2010, 11:55

lo schermo sicuramente è utile, prova a fare dei test della memoria (con memtest, un tool che trovi sul cd di arch o nei repo) . . se l'hardware è vecchio facile che uno dei banchi di memoria sia difettoso e occasionalmente blocchi tutto, fai il test con un banco alla volta e vedi . .
se non è quello controlla l'hd (ma non credo) e ovviamente i log (in /var/log/ ) ..
ImmagineOutside of a dog, computers are a man's best friend, inside a dog it's too dark to type.

Lke
Novello Arciere
Messaggi: 26
Iscritto il: 21 gennaio 2010, 16:43

Messaggio da Lke » 15 giugno 2010, 12:34

aleph ha scritto:lo schermo sicuramente è utile, prova a fare dei test della memoria (con memtest, un tool che trovi sul cd di arch o nei repo) . . se l'hardware è vecchio facile che uno dei banchi di memoria sia difettoso e occasionalmente blocchi tutto, fai il test con un banco alla volta e vedi . .
se non è quello controlla l'hd (ma non credo) e ovviamente i log (in /var/log/ ) ..
Grazie della risposta!
Di banchi di memoria ne ho solo uno montato, eventualmente potrei sostituirlo, ne ho almeno un altro paio. Parto subito con un memtest...

Edito per evitare il doppio post:
2 memtest passati correttamente 0 errori, media di 22 minuti ciascuno (256MB di memoria). Sto provando smartctl long, tra 79 minuti il responso.

Altrimenti cosa posso cercare nei log?

Aggiungo che durante l'hashing di un file torrent (con rtorrent, ma anche con btdownloadcurse.py), sempre lo stesso, sempre nello stesso punto, il programma si blocca ed esce segnalando un errore di IO.
Ultima modifica di Lke il 15 giugno 2010, 16:33, modificato 1 volta in totale.

Lke
Novello Arciere
Messaggi: 26
Iscritto il: 21 gennaio 2010, 16:43

Messaggio da Lke » 17 giugno 2010, 14:35

Il serverino sta andando da più di 24 ore e funziona correttamente.
L'hard disk sembra avere problemi: sia il long che diversi short (smartctl) restituiscono "Completed: Read Failure".
Intuisco che questa cosa sia coerente con il problema del check hash del torrent.

Codice: Seleziona tutto

=== START OF INFORMATION SECTION ===
Model Family:     SAMSUNG SpinPoint P120 series
Device Model:     SAMSUNG SP2014N
Serial Number:    S0A3J10Y308152
Firmware Version: VC100-30
User Capacity:    200,049,647,616 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 4a
Local Time is:    Thu Jun 17 16:26:42 2010 CEST

==> WARNING: May need -F samsung3 enabled; see manual for details.

SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Codice: Seleziona tutto

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       00%      4380         132206865
# 2  Short offline       Completed: read failure       00%      4380         132206865
# 3  Short offline       Completed: read failure       00%      4380         132206865
# 4  Short offline       Completed: read failure       00%      4380         132206865
# 5  Short offline       Completed: read failure       00%      4380         132206865
# 6  Short offline       Completed: read failure       00%      4380         132206865
# 7  Short offline       Interrupted (host reset)      90%      4379         -
# 8  Extended offline    Completed: read failure       00%      4377         132206865
# 9  Abort offline test  Aborted by host               90%      4362         -
#10  Short offline       Completed without error       00%      4346         -
#11  Abort offline test  Aborted by host               90%      4346         -
#12  Short offline       Completed without error       00%      4323         -
#13  Short offline       Completed without error       00%      4323         -
Al momento il tempo a mia disposizione è poco, dato il periodo di esami dell' uni.
Attendo proposte, idee, consigli.

Edit: Sembra divertente ;) :
Bad block howto
Ultima modifica di Lke il 17 giugno 2010, 14:57, modificato 1 volta in totale.

aleph
Robin Hood
Messaggi: 1530
Iscritto il: 12 febbraio 2008, 16:30
Contatta:

Messaggio da aleph » 17 giugno 2010, 15:15

se i danni non sono estesi puoi usare le funzioni incluse in badblocks e nei tool ext2 per creare una lista dei blocchi difettosi e riformattare in maniera da escluderli, però se il disco inizia a rompersi io andrei piuttosto a rimpiazzarlo subito con un disco nuovo . . .
ImmagineOutside of a dog, computers are a man's best friend, inside a dog it's too dark to type.

Lke
Novello Arciere
Messaggi: 26
Iscritto il: 21 gennaio 2010, 16:43

Messaggio da Lke » 17 giugno 2010, 15:21

aleph ha scritto:se i danni non sono estesi puoi usare le funzioni incluse in badblocks e nei tool ext2 per creare una lista dei blocchi difettosi e riformattare in maniera da escluderli, però se il disco inizia a rompersi io andrei piuttosto a rimpiazzarlo subito con un disco nuovo . . .
Sto provando con l' How to postato: di settori problematici ce ne sono 2, di cui uno sicuramente vuoto.
Con questo metodo si evita anche di formattare...
Se in seguito si dovessero ripetere problemi penserò se sostituirlo, anche se questa macchina è e vorrebbe essere a costo 0.
Vi tengo aggiornati!

Grazie della velocità nel rispondere :)

Rispondi