investigando causas de mal funcionamiento

Imagen de gotxa
0 puntos

Holas

con motivo de una anomalía en mis correos desde ubuntu-es vi un problema en el servidor de mi dominio e intento saber la causa, por eso os pido ayuda a ver si alguien se ha enfrentado a eso alguna vez... Explico...

Todo empezó en
http://www.ubuntu-es.org/index.php?q=node/51804

y se resume así: me llegaban correos truncados desde cualquier remitente, pensé que podían ser spam pero en realidad era **cualquier correo**

CAUSAS

El asunto es que en el servidor (el mio, no worries) SpamAssassin truncaba los mensajes en la cabecera (si, mierda, eso digo yo). La traza en maillog era algo así:
spamc[30948]: connect(AF_UNIX) to spamd /tmp/spamd_full.sock failed
así que verifico la partición /tmp y veo que contenía archivos sin permisos
?---------  1 popuser root     0 Jun  8 15:07 spamd_full.sock
en vez de los correctos
srw-rw-rw-  1 popuser root     0 Jun  8 15:07 spamd_full.sock

La partición /tmp es en realidad un archivo de / utilizado para montar noexec la partición /tmp (ver http://www.directadmin.com/forum/showthread.php?threadid=12323)

SOLUCION 

Así que desmonto /tmp, lo formateo, reinicio. Todo igual salvo que en maillog ha cambiado el error, ahora es un "error en la linea 1 de spamc". No se muy bien porqué el archivo  /usr/local/psa/bin/psa-spamc estaba jodido, contenía sólo una larga ristra de '@'... menos mal que tengo otros para restaurarlo. Restaurado este archivo, todo funciona... ufff.

INVESTIGACION 

Le he pasado rkhunter y todo ok. Decir que este es un servidor en producción, Redhat FC4 con Plesk, pero no veo razones para pensar en un problema dependiente de la distro. La tabla de particiones es:

# df -h
Filesystem            Size  Used Avail Use% Mounted on
/dev/hda1             496M  379M   92M  81% /
none                  249M     0  249M   0% /dev/shm
/dev/hda7              27G   20G  6.2G  77% /home
/dev/hda5             4.9G  1.4G  3.6G  27% /usr
/dev/hda6             4.9G  3.9G 1006M  80% /var
/dev/tmpMnt            86M   20K   81M   1% /tmp

Así que creo que ha podido ser un problema de disco en la partición / (por los ficheros en /tmp) y/o de la partición /usr (por el fichero psa-spamc).

PREVENCION 

¿Habeis visto algo así antes? ¿alguna recomendación? ¿chequeo todas las particiones? ¿dónde miro más?

GoTXa
linux counter #116453

Imagen de furtaxi
+1
0
-1

86 Mb para tmpMnt, me parecen muy pocas para los tiempos que corren, es posible que el sistema la llene nada más arrancar, y luego no quede sitio para nada. Auméntale el tamaño hasta que iguale al archivo más grande que uses (o de un cd/dvd, si los grabas) multiplicado por dos.

Si pertenece a una partición de rango superior, pues es a ésta a la que tienes que dar más espacio.

Vamos, digo yo, es lo que le veo así a bote pronto. 

Saludos,

Roberto.

Mi página: www.vigonews.es.

La Libertad es un magnífico deporte. Ponte en forma.

+1
0
-1

Mi web : www.vigovideo.es
Buscar es más rápido que esperar una respuesta.

Imagen de gotxa
+1
0
-1

Hola Roberto,
buena indicación pero te comento que 80MB es más que suficiente en el servidor.

El archivo más grande que se usa en /tmp es de ~2MB (es lo que por defecto permite hacer un upload-PHP), nada de grabaciones ni cosas por el estilo, no hay escritorio, nadie más tiene cuenta ssh. Desde hace 1 año y pico no ha llegado nunca al 10%. Además no puedo sacar más "sitio" para otras particiones, es lo que hay.

¿Por qué piensas que el sistema puede llenar /tmp en el arranque? ¿dónde puedo mirar eso? No se me había ocurrido, cuando ya está arrancado nunca sobrepasa los 4-5MB como dije...  

GoTXa
linux counter #116453

+1
0
-1

GoTXa
linux counter #116453
Klaatu barada nikto

Imagen de furtaxi
+1
0
-1

Lo de los temporales, lo tenía controlado en el "lado oscuro", aquí aún no he profundizado tanto. Pero, desde luego, casi todas las aplicaciones usan temporales, y, en el arranque, hay muchas que se inician casi a la vez. Luego, pues se quedan en memoria, o se cierran liberando el tmp.

Prueba a cambiar un poco el tamaño, aunque sólo sean 20 mb más, a ver si mejora el comportamiento. 

Pero casi seguro que por algún lado hay un archivo "log" que lo registra todo, es cosa de dar con él.

O, y esto si que es aventurado por mi parte decirlo, podrías crear un nuevo directorio para los temporales en otra partición con más sitio, cambiando el path del entorno.

Creo recordar que se creaba un /tmp en otro sitio, se renombraba el actual, y reinicio , como la forma más rápida y menos complicada, pero hace ya mucho que leí sobre ello, y no me acuerdo donde. Sino, con el TestCD, lo puedes hacer, borrando el punto de montaje actual, y creando uno nuevo en otro sitio más grande. Esto sí que lo he hecho con el /swap, que me había pasado de tamaño, y aproveché para situarlo más o menos en la mitad del disco, entre / y una Fat32, y /home.

Pero, eso sí, lo que opino es pura teoría e intuición, me quedaría más tranquilo si lo confirmas antes de actuar, a ver si por hacerme caso te casca la máquina..

Saludos,

Roberto.

Mi página: www.vigonews.es.

La Libertad es un magnífico deporte. Ponte en forma.

+1
0
-1

Mi web : www.vigovideo.es
Buscar es más rápido que esperar una respuesta.

Imagen de gotxa
+1
0
-1

Los logs que comentas son
/var/log/messages*
/var/log/boot*

pero no veo nada raro (además son montón de lineas a revisar, hasta el horizonte y más allá)... quizá alguien nos diga otros logs que revisar.

Tampoco me da pistas la secuencia de arranque sobre el uso de /tmp durante la misma... grrrr...

EDITADO: cascar la máquina **no es una opción** xD

GoTXa linux counter #116453

+1
0
-1

GoTXa
linux counter #116453
Klaatu barada nikto