[CentOS-es] Optimizar el proceso "building file list" de Rsync
Santi Saez
santisaez en woop.es
Mar Mayo 4 18:48:58 UTC 2010
Hola,
Estoy utilizando un script que hace uso de rsync para mover entre 1-2
millones de ficheros entre 2 máquinas, dividido en 2 fases:
1) Una primera ejecución para migrar el grueso de los datos, se copiarán
los 1-2 millones de ficheros y se asume que el proceso durará entre 3-4
horas aprox.
2) Segunda ejecución del script, donde se sincronizaran las diferencias
desde la primera ejecución.
El problema de este escenario es que rsync se tira entre 15 y 20 minutos
construyendo el listado de ficheros a sincronizar (proceso "building
file list"), un tiempo que me gustaría reducir al máximo posible al
menos en la fase 2) del script, la del 1) no me importa :)
El motivo es que desde que lanzo el primer rsync hasta que se lanza el
segundo, apenas se han modificado/creado/borrado 1000-2000 ficheros y es
¿Conoceís alguna alternativa a rsync para este escenario? Algo que haga
uso de FAM, inotify, kqueue, etc. para determinar de "forma inteligente"
aquellos ficheros a sincronizar en lugar de tener que volver a generar
nuevamente el listado?
Saludos,
--
Santi Saez
http://woop.es
Más información sobre la lista de distribución CentOS-es