No creo que distribuya el programa para limpiar los
mensajes, ya que son totalmente específicos para los mensajes
de la hispa. Mi idea es ir publicando los ficheros en
hispamsx.org para que todos los podais descargar.
Hum, pero digo yo, la suite completa para descargar/limpiar/almacenar
todo el histórico de mensajes de HispaMSX sí que lo pondrás a nuestra
disposición ¿no? Lo mejor que se me ocurre es que seas sólo tu quien en
primera instancia descargue y limpie esos más de 20.000 mensajes, y los
XML filtrados se cuelguen bien comprimidos en hispamsx.org. Así nadie
tendrá que estar 8,5 dias bajando mensajes sin interrupción.
Hombre, si prefieres ser tu el que descargue y limpie en exclusiva y
vaya pasando los XML cada X tiempo para que los podamos visualizar...
Por mi fenomenal, pero ya sabes que eres el suministrador oficial xD
En un primer momento así sería, ya que de momento el programa de
descarga está en perl y usa el wget, por lo que su instalación y uso
no es trivial, precisamente.
Mi idea es poner a disposición de todos los mensajes limpios que
descargue (y los originales también para quien los quiera) e ir
haciendo la interfaz de navegación.
Como ya dije antes mi idea es que la propia interfaz sea la que se
conecte y descargue los mensajes, limpiándolos y archivándolos, pero
antes hay que desarrollar todos los algoritmos de indexación y éstos
han de ser lo suficientemente flexibles como para no tener que
reindexar toda la colección por añadir un simple mensaje.
¿De qué serviría tener una aplicación que es capaz de bajarse los
mensajes si el proceso de indexación tardase varios minutos por cada
mensaje descargado?
Por eso pienso que la descarga y limpieza de los nuevos mensajes es
algo secundario que, de momento, está resuelto. Prefiero centrar mis
esfuerzos en los algoritmos de indexación y navegación para tener una
primera versión funcional lo antes posible. Aunque os tenga que ir
descargando yo los mensajes y poniéndolos en algún sitio
(www.hispamsx.org es buen sitio, ¿no?) al principio.
Pero vamos, que esto es mi opinión, estoy abierto a todo tipo de
sugerencias.
Saludos
--
SapphiRe