Mola, pero no te veo muy versado en XML :-)
No lo uso. Los archivos que proceso usualmente (del tamaño de varios
Gigas) los tengo formateados de esta forma, lo que me permite una
mayor velocidad de proceso al utilizar una rutina especialmente
programada a tal efecto. Si te fijas cada etiqueta <> está en una
línea ella sola y el resto del texto es ASCII.
Para empezar, no hay un elemento raíz que englobe todos los mensajes. Es
tan simple como añadir un <MESSAGES> al principio del documento y un
</MESSAGES> al final. Sin esto, los procesadores de XML se quejan.
Ten en cuenta que ese elmemento deberá estar en la versión
definitiva, ya que la idea es que todos los paquetes se peguen los
unos con los otros.
Y tercero, no has escapado los carácteres especiales (principalmente '<'
y '>') de los mensajes (con < > y compañía), con lo cual
definitivamente cualquier intento de proceso automático del fichero XML
fracasasa. Debes o bien escapar esos caracteres (y otros pocos como el
'&'), o bien (más recomendable) encerrar el cuerpo de los mensajes (el
contenido de los elementos <TEXT>) en secciones CDATA; con esta segunda
opción estás 100% seguro de que se preservan todos los espacios en
blanco, saltos de línea, etc al recuperar el contenido de los elementos
<TEXT>.
Mi intención no es procesar los mensajes con un procesador estándar
de XML, ya que para la búsqueda no es necesario. He pretendido que los
mensajes estén en ASCII para que puedan ser leidos incluso en un MSX
(¿te animas a programar un algo para ello?).
Otra sugerencia: normaliza el campo <DATE> según el tipo de datos
DateTime de los esquemas XSD (de nuevo, esto facilita el procesamiento
automático). Dicho formato es: YYYY-MM-DDThh:mm:ss (la T es literal).
Si te fijas en los mensajes de la hispa que ofrece Yahoo y los
comparas con los que hay, verás que el campo date es el mismo que
ofrece el interfaz. Tengo la intención de normalizarlo, aunque no es
algo absolutamente crítico, pero hay algunos mensajes que no tienen
una fecha real.
Por lo demás, aplaudo la idea y te felicito por tu trabajo.
Muchas gracias tanto por las felicitaciones como por los
comentarios, ten por seguro que no caerán en saco roto.
Saludos
--
SapphiRe
P.D. Estoy preparando unos cuantos mensajes más, atentos a la página.