Como ya sabeis hace una semana empecé a descargar los mensajes de la
lista (no podemos permitir que se pierda todo este conocimiento,
¿verdad?). Hoy he abierto una página Web donde podreis ver el progreso
y descargar todos los archivos.
Mola, pero no te veo muy versado en XML :-)
Para empezar, no hay un elemento raíz que englobe todos los mensajes. Es
tan simple como añadir un <MESSAGES> al principio del documento y un
</MESSAGES> al final. Sin esto, los procesadores de XML se quejan.
Segundo, molaría un <?xml version="1.0"?> al principio, por lo mismo. O
mejor aún: <?xml version="1.0" encoding="iso-8859-1"?>
Y tercero, no has escapado los carácteres especiales (principalmente '<'
y '>') de los mensajes (con < > y compañía), con lo cual
definitivamente cualquier intento de proceso automático del fichero XML
fracasasa. Debes o bien escapar esos caracteres (y otros pocos como el
'&'), o bien (más recomendable) encerrar el cuerpo de los mensajes (el
contenido de los elementos <TEXT>) en secciones CDATA; con esta segunda
opción estás 100% seguro de que se preservan todos los espacios en
blanco, saltos de línea, etc al recuperar el contenido de los elementos
<TEXT>.
Un ejemplo del uso de CDATA:
<TEXT><![CDATA[
From: <yo@micircunstancia>
Subject: Mola & remola
Pos eso, que sí que te oigo.
]]></TEXT>
Otra sugerencia: normaliza el campo <DATE> según el tipo de datos
DateTime de los esquemas XSD (de nuevo, esto facilita el procesamiento
automático). Dicho formato es: YYYY-MM-DDThh:mm:ss (la T es literal).
Por ejemplo:
<DATE>2000-07-02T14:29:00</DATE>
Enlace recomendado para estos menesteres:
http://www.w3schools.com/xml/default.asp
Por lo demás, aplaudo la idea y te felicito por tu trabajo.
*** XXVII MSX USERS MEETING IN BARCELONA: MAY 1st 2005 (?) ***
----------------------------------------------------------------------------
---------------------------------
Konami Man - AKA Nestor Soriano (^^)v
http://www.konamiman.com - konamiman(_en_)konamiman(_punto_)com
ICQ#: 18281450
Be conservative in what you send and liberal in what you receive
----------------------------------------------------------------------------
---------------------------------