Nota: Este documento es parte de una traducción al castellano de la Recomendación del W3C "HTML 4.01 Specification" (más información). Puede consultar la versión original del mismo. Para cualquier comentario o corrección acerca de la traducción póngase en contacto con el traductor en jrpozo arroba conclase punto net. Gracias por su colaboración.
Véase el Aviso de copyright de la traducción.
Contenidos
Esta sección de la especificación describe los tipos básicos de datos que pueden aparecer como contenido de un elemento o valor de un atributo.
Para información preliminar sobre cómo leer el DTD HTML, consulte el tutorial de SGML.
En la definición de cada atributo se incluye información sobre la importancia que tiene para sus valores la distinción entre mayúsculas y minúsculas. Esta información se presenta de acuerdo con la siguiente leyenda:
Si el valor de un atributo es una lista, estas claves se aplican a todos los valores de la lista, a menos que se indique lo contrario.
La definición del tipo de documento especifica la sintaxis de los contenidos de los elementos y los valores de los atributos de HTML por medio de palabras (tokens) SGML (p.ej., PCDATA, CDATA, NAME, ID, etc.). Véase [ISO8879] para sus definiciones completas. Lo que sigue es un resumen de la información fundamental:
Los agentes de usuario pueden ignorar el espacio en blanco inicial o final de valores de atributos CDATA (p.ej., " mivalor " puede interpretarse como "mivalor"). Los autores no deberían declarar valores de atributos con espacios en blanco al principio o al final.
Para algunos atributos de HTML 4 con valores de atributo CDATA, la especificación impone restricciones más fuertes al conjunto de valores legales para el atributo, restricciones que no pueden expresarse por el DTD.
Aunque los elementos STYLE y SCRIPT usan CDATA para su modelo de datos, para estos elementos los agentes de usuario deben tratar CDATA de manera diferente. El código y las entidades deben tratarse como texto sin formato y pasarse a la aplicación tal y como están. La primera aparición de la secuencia de caracteres "</" (delimitador de apertura de etiqueta final) se trata como si finalizara el contenido del elemento. En documentos válidos, esta sería la etiqueta final del elemento.
Ciertos atributos (%Text; en el DTD) toman por valor un texto que se supone debe ser "legible por humanos". Para información preliminar sobre atributos, consulte la parte del tutorial sobre atributos.
Esta especificación utiliza el término URI tal y como se define en [URI] (ver también [RFC1630]).
Obsérvese que los URIs incluyen a los URLs (según se definen en [RFC1738] y [RFC1808]).
Los URIs relativos se convierten en URIs completos a partir de un URI base. La [RFC1808], sección 3, define el algoritmo normativo para este proceso. Para más información sobre URIs base, consulte la sección sobre URIs base en el capítulo sobre vínculos.
Los URIs se representan en el DTD con la entidad paramétrica %URI;.
En general los URIs hacen distinción entre mayúsculas y minúsculas. Puede haber URIs, o partes de URIs, donde la diferencia no importe (p.ej., nombres de máquinas), pero la identificación de éstas puede no ser fácil. Los usuarios deberían considerar que en los URIs se distingue siempre entre mayúsculas y minúsculas (para quedarse del lado de la seguridad).
Consulte el apéndice para información sobre caracteres no ASCII en valores de atributos URI.
El tipo de valor de atributo "color" (%Color;) se refiere a las definiciones de colores según se especifican en [SRGB]. Un valor de color puede ser o bien un número hexadecimal (anteponiendo un signo "#") o uno de los siguientes dieciséis nombres de colores. En los nombres de colores no se distingue entre mayúsculas y minúsculas.
Black = "#000000" (Negro) | Green = "#008000" (Verde)
|
||
Silver = "#C0C0C0" (Plateado) | Lime = "#00FF00" (Verde lima)
|
||
Gray = "#808080" (Gris) | Olive = "#808000" (Verde oliva)
|
||
White = "#FFFFFF" (Blanco) | Yellow = "#FFFF00" (Amarillo)
|
||
Maroon = "#800000" (Marrón) | Navy = "#000080" (Azul marino)
|
||
Red = "#FF0000" (Rojo) | Blue = "#0000FF" (Azul)
|
||
Purple = "#800080" (Púrpura) | Teal = "#008080" (Azul verdoso)
|
||
Fuchsia = "#FF00FF" (Fucsia) | Aqua = "#00FFFF" (Celeste)
|
Así, los valores de color "#800080" y "Purple" se refieren ambos al color púrpura.
Aunque los colores pueden añadir cantidades significativas de información a los documentos y hacerlos más legibles, considere las siguientes pautas cuando incluya color en sus documentos:
HTML especifica tres tipos de valores de longitud para los atributos:
Los valores de longitud son neutros frente a la distinción entre mayúsculas y minúsculas.
Nota. Un "media type" o "tipo de medios" (definido en [RFC2045] y [RFC2046]) especifica la naturaleza de un recurso vinculado. Esta especificación emplea el término "content type" ("tipo de contenido") en lugar de "media type" (tipo de medios) de acuerdo con el uso actual. Además de esto, en esta especificación, "media type" se puede referir a los medios en que un agente de usuario representa un documento.
Este tipo está representado en el DTD por %ContentType;.
Los tipos de contenido no hacen distinción entre masyúculas y minúsculas.
Ejemplos de tipos de contenido son "text/html", "image/png", "image/gif", "video/mpeg", "text/css", y "audio/basic". Para la lista de tipos MIME registrados, consulte [MIMETYPES].
El valor de los atributos cuyo tipo es un código de idioma (%LanguageCode; en el DTD) se refiere a un código de idioma de los especificados en [RFC1766], sección 2. Para información sobre especificación de códigos de idioma en HTML, consulte la sección sobre códigos de idioma. No se permite espacio en blanco dentro del código de idioma.
Los códigos de idioma no distinguen entre mayúsculas y minúsculas.
Los atributos "charset" (%Charset; en el DTD) se refieren a una codificación de caracteres según se describe en la sección sobre codificaciones de caracteres. Los valores deben ser cadenas (p.ej., "euc-jp") del registro IANA (ver [CHARSETS] para una lista completa).
Los nombres de codificaciones de caracteres no distinguen entre mayúsculas y minúsculas.
Los agentes de usuario deben seguir los pasos descritos en la sección sobre especificación de codificaciones de caracteres para determinar la codificación de caracteres de un recurso externo.
Ciertos atributos necesitan un carácter individual del conjunto de caracteres del documento. Estos atributos son del tipo %Character; en el DTD.
Los caracteres individuales pueden especificarse mediante referencias de caracteres (p.ej., "&").
La [ISO8601] permite muchas opciones y variaciones en la representación de fechas y horas. La especificación actual usa uno de los formatos descritos en el perfil [DATETIME] para la definición de cadenas fecha/hora legales (%Datetime; en el DTD).
El formato es:
AAAA-MM-DDThh:mm:ssDZHdonde:
AAAA = año con cuatro dígitos MM = mes con dos dígitos (01=enero, etc.) DD = día del mes con dos dígitos (de 01 a 31) hh = hora con dos dígitos (de 00 a 23) (NO se permite am/pm) mm = minuto con dos dígitos (00 a 59) ss = segundo con dos dígitos (00 a 59) DZH = desginador de zona horaria
El designador de zona horaria es uno de los siguientes:
Deben estar presentes exactamente los componentes mostrados aquí, y exactamente con esta puntuación. Obsérvese que la letra "T" aparece literalmente en la cadenas (debe ser mayúscula), para indicar el comienzo de la hora, según se especifica en [ISO8601]
Si una aplicación generadora no conoce la hora con precisión de segundos, puede usar el valor "00" para los segundos (y para los minutos y para las horas si es necesario).
Nota. [DATETIME] no trata la cuestión de segundos bisiestos.
Los autores pueden usar los siguientes tipos de vínculos reconocidos, enumerados aquí junto con sus interpretaciones convencionales. En el DTD, %LinkTypes; se refiere a una lista de tipos de vínculos separados por espacios. No se permiten caracteres de espacio en blanco dentro de los tipos de vínculo.
Estos tipos de vínculo no hacen distinción entre mayúsculas y minúsculas, es decir, "Alternate" tiene el mismo significado que "alternate".
Los agentes de usuario, los motores de búsqueda, etc. pueden interpretar estos tipos de vínculos de diferentes maneras. Por ejemplo, los agentes de usuario podrían proporcionar acceso a los documentos vinculados por medio de una barra de navegación.
Los autores pueden querer definir tipos de vínculos adicionales no descritos en esta especificación. Si hacen esto, deberían usar un perfil (profile) citando las convenciones usadas para definir los tipos de vínculos. Véase el atributo profile del elemento HEAD para más detalles.
Para más información sobre tipos de vínculos, consulte la sección sobre vínculos en documentos HTML.
La siguiente es una lista de los descriptores de medios reconocidos (%MediaDesc; en el DTD).
En versiones futuras de HTML pueden introducirse nuevos valores, y podrían permitirse valores parametrizados. Para facilitar la introducción de estas extensiones, los agentes de usuario deben ser capaces de analizar el atributo media como sigue:
media="screen, 3d-glasses, print and resolution > 90dpi"
se transforma en:
"screen" "3d-glasses" "print and resolution > 90dpi"
"screen" "3d-glasses" "print"
Nota. Las hojas de estilo pueden incluir variaciones dependientes del medio en su interior (p.ej., la estructura CSS @media). En estos casos puede ser apropiado usar "media=all".
Los datos de scripts (%Script; en el DTD) pueden aparecer como contenido del elemento SCRIPT y como valor de los atributos de eventos intrínsecos. Los agentes de usuario no deben evaluar los datos de script como código HTML, sino que deben pasarlos tal y como están como datos para un motor de scripts.
La importancia de la distinción entre mayúsculas y minúsculas en los datos de scripts depende del lenguaje de programación del script.
Obsérvese que los datos de scripts que estén contenidos en un elemento no pueden contener referencias de caracteres, pero los datos de scripts que sean el valor de un atributo sí pueden contenerlas. El apéndice proporciona más información sobre la especificación de datos no HTML.
Los datos de hojas de estilo (%StyleSheet; en el DTD) pueden aparecer como contenido de un elemento STYLE y como valor de un atributo style . Los agentes de usuario no deben evaluar los datos de estilo como código HTML.
La importancia de la distinción entre mayúsculas y minúsculas en los datos de estilo depende del lenguaje de la hoja de estilo.
Obsérvese que los datos de hojas de estilo que estén contenidos en un elemento no pueden contener referencias de caracteres, pero los datos de hojas de estilo que sean el valor de un atributo sí pueden contenerlas. El apéndice proporciona más informacion sobre la especificación de datos no HTML.
Excepto los nombres reservados enumerados a continuación, los nombres de marcos destino (%FrameTarget; en el DTD) deben empezar con un carácter alfabético (a-zA-Z). Los agentes de usuario deberían ignorar otros nombres de destino.
Los siguientes nombres de destino están reservados y tienen significados especiales.