Estructura de un documento HTML
Los documentos escritos en HTML estan estructurados en dos partes diferenciadas: la HEAD (cabecera) y el BODY (cuerpo).Ejemplo de documento
Si escribes:<HTML> <HEAD> <TITLE> Documento de prueba </TITLE> </HEAD> <!-- Esto es un comentario--> <BODY> <H1> Esto es una "demo" de documento HTML </H1> Esto es el más sencillo de los documentos HTML. </BODY> </HTML>El elemento <HTML> </HTML> no es obligatorio. Solo sirve como identificación del tipo de contenido del fichero para ciertos programas que hacen cambios masivos en muchas páginas a la vez.
Para escribir comentarios en la página (que sólo se ven en el texto fuente, pero no en el visualizador) se utilizará el elemento <!-- -->
Puedes ver su aspecto real pulsando aquí.
Esquema de tipos de un documento HTML
Cuando un visualizador recibe un fichero, antes de mostrarlo necesita saber el tipo de contenido que éste tiene, a fin de procesarlo adecuadamente. No es lo mismo recibir un documento de texto que una fotografía en formato GIF, o un vídeo en formato MPG, o si lo que estamos intentando es transferir un fichero.En cada caso, el visualizador pondrá en juego distintas habilidades, de las muchas que posee.
Si el fichero procede de un servidor http remoto, éste se encargará de decirle al visualizador cuanto necesite saber, pero si lo que hay que procesar es un fichero local, la única forma de saberlo es por la extensión del fichero.
La extensión de un fichero son las tres o cuatro letras (depende del sistema operativo con el que se trabaje) que hay después del nombre del fichero y que están separadas del mismo por un punto.
Por ejemplo, esta página se llama estruc.htm. Las tres letras que hay después del punto (htm) son la extensión del fichero. Las otras, las que están delante del punto, son el nombre del fichero.
Hay que tener presente que las extensiones de 4 o más letras son propias de sistemas operativos como Unix o Macintosh y las de 3 o menos del DOS.
Estas son algunas de las extensiones stándard más comunes y sus contenidos:
.html
o.htm
- Documento HTML. Contine texto e instrucciones HTML que serán interpretadas.
.text
o.txt
- Contiene texto plano. El visualizador presentará todo el fichero como si fuera un único bloque de texto y no interpretará ninguna instrucción HTML que pudiera llevar. Esto lo hará con cualquier fichero que lleve una extensión desconocida o simplemente no lleve ninguna.
.gif
- Contiene un fichero de imagen en formato GIF.
.xbm
- Contiene un fichero de imagen en formato X-Bitmap (blanco y negro).
.xpm
- Contiene un fichero de imagen en formato X-Pixmap (color).
.jpeg
o.jpg
- Contiene un fichero de imagen en formato codificado jpeg.
.mpeg
o.mpg
- Contiene un fichero de imagen de video o cine (en movimiento).
.au
- Contiene un fichero de audio (sonido) codificado en aiff-encoded.
.exe
- Contiene un fichero binario ejecutable en DOS.
.hqx
- Contiene un fichero binario ejecutable en Macintosh.
.Z
o.zip
- Contiene un (o varios) fichero/s comprimido/s de cualquier clase. Para poder utilizarlo hay que indicarle al visualizador una herramienta de compresión-descompresión.
Los visualizadores tienen una configuración de los mapas de tipos aceptables, e instrucciones de cómo proceder en cada caso. Algunos tipos son tratados directamente por el propio visualizador (p.ej.: htm, gif, txt) mientras que para otros necesitan de una herramienta auxiliar adecuada, que hay que indicar al visualizador, para que sea llamada en el momento preciso (p.ej.: zip, mpg, au).
Ahora que ya sabes qué son las extensiones de fichero, es el momento de aclarar una cuestión importante:
Los documentos HTML los puedes escribir con lo que quieras... Siempre que los salves en modo Solo Texto. Es decir, que si utilizas, por ejemplo, Word de Windows o de MAC, por defecto estos programas salvan en formato Word. Y aunque luego los renombres como documentos .htm o .html, el formato interno sigue siendo Word.
Tampoco vale dejarlos con la extensión .txt que les dejan la mayoría de editores al salvarlos en modo Solo Texto. No serían interpretados correctamente. Por lo tanto si tienen extensión .txt (y por supuesto son .txt), entonces puedes renombrarlos a .htm, o bien en el momento de guardarlos en formato Solo Texto no dejar la extensión por defecto .txt y darle ya directamente la extensión .htm.
Algunos procesadores de texto, ya incluyen entre sus tipos el .htm. Si es así lo que hacen es eliminar la codificación propia, y convertirla a elementos de HTML. Por ejemplo, si tienes un texto en itálica, automáticamente es convertido al elemento <I>, etc..