¿Por qué no se deben utilizar caracteres especiales en la estructura de una Página Web?

¿Por qué no se deben utilizar caracteres especiales en la estructura de una Página Web?

Algunos de los caracteres que se utilizan habitualmente en los textos no se pueden incluir directamente en las páginas web.

Caracteres como (<, > y “) no pueden utilizarse libremente, la solución es sustituirlos por expresiones llamadas entidades HTML.

  • &lt; < less than  signo de menor que
  • &gt; > more than  signo de mayor que
  • &amp; & ampersand  y comercial
  • &quot; ” quotation mark comillas
  • &nbsp; (espacio en blanco) non-breaking space espacio en blanco
  • &apos; ‘ apostrophe apóstrofo

Los caracteres propios de los idiomas diferentes al inglés también pueden ser problemáticos. El motivo es que desde que se crea una página web hasta que llega al navegador del usuario, intervienen numerosos procesos:

  • El diseñador crea la página web con su editor HTML (por ejemplo Dreamweaver).
  • Si se trata de una aplicación dinámica, el programador recorta la página HTML del diseñador y la mezcla con el resto del código de la aplicación (por ejemplo PHP).
  • El servidor web almacena las páginas HTML estáticas o el código de la aplicación web y sirve las páginas solicitadas por los usuarios.
  • El usuario solicita y visualiza las páginas web a través de su navegador.

Existen diferentes tipos de formatos de codificación como el UTF-8, ISO-8859 por limitaciones técnicas o por decisiones de los diseñadores y programadores, los textos pueden pasar de codificación UTF-8 a codificación ISO-8859 en cualquier momento. Si se produce este cambio sin realizar una conversión correcta, el navegador del usuario mostrará caracteres extraños en todos los acentos y en todas las letras como la ñ.

Codificación de caracteres (charset)

Los valores que se pueden utilizar también están estandarizados y las codificaciones más utilizadas son UTF-8 y ISO-8859-1, aunque existen decenas de códigos definidos

(ISO-10646-UCS-2, IBM852, Big5-HKSCS, windows-1252, HZ-GB-2312).

El organismo IANA publica la lista completa de codificaciones de caracteres disponibles http://www.iana.org/assignments/character-sets

  • &ntilde; ñ latin letter n with tilde
  • &Ntilde; Ñ latin capital n letter with tilde
  • &aacute; á a acute
  • &eacute; é e acute
  • &iacute; í i acute
  • &oacute; ó o acute
  • &uacute; ú u acute
  • &Aacute; Á A acute
  • &Eacute; É E acute
  • &Iacute; Í I acute
  • &Oacute; Ó O acute
  • &Uacute; Ú U acute
  • &euro; € euro

Podemos consultar los 252 HTML definidas en la pagina web: http://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references

Por Adriana Gonzalez

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: