Qué es UTF-8 y para qué sirve

Categorias: General

Qué es UTF-8 y para qué sirve

Es posible que hayas visto UTF8 en algún sitio de tu web o de la base de datos que estés utilizando, pero no sepas qué significa o para qué sirve.

Aunque no lo parezca, gracias al UTF-8 podemos comunicarnos por la web o por el correo electrónico entre distintas regiones e idiomas sin que todo se convierta en un galimatías.

Es un poco complejo, pero vamos a explicarlo de una forma sencilla para que sepas todo lo que necesitas saber sobre UTF-8.

 

¿Qué es UTF-8?

UTF-8 es una forma de codificar caracteres. Entendemos como un carácter cualquier letra, número o símbolo que hay en tu teclado ahora mismo.

Eso sí, hay que tener en cuenta que tu teclado estará con las teclas típicas del español, con su eñe incluida, pero hay muchas regiones en el mundo, con sus correspondientes idiomas.

Cada idioma tiene caracteres y estos pueden ser comunes o totalmente distintos, sólo tienes que pensar en el alfabeto cirílico o el chino, que no tienen nada que ver con el nuestro.

Y luego están las distintas regiones, que, aunque se use el mismo abecedario, las teclas pueden estar dispuestas de distinta forma en un teclado.

Todo esto funcionaba bien a nivel local, cada uno hacía lo que quería, por así decirlo, pero con la llegad de la era digital se convirtió en un auténtico caos.

Las comunicaciones por correo electrónico entre distintos países o idiomas era prácticamente imposible.

No porque no comprendieras el idioma, pero si tu ordenador usa un juego de caracteres distinto al del remitente, las palabras se convierten en un galimatías, del tipo: xn--ee-zja cuando se usa una ñ.

Había que estandarizar todo esto y eso se consiguió gracias a Unicode y su sistema de codificación de caracteres.

 

¿Qué es Unicode?

Unicode llego para que cada carácter, de cualquier idioma, tuviera una codificación única.

Esa codificación se almacena en una base de datos a la que se puede tener acceso utilizando cualquiera de los tipos de codificación posible.

Es decir, que una eñe (ñ) tendrá asignado un código y ese código no se podrá usar para ningún otro carácter de cualquier otro idioma o región.

Así que, aunque le escribas un email con una eñe a una persona que no tiene ese carácter en su teclado, el codificador de caracteres que utilice su ordenador, sabrá que es una eñe porque habrá consultado su código en la base de datos Unicode.

Ejemplo Unicode con el carácter eñe

Esto nos garantiza que cualquier comunicación que se realice entre dispositivos que utilicen distintos juegos de caracteres, sea posible.

Si quieres ver la codificación de todos los caracteres de Unicode, puedes acceder a su web y usar su buscador.

Por cierto, los emojis también están incluidos en Unicode.

Los unicodes de los emojis

UTF-8 el Codificador más Utilizado

Aunque la base de datos de de Unicode sea la que se encarga de gestionar todos los caracteres, se necesita un codificador para poder utilizarlo.

Aquí es donde entra en juego UTF-8, que se encargar de codificar cualquiera de los caracteres de Unicode.

Da igual de qué parte del mundo te conectes a una web o recibas un email. Si los dos dispositivos utilizan UTF-8, podrán ver los distintos caracteres perfectamente.

Hoy en día UTF-8 y Unicode son el estándar más utilizando, aunque hay otras opciones de codificación menos utilizadas.

Cualquiera de los tres codificadores es compatible con Unicode y pueden funcionar perfectamente, pero al ser UTF-8 el más utilizado y estandarizado, es el más compatible.

Cómo usar UFT-8 en mi Web

Si tienes una web, lo más seguro es que estés utilizando UTF-8, aunque no lo sepas.

Sólo tienes que buscar en la cabecera (head) algo parecido a lo siguiente:

<meta charset="UTF-8">

Si miras el código de tu web, deberías verlo así, más o menos:

<!DOCTYPE html>
<html lang="es">
<head>
	<meta charset="UTF-8">
</head>
<body>... </body>
</html>

Sólo con añadir el meta charset ya te aseguras utilizar la codificación UTF-8 en tu web, así de sencillo.

UTF-8 en WordPress

Si estás utilizando un gestor de contenidos como WordPress o Joomla, lo estará usando por defecto, ya que es el estándar que utilizan.

En cualquier caso, si usas WordPress y tu web no se ve bien, puedes comprobar que la codificación sea correcta.

Para esto tienes que acceder al archivo wp-config.php, desde el administrador de Archivos de hosting o desde una conexión FTP.

Edita el archivo y busca cualquier línea en la que aparezca «charset».

Deberías encontrar un define y la opción correcta es la siguiente:

define( 'DB_CHARSET', 'utf8mb4' );

Si pone otra cosa, cámbialo o comenta la línea, pero el aspecto norma debe de ser como el que ves en la siguiente captura de imagen:

UFT-8 en WordPress

Después de esto guarda los cambios y comprueba si se ha solucionado el problema de los caracteres.

Es posible que también tengas que modificar el cotejamiento de la base de datos.

Para hacer esto, por favor revisa esta guía.

 

Hosting SSD en Hostinet

Si necesitas un hosting confiable, con un buen servicio de soporte técnico en el que puedas apoyarte siempre que tengas algún problema, como puede ser la codificación UTF-8 de tu web, en Hostinet podemos ayudarte.

Nuestro servicio de soporte técnico te atendrá por teléfono (desde España) o por correo electrónico, como prefieras y te ayudará en todo lo que necesites.

Cualquiera de los planes de hosting SSD que ofrecemos, cuentan con el mismo servicio de soporte técnico, incluso los más económicos.

Hosting SSD NVMe