Akademik

Unicode

Unicode es una norma de codificación de caracteres. Su objetivo es asignar a cada posible carácter de cada posible lenguaje un número y nombre único, a diferencia de la mayor parte de los juegos ISO como el ISO-8859-1, que sólo definen los necesarios para un idioma o zona geográfica. Unicode se representa con tres tipos de codificación, según el número de bits necesarios para identificar cada carácter (UTF-8, UTF-16, UTF-32). (UTF-8, UTF-16, UTF-32) permiten representar los mismos caracteres, y Unicode define la relación biyectiva entre los tres. Actualmente coincide con el estándar ISO/IEC 10646. Su utilización más frecuente, UTF-8, es compatible con el juego de caracteres ASCII. El UTF8 tiene la ventaja de ser parcialmente compatible con los programas anteriores que funcionaban con caracteres de 8 bits.

* * *

Sistema internacional de codificación de caracteres diseñado para apoyar el intercambio electrónico, procesamiento y presentación de los textos escritos en los diversos lenguajes del mundo moderno y clásico.

El estándar de caracteres mundial Unicode incluye letras, dígitos, diacríticos, signos de puntuación y símbolos técnicos para todos los principales lenguajes escritos del mundo, usando un esquema de codificación uniforme. La primera versión de Unicode fue introducida en 1991; la más reciente contiene alrededor de 50.000 caracteres. Muchos sistemas de codificación (como ASCII) lo preceden. Con Unicode (a diferencia de los sistemas anteriores), el número único provisto para cada carácter permanece constante en cualquier sistema que soporta Unicode.

Enciclopedia Universal. 2012.