Padrões de codificação de caracteres


Na década de 60 surgiu a necessidade de trocarem informações. Por esse motivo, surgiram padrões de codificação
Esses padrões consistem em tabelas com grupos de bits que representam determinados caracteres.



ASCII

A tabela ASCII utiliza conjuntos de 7 bits para representar 128 carateres (27 carateres), muitos deles adequados apenas à língua inglesa, por ter sido desenvolvida nos Estados Unidos.

A ISO (Internacional Standard Organization) adotou o código ASCII como norma internacional, com a designação ISO 646, e ampliou-o.









ASCII-inconvenientes:

  • Valor limitado de caracteres (256 caracteres se usarmos a tabela extendida).
  • Necessidade de construir um sistema de codificação de caracteres que não necessite de várias tabelas.
  • A tabela ASCII tem grandes fragilidades quando mudamos de linguagem.


Unicode

Devido aos vários inconvenientes da tabela ASCII surgiu o unicode .

O Unicode é um código que define todos os caracteres da maior parte das línguas do mundo. Foi desenvolvido, em simultâneo, por um consórcio industrial, incluindo, entre outras companhias, a Adobe, a Apple, a Microsoft, a HP, a IBM, a Grae/e, a SAP, a SUN e a Unisys.

Os códigos disponibilizados pela Unicode permitem representar conjuntos até 4 bytes (32 bits).

Esta tabela  é mais extensa que a tabela de código ASCII.

Já houve propostas de inclusão de linguagens inventadas em livros e séries de televisão.



Resultado de imagem para Unicode



Comentários

Mensagens populares