Padrões de codificação de caracteres
Na década de 60 surgiu a necessidade de trocarem informações. Por esse motivo, surgiram padrões de codificação
Esses padrões consistem em tabelas com grupos de bits que representam determinados caracteres.
ASCII
A tabela ASCII utiliza conjuntos de 7 bits para representar 128 carateres (27 carateres), muitos deles adequados apenas à língua inglesa, por ter sido desenvolvida nos Estados Unidos.
A ISO (Internacional Standard Organization) adotou o código ASCII como norma internacional, com a designação ISO 646, e ampliou-o.
ASCII-inconvenientes:
- Valor limitado de caracteres (256 caracteres se usarmos a tabela extendida).
- Necessidade de construir um sistema de codificação de caracteres que não necessite de várias tabelas.
- A tabela ASCII tem grandes fragilidades quando mudamos de linguagem.
Unicode
Devido aos vários inconvenientes da tabela ASCII surgiu o unicode .
O Unicode é um código que define todos os caracteres da maior parte das línguas do mundo. Foi desenvolvido, em simultâneo, por um consórcio industrial, incluindo, entre outras companhias, a Adobe, a Apple, a Microsoft, a HP, a IBM, a Grae/e, a SAP, a SUN e a Unisys.
Os códigos disponibilizados pela Unicode permitem representar conjuntos até 4 bytes (32 bits).
Esta tabela é mais extensa que a tabela de código ASCII.
Já houve propostas de inclusão de linguagens inventadas em livros e séries de televisão.
Comentários
Enviar um comentário