O que são padrões de codificação de caracteres?
Uma
codificação de caracteres é um padrão de relacionamento entre um conjunto de
caracteres com um conjunto de outra coisa, como por exemplo números ou pulsos eléctricos
com o objectivo de facilitar o armazenamento de texto em computadores e sua
transmissão através de redes de telecomunicação.
Exemplos
comuns são o código morse que codifica as letras do alfabeto latino e os
numerais como sequências de pulsos eléctricos de longa e curta duração e também
o ASCII que codifica os mesmos grafemas do código morse além de outros símbolos
através de números inteiros e da representação binária em sete bits destes
mesmos números.
Tabelas de código ASCII e a de código Unicode
O que é o código ASCII?
A memória do
computador conserva todos os dados sob a forma numérica. Não existe um método
para armazenar directamente os caracteres. Cada caracter possui por conseguinte
o seu equivalente em código numérico: é o código ASCII (American Standard Code
for Information Interchange - traduz-se por "Código Americano Standard
para a Troca de Informações"). O código ASCII básico representava os
caracteres em 7 bits (quer dizer 128 caracteres possíveis, de 0 a 127).
Os códigos 0
a 31 não são caracteres. Chamamos-lhes caracteres de controlo porque permitem
fazer acções como:
regresso à
linha (CR)
Bip sonoro
(BEL)
Os códigos
65 a 90 representam as maiúsculas
Os códigos
97 a 122 representam as minúsculas
(Basta
alterar o 6° bit para passar das maiúsculas às minúsculas, quer dizer
acrescentar 32 ao código ASCII em base decimal.)
Código
Unicode
Em vez de
usar apenas os códigos de 0 a 127, ele utiliza os códigos de valor bem maiores.
O código
UNICODE pode representar todos os caracteres específicos de diversos idiomas.
Novos códigos são regularmente atribuídos para novos caracteres: caracteres
latinos (acentuados ou não), gregos, cirílicos, armênios, hebraicos,
tailandeses, hiraganas, katakanas, etc... Só o alfabeto chinês Kanji contém
6879caracteres.
O Unicode
define, então, uma correspondência entre símbolos e números.
(O símbolo
"?" será representado pelo número 213).
Veja uma
pequena parte das tabelas UNICODE (os números são apresentados em notação
hexadecimal):
Sem comentários:
Enviar um comentário