Translate

sexta-feira, 25 de outubro de 2013

TEXTO - codificação de caracteres

O que são padrões de codificação de caracteres?

Uma codificação de caracteres é um padrão de relacionamento entre um conjunto de caracteres com um conjunto de outra coisa, como por exemplo números ou pulsos eléctricos com o objectivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação.


Exemplos comuns são o código morse que codifica as letras do alfabeto latino e os numerais como sequências de pulsos eléctricos de longa e curta duração e também o ASCII que codifica os mesmos grafemas do código morse além de outros símbolos através de números inteiros e da representação binária em sete bits destes mesmos números.

Tabelas de código ASCII e a de código Unicode


O que é o código ASCII?

A memória do computador conserva todos os dados sob a forma numérica. Não existe um método para armazenar directamente os caracteres. Cada caracter possui por conseguinte o seu equivalente em código numérico: é o código ASCII (American Standard Code for Information Interchange - traduz-se por "Código Americano Standard para a Troca de Informações"). O código ASCII básico representava os caracteres em 7 bits (quer dizer 128 caracteres possíveis, de 0 a 127).
Os códigos 0 a 31 não são caracteres. Chamamos-lhes caracteres de controlo porque permitem fazer acções como:
regresso à linha (CR)
Bip sonoro (BEL)
Os códigos 65 a 90 representam as maiúsculas
Os códigos 97 a 122 representam as minúsculas
(Basta alterar o 6° bit para passar das maiúsculas às minúsculas, quer dizer acrescentar 32 ao código ASCII em base decimal.)



Código Unicode


Em vez de usar apenas os códigos de 0 a 127, ele utiliza os códigos de valor bem maiores.
O código UNICODE pode representar todos os caracteres específicos de diversos idiomas. Novos códigos são regularmente atribuídos para novos caracteres: caracteres latinos (acentuados ou não), gregos, cirílicos, armênios, hebraicos, tailandeses, hiraganas, katakanas, etc... Só o alfabeto chinês Kanji contém 6879caracteres.
O Unicode define, então, uma correspondência entre símbolos e números.
(O símbolo "?" será representado pelo número 213).
Veja uma pequena parte das tabelas UNICODE (os números são apresentados em notação hexadecimal):



Sem comentários:

Enviar um comentário