Aplicações Informáticas B: TEXTO - codificação de caracteres

O que são padrões de codificação de caracteres?

Uma codificação de caracteres é um padrão de relacionamento entre um conjunto de caracteres com um conjunto de outra coisa, como por exemplo números ou pulsos eléctricos com o objectivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação.

Exemplos comuns são o código morse que codifica as letras do alfabeto latino e os numerais como sequências de pulsos eléctricos de longa e curta duração e também o ASCII que codifica os mesmos grafemas do código morse além de outros símbolos através de números inteiros e da representação binária em sete bits destes mesmos números.

Tabelas de código ASCII e a de código Unicode

O que é o código ASCII?

A memória do computador conserva todos os dados sob a forma numérica. Não existe um método para armazenar directamente os caracteres. Cada caracter possui por conseguinte o seu equivalente em código numérico: é o código ASCII (American Standard Code for Information Interchange - traduz-se por "Código Americano Standard para a Troca de Informações"). O código ASCII básico representava os caracteres em 7 bits (quer dizer 128 caracteres possíveis, de 0 a 127).

Os códigos 0 a 31 não são caracteres. Chamamos-lhes caracteres de controlo porque permitem fazer acções como:

regresso à linha (CR)

Bip sonoro (BEL)

Os códigos 65 a 90 representam as maiúsculas

Os códigos 97 a 122 representam as minúsculas

(Basta alterar o 6° bit para passar das maiúsculas às minúsculas, quer dizer acrescentar 32 ao código ASCII em base decimal.)

( http://pt.kioskea.net/contents/54-o-codigo-ascii#o-que-e-o-codigo-ascii )

Código Unicode

Em vez de usar apenas os códigos de 0 a 127, ele utiliza os códigos de valor bem maiores.

O código UNICODE pode representar todos os caracteres específicos de diversos idiomas. Novos códigos são regularmente atribuídos para novos caracteres: caracteres latinos (acentuados ou não), gregos, cirílicos, armênios, hebraicos, tailandeses, hiraganas, katakanas, etc... Só o alfabeto chinês Kanji contém 6879caracteres.

O Unicode define, então, uma correspondência entre símbolos e números.

(O símbolo "?" será representado pelo número 213).

Veja uma pequena parte das tabelas UNICODE (os números são apresentados em notação hexadecimal):

( http://pt.kioskea.net/faq/9956-o-que-e-ascii-unicode-e-utf-8 )

Aplicações Informáticas B

Translate

sexta-feira, 25 de outubro de 2013

TEXTO - codificação de caracteres

O que são padrões de codificação de caracteres?

Tabelas de código ASCII e a de código Unicode

O que é o código ASCII?

Código Unicode

Sem comentários:

Enviar um comentário