Texto
Saudações cybernautas! O tema que hoje vos trazemos é "o texto". Vamos começar esta mensagem por definir "padrões de codificação de caracteres".
Os padrões de codificação de caracteres correspondem a maneiras de representar caracteres, quer este sejam letras, números ou símbolos. Alguns dos padrões de codificação de caracteres mais conhecidos são as tabela: ASCII, Unicode, EBCDIC, ISO Latin e ANSI.
ASCII:
A tabela de codificação ASCII (American Standard Code Information Interchange) foi a primeira tabela de codificação, sendo partilhada por todos os sistemas operativos nos anos 60, facilitando assim a comunicação entre eles. Esta tabela é um código binário que codificava 128 caracteres diferentes, numa fase inicial - 95 sinais gráficos (que incluíam letras do alfabeto latino, sinais de pontuação e sinais matemáticos) e 33 sinais de controlo -, sendo que os caracteres eram representados por um conjunto de 7 bits. Posteriormente, o código ASCII foi alargado para 256 caracteres, aumentando o conjunto de bits por codificação de 7 para 8. Este bit em excesso pode ser utilizado de formas diferentes. O padrão UTF-8 utiliza este bit para indicar que o code point tem um valor que excede os valores da tabela ASCII e necessitará de mais bytes para ser representado. A Microsoft, no entanto, utilizou este bit para tornar possível a codificação de carateres adicionais no Windows Code Page. A uma alteração da extensão da tabela, correspondeu a uma alteração do seu nome para ISO 646, ficando assim adaptado a mais idiomas. Mais tarde, o ISO assumiu mais nomes, que correspondiam a outros conjuntos de caracteres, como por exemplo o ISO 8859-1 para as línguas derivadas do latim. O ASCII foi algo pioneiro no campo da codificação de caracteres, mas tinha os seus problemas. Alguns idiomas eram construídos por demasiados carateres e existiam várias tabelas ASCII para os vários idiomas, o que tornava o uso e conversão de um para outro mais complicado e suscetível a incorreções. Devido a isto, houve a necessidade de criar um código standard, mais abrangente, o Unicode.
Unicode:
Unicode é um padrão que permite aos computadores representar e manipular, de modo consistente texto de qualquer sistema de escrita existente. Este padrão codifica pouco mais de 107 mil carateres, que incluem os carateres da maioria das línguas, símbolos matemáticos, carateres acentuados e pontuação. Pode ainda enumerar propriedades de carateres (caixa alta e caixa baixa, por exemplo) e conjuntos de arquivos de computador, e armazena informação relativa a regras para a normalização, decomposição, ordenação alfabética e renderização.
Os nossos nomes em ASCII:
___ ___ ___ ___
/\__\ /\ \ /\ \ ___ /\ \
/::| | /::\ \ /::\ \ /\ \ /::\ \
/:|:| | /:/\:\ \ /:/\:\ \ \:\ \ /:/\:\ \
/:/|:|__|__ /::\~\:\ \ /::\~\:\ \ /::\__\ /:/ \:\ \
/:/ |::::\__\ /:/\:\ \:\__\ /:/\:\ \:\__\ __/:\/__/ /:/__/ \ :\__\
\/__/~~/:/ / \/__\:\/:/ / \/_|::\/:/ / /\/:/ / :\ \ / : / /
/:/ / \::/ / |:|::/ / \::/__/ \:\ /:/ /
/:/ / /:/ / |:|\/__/ \:\__\ \:\/:/ /
/:/ / /:/ / |:| | \/__/ \::/ /
\/__/ \/__/ \|__| \/__/
_____
(, / | ,
/---| __ _/_ _____ ___
) / |_/ (_(__(_) / (__(_(_)
(_/
Uma imagem:
Os padrões de codificação de caracteres correspondem a maneiras de representar caracteres, quer este sejam letras, números ou símbolos. Alguns dos padrões de codificação de caracteres mais conhecidos são as tabela: ASCII, Unicode, EBCDIC, ISO Latin e ANSI.
ASCII:
A tabela de codificação ASCII (American Standard Code Information Interchange) foi a primeira tabela de codificação, sendo partilhada por todos os sistemas operativos nos anos 60, facilitando assim a comunicação entre eles. Esta tabela é um código binário que codificava 128 caracteres diferentes, numa fase inicial - 95 sinais gráficos (que incluíam letras do alfabeto latino, sinais de pontuação e sinais matemáticos) e 33 sinais de controlo -, sendo que os caracteres eram representados por um conjunto de 7 bits. Posteriormente, o código ASCII foi alargado para 256 caracteres, aumentando o conjunto de bits por codificação de 7 para 8. Este bit em excesso pode ser utilizado de formas diferentes. O padrão UTF-8 utiliza este bit para indicar que o code point tem um valor que excede os valores da tabela ASCII e necessitará de mais bytes para ser representado. A Microsoft, no entanto, utilizou este bit para tornar possível a codificação de carateres adicionais no Windows Code Page. A uma alteração da extensão da tabela, correspondeu a uma alteração do seu nome para ISO 646, ficando assim adaptado a mais idiomas. Mais tarde, o ISO assumiu mais nomes, que correspondiam a outros conjuntos de caracteres, como por exemplo o ISO 8859-1 para as línguas derivadas do latim. O ASCII foi algo pioneiro no campo da codificação de caracteres, mas tinha os seus problemas. Alguns idiomas eram construídos por demasiados carateres e existiam várias tabelas ASCII para os vários idiomas, o que tornava o uso e conversão de um para outro mais complicado e suscetível a incorreções. Devido a isto, houve a necessidade de criar um código standard, mais abrangente, o Unicode.
Unicode:
Unicode é um padrão que permite aos computadores representar e manipular, de modo consistente texto de qualquer sistema de escrita existente. Este padrão codifica pouco mais de 107 mil carateres, que incluem os carateres da maioria das línguas, símbolos matemáticos, carateres acentuados e pontuação. Pode ainda enumerar propriedades de carateres (caixa alta e caixa baixa, por exemplo) e conjuntos de arquivos de computador, e armazena informação relativa a regras para a normalização, decomposição, ordenação alfabética e renderização.
Os nossos nomes em ASCII:
___ ___ ___ ___
/\__\ /\ \ /\ \ ___ /\ \
/::| | /::\ \ /::\ \ /\ \ /::\ \
/:|:| | /:/\:\ \ /:/\:\ \ \:\ \ /:/\:\ \
/:/|:|__|__ /::\~\:\ \ /::\~\:\ \ /::\__\ /:/ \:\ \
/:/ |::::\__\ /:/\:\ \:\__\ /:/\:\ \:\__\ __/:\/__/ /:/__/ \ :\__\
\/__/~~/:/ / \/__\:\/:/ / \/_|::\/:/ / /\/:/ / :\ \ / : / /
/:/ / \::/ / |:|::/ / \::/__/ \:\ /:/ /
/:/ / /:/ / |:|\/__/ \:\__\ \:\/:/ /
/:/ / /:/ / |:| | \/__/ \::/ /
\/__/ \/__/ \|__| \/__/
_____
(, / | ,
/---| __ _/_ _____ ___
) / |_/ (_(__(_) / (__(_(_)
(_/
Uma imagem:
A mesma imagem em ascii:
//*//*/*(**,,,
*/*****/*,,/,.
,**//****(,*.,.
,//((/***(**,/.
/(****///**.(,..
/(**//*///(**./,. ....,,,,,,....
**///(/***(/***.. ..,,,,*********,*,..
,**//(///*/*,(..* ..,,,,******////////,,,..
**///*//(//*./,., ..,,,,,,******/////////**,,.
**(****((#//*,,*.. ...,,,,,,******/////(//(/***..
**/***///**(/**... ,.,,,,,,,,,****/////((((/***,,.
,,**////**,/*,(,,, .,,,,,,,,,,,,**/////(((((//*/*,.
,,///*//(///*././,. .,,,,,,,,,,,,,**////((((##((/***,
**(/***/(/(/*,/,/,. ..,,,,,,,,,,**,**////((((####///,.
*///**//(**(///,,,, ... .... ..,*,*//*********//(((#######(((*(##
***///*(/////**,,,, ... ..... .. .,#(*%#(*,*(((#//%%###(#(####(((####
..* . .. ,,***//***(##/***/((#(//(###(#(#%%#(
..,** .. ,,*******/##((/***////((#####(#####/
..,*/ .. ,,,,***,*/(##(#/***//((#####(((#(##
.,*/ .,. ,,**(*,,*/(###%#(///((##%###(((#((
....,**.*/, .... ... ,,*/,,,,,*(#(((//////(######(((,
.....,***/**/.. .. .,**,*/////((##%%%(*//(#(##(((/
........*(/#(((/ ... ... ,,,,**/,..,*/##((//(/((((((##*((.
.....,,,/(((*#((, ,,,,,****//(#((/(/#(//(####(*//*.
.......,/(#((#((* . .,.,,,,,,,**//////((((((#%/*///////.************,,,,,,,,,,,...
. ...,,,,*/(((/##((,......................................................,,**.*.,*,*..,,,*****/(//##%%(,,*/////////*((((((((((((/////////*********
......./((%###((/ . ............................. .,,*//(###%,**///,.,**/////((#%((%%#*//(/*//*/*** /(((#(((((((((((((((////////
.,,,,*/(###((((//. ................................ .,*//((##%#/*//*,,#/*,,,*//((#%(###%%%%*****/**/*,*..,.############(((((((((((((
.*((((((((/////,. . ..................................,*//(((//(,****,,,*,*#/*////(#/(###%%##((/*,,*/(*////,,,..(###########(#(((((((((
((######(((/*,, ............................ .,...,*////,,,.,,,,,,,,,,,*/(/*/***(%%##(((((/////*/**/((//*,,...**##%##################
.(#####(/(/#*.. ............................ .......,****,.,,,,,.,,,,,,,,/////,//*****************(*/((/**.,,,,,,.....,%%%##############
*/*/(##(((#%*... ...............................,,..,,,,,.,,***,.,,,,,,.,,**,,,*,,,,,,,,,,,,,,,,,*//(#(*,,,,,,.,,*,.......,.%%%%#%%%%#####
###/(###(#%((*,........................ ......,,,,.,,,,,,****,,.,,,,,.,,,*,,,,,,*,,,,,,,,,,,,,,,*/(/(/*,,,,,,.,,*,,,,,,,,***,/&%%%%%%%%###
. .%%#/(####(((/*..........................,,,,,,*,,,,,,****,,,,,,,,,,,,,,,,,,,,,,,*,,,,,,,,,,,,,,*////**,,,,.,,.,,,,,,**////(/,&&&&&&&%%%%#
. *%&/*######((//,.,............... ..,,,,,,,****,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,*,,,,,,,,,,,,,,,*///*,,,,,,,..,,,,*///////*,,#@@@&&&&&%%%
.. . .. ....((((#######((**,.*.......... ..,,,,*,**,**///,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,**,,,,,,,,,,,,,,((/*,,,,,,,.,,**/****/**,,*/&@@@@@@@&&%%
.,** . . ,(/#(((#######/*,,/./,. ....,,,,*******/////,**,,,,,,,,,,,,,,,,,,,,**,,,,,,,,,,,,,,,,,,,,,,,,,,*(/,,,,,,,.,**********,,,/((@@@@@@@@@&&%
((((*(...,, . ........*,,&%########((/**/,,//,*,///*********/(((((***,**,,***,,,,,,*,*,,,,,,,,,.,,,,,,.,,,,,,,,,,,,,,,//,,.,,.,,*,,,,,,***,./((((@@@@@@@@@&&&
(((/. ...*, ..........*,&%%%%####((##(*/,.*((/(/**//(//////(((((//*********,*,*,****,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,(*,,.,,,,,**,,,***,/((((((@@@@@@@@@@&&
(((( ....*.... . .*%##((###(((#((#(*,,*((/(((/(((#(//((####(*****************,,,,.,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,*/,,//,,***,,,,*((((((((/(#@@@@@@@@@&&
(((/,,**./. .,/#####(((###(((#(//((((###((###%(((%%%%****************,,,,,,,,,,,,,,,,,,,,,,,,,,,,***,,,,,,**#,%*,,,*,,,*///(/((((//((#%@@@@@@@@&@
((/*,*(/.. .*######(#####((((#(/(((#%%#/(###%%##%&%***************,,,,,,,**,,,,,,,,,,,,*************,,,/(/#**,,,,,,,**///*//////*((##@@@@@@@@&&
((**..... . . . %%%%##########((##(#(((%%%#/(##%%%%#%@**,,,,,,*****,,,,,,,,,**,,,,,,,,,,,********///*****((#(/,,,,,,,****//////((/**((###@@@&&&&%%
((,............... .#%##########(###(((((%%%#(((#%%%%%%%/(((/*,,,,,,,,,,,,,,,,**,,,,,,,,,,*//******///***///(%(,,,,,.,*******///////*((((((@&&&&&&&%
((............... . *%#######(##(((##((#%%(((((%%%%####((//***,,,,,,,,,,,,,,,**,*********///****/////**(*//#,**,,,,,********/////*,(##(((@&&&&&&%%
(*..............,********,,... . .(#(((#(##%%##((##%%#((((#%%%%%/*,,,,,,,,,,,,,,,,,,,,,,,,***********///**////////(////**,,,,,,,,*******///**,((#(((&&&&&&&&&
%#(%%%(//#(#%(/(#(////////(((##%%%&%**/%%%%%%##(((#####(#.......,,*,,,,,,,,,,,,,,,,,,,,,,,,,********,,**///////////((((/***,,,,,,,,,,**,,**,***/((((((&&&&&&&&&
%%%(((%(//#%//(#(/(/((((#(/**(#%%&%%%%##(/////***##((,......,**,,,,,,,,,,***,,*****/*******************////////((/(((#***,,,,,,,,,,,,**///(((#((((((@&&&&&&&%
%%%%&(//#%//(%(//##/((##//(####%#######(((((/////(**,.......*,,,,,,,,,,,,,,*****,,,,,,,*,******************(///(((((((((,,,,,,,,,,,,,*//////*(((((((((@&&&&&&&&
(#%%%#/(%&(//#%//(%#//#%((#%%%%######((((///*/((##(##%..,,,******(****,,,,,,,,,,,,,,,,,,,****************///////(((((//**,,**,,*//(//////////*/(((((@&&&&&&&&
((#%(((/*,,,%%#((&%%%%%#######%%%%%%%%&&&&&&&&&&&&@@@&&*,,,,,*,,*,,,,***/************(((((((###(//**********,,,*/////((#/**,,,*************,,,*((((###&&&&&&&&&
,,,***.////%&&&%%%%&&&&&&@@&&&&&&&&&&&&&&&&@&&&&&&&%*,*,,,,.,,*******,,**////*#%%%#(///****////(((##%%%%%%%####((((((((((*,,*(*,,,,,,,,,,***/######(##&&&&&&&&&
,*((*,*//(%%%%&&&&&&&&&&&&&&&&&&&&&@@@@@@@&&%#((/***,,,,****,,,,****(//***/////////***,***/((((//**((*,,.*##%%**%%%&,,,,,,,,,,**%/*,*****(#########(&&&&&&&&&
(/*#%#%@&&&&&&&@@@@@@@@@@&&%#((///**********,,,,,,.,,,,***,,****///(###((((((((((///////,,,,,,,,,,,,,*,,..**///**,,,,,,,,,.,,,*,,***#%/*/((#######%###&&&&&&&&&
(((/(%&&&&&%#(//**********,,,,,,,,,,,,,,,,,,........................*(%%##(((((((((/////******,********,,*/(%#/***//*****************(%%(/((((##%%#&@&&&&&&&&%%
###(,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,................................./%%##((((((((//////**********/,*(/////****///////////(((####((/#%%#(#(((#%#&@&&&&&&&&*
###(,..,,,,,,,...........,,,,,,,,,,,,,........................,,..........#%%%%#####(((#%/////((//////##(/////**/(/////////(((((###((((#%%(((((#%&&&&&&&&&&&%**
##(*.......................,,,,,,,,,.........,%*.............*............/%%%%%%%%%%%%((((##((((((/***/////#%%%%%%###((((((((####((((#%#(#(#&&&&&&&&&&&&%***
((/,.........................,,,,,,...,,,,,,,,*%#......,,,,*#/,,.............../(#%##&&&&(####%##((((//((////(((//((((((((((((#(((###((((####(@@&&&&&&&&&&%****
(/,,..........................,,,,,..*..........,/*..,,..,/,.....,...............,/(((%%###%%%%%#####/((/(##%%&&%####((((((((((##((####(#(##(@&&&&&&&&&&&%*****
.,,,,,,,,,,,,,.........,......,,,,..,*,,,,*/((###%(/#%(*,........,,.................*/(#((%%%%#(/////////////((((#%&&&%%%####(####((#######((@&&&&&&&&&&%******
****,,,,,,,,,,,,**(###(,...........,(#/,,.......,##%&*...,,,,,**/&@/..................,#(/////*****///(((((################%%&@%&%#########&@&&&&&&&&&&%*******
((###(*,,,*****///((#%/,,,,,,,......,,**//////*,,.....,,****//((/,.......................,*,*///(################################%%&&&&%&@@@&&&&&&&&&&&********
//////****////////(((/*,,,,.......................................,.... . ............,(#########%%%%#%%%%%%%%&&&%%%#############%%%%@&&&&&&&&&&&(********
,,,,,,............,,,,.................................................,,,,,***///(((((((((((######%%%&%&%&%%%%%%%&&&&&@@@@@@&&%%#######%######&&&&&&%*********
.......................................,,,,,****////((((((((((((((((((((((((((((((((((((((((####(##%%#%%%%%&&&&%%&&&&@@@@@@@@&&&&&&&&%%#############&**********
.......,,,,,,,*****/////((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((((#%%%%######%%%%%%%&&&&&&@@@@@@@@@@&&&&&&&@&@@&%%##########*********
Comentários
Enviar um comentário