O que é texto ASCII e como ele é usado?

O que é texto ASCII e como ele é usado?

ASCII é um acrônimo que você deve ter ouvido em relação a texto de computador, mas é um termo que está rapidamente caindo em desuso graças a um recém-chegado mais poderoso. Mas o que é ASCII e para que é usado?





O que significa ASCII?

Talvez o lugar mais fácil para começar seja o próprio acrônimo, então vamos expandi-lo:





PARA mericano S tandard C ode para eu informação eu nterchange





Este bocado de uma frase não dá realmente uma imagem completa, mas algumas partes oferecem imediatamente algumas pistas, notadamente as duas primeiras palavras. ASCII é um padrão americano, cujo significado logo se tornará aparente.

O Code for Information Interchange sugere que estamos falando sobre um formato para a transmissão de dados de um lado para outro. Especificamente, o ASCII lida com dados textuais: caracteres que formam palavras em uma linguagem normalmente legível.



O ASCII resolve o problema de como atribuir valores a letras e outros caracteres para que, quando armazenados como uns e zeros em um arquivo, possam ser traduzidos de volta em letras quando o arquivo for lido mais tarde. Se diferentes sistemas de computador concordarem com o mesmo código a ser usado, essas informações podem ser trocadas de maneira confiável.

como alterar onde o iTunes armazena backups

Relacionado: Como encontrar símbolos e pesquisar seus significados





A História do ASCII

Às vezes referido como US-ASCII, ASCII foi uma inovação americana desenvolvida na década de 1960. O padrão passou por muitas revisões desde, principalmente em 1977 e 1986, quando o ASCII foi atualizado pela última vez.

Extensões e variações foram construídas com base no ASCII ao longo dos anos, principalmente para atender ao fato de que o ASCII omite muitos caracteres usados, ou mesmo exigidos, por idiomas diferentes do inglês dos Estados Unidos. O ASCII nem mesmo fornece o símbolo da moeda do Reino Unido (£), embora a libra esteja presente no Latin-1, uma extensão de 8 bits desenvolvida na década de 1980, que codifica várias outras moedas também.





O ASCII foi amplamente estendido e sucedido pelo Unicode, um padrão muito mais abrangente e ambicioso, que é discutido a seguir. Em 2008, o Unicode superou o ASCII em popularidade para uso online.

Quais caracteres o ASCII representa?

Para um computador, a letra A é tão desconhecida quanto a cor roxa ou o sentimento de ciúme. Os computadores lidam com uns e zeros, e cabe aos humanos decidir como usar esses uns e zeros para representar números, palavras, imagens e qualquer outra coisa.

Você pode pensar em ASCII como o código Morse do mundo digital - a primeira tentativa, pelo menos. Enquanto o código Morse é usado para representar apenas 36 caracteres diferentes (26 letras e 10 dígitos), o ASCII foi projetado para representar até 128 caracteres diferentes em 7 bits de dados.

ASCII diferencia maiúsculas de minúsculas, o que significa que representa 52 letras maiúsculas e minúsculas do alfabeto inglês. Junto com os mesmos 10 dígitos, isso é cerca de metade do espaço usado.

Pontuação, símbolos matemáticos e tipográficos ocupam o restante, e uma coleção de caracteres de controle, que são códigos especiais não imprimíveis com significados funcionais - veja mais abaixo.

Aqui estão alguns caracteres típicos que codificam ASCII:

BinárioDecimalPersonagem
010 000133!
011 0000480
011 1001579
011 101159;
100 000165PARA
100 001066B
101 101090COM
101 101191[
110 000197para
110 001098b
111 1101125}

Observe que os valores escolhidos têm algumas propriedades úteis, em particular:

  • Letras do mesmo caso sempre podem ser classificadas numericamente, pois estão em ordem. Por exemplo, A tem um valor inferior a B, que possui um valor inferior a Z.
  • Letras de maiúsculas e minúsculas são deslocadas exatamente em 32. Isso torna muito fácil traduzir entre maiúsculas e minúsculas, uma vez que apenas um único bit precisa ser trocado para cada letra, de qualquer maneira.

Personagens de controle

Além de letras, pontuação e dígitos, o ASCII pode representar vários caracteres de controle, pontos de código especiais que não produzem saída de um único caractere, mas fornecem significados alternativos sobre os dados para o que quer que os esteja consumindo.

os telefones têm um endereço IP?

Por exemplo, ASCII 000 1001 é o caractere de tabulação horizontal. Ele representa o espaço que você obterá ao pressionar a tecla TAB. Normalmente, você não verá esses personagens diretamente, mas seus efeitos serão frequentemente mostrados. Aqui estão mais alguns exemplos:

BinárioDecimalPersonagem
000 10019Guia horizontal
000 101010Alimentação de linha
001 01112,3Fim do bloco de transmissão

E quanto a outros personagens?

O ASCII teve um enorme sucesso durante os primeiros dias da computação, pois era simples e amplamente adotado. No entanto, em um mundo com uma visão mais internacional, um sistema de escrita simplesmente não vai funcionar. As comunicações modernas precisam ser possíveis em francês, japonês - na verdade, qualquer idioma em que possamos querer armazenar texto.

O conjunto de caracteres Unicode pode endereçar um total de 1.112.064 caracteres diferentes, embora apenas cerca de um décimo deles estejam atualmente definidos. Isso pode parecer muito, mas a codificação visa não apenas atender a dezenas de milhares de caracteres chineses, mas também abrange emoji (quase um mil e quinhentos) e até sistemas de escrita extintos, como o Jurchen.

Relacionado: Os 100 emojis mais populares explicados

O Unicode reconheceu o domínio do ASCII em sua escolha dos primeiros 128 caracteres: eles são exatamente iguais ao ASCII. Isso permite que arquivos codificados em ASCII sejam usados ​​em situações em que o Unicode é esperado, fornecendo compatibilidade com versões anteriores.

Resumo

O texto ASCII representa as 26 letras do alfabeto inglês, com dígitos, pontuação e alguns outros símbolos inseridos. Ele serviu muito bem ao seu propósito por quase meio século,

Ele agora foi substituído pelo Unicode, que oferece suporte a um grande número de idiomas e outros símbolos, incluindo emoji. UTF-8 é, para todos os efeitos práticos, a codificação que deve ser usada para representar caracteres Unicode online.

Compartilhado Compartilhado Tweet O email Vale a pena atualizar para o Windows 11?

O Windows foi redesenhado. Mas isso é suficiente para convencê-lo a mudar do Windows 10 para o Windows 11?

qual é o nome do arquivo executável para o aplicativo instalador do Windows em um computador com Windows 8.1?
Leia a seguir Tópicos relacionados
  • Tecnologia Explicada
  • Jargão
  • Cultura da Web
  • Unicode
Sobre o autor Bobby Jack(58 artigos publicados)

Bobby é um entusiasta da tecnologia que trabalhou como desenvolvedor de software por quase duas décadas. Ele é apaixonado por jogos, trabalha como Editor de Críticas na Switch Player Magazine e está imerso em todos os aspectos da publicação online e desenvolvimento web.

Mais de Bobby Jack

Assine a nossa newsletter

Junte-se ao nosso boletim informativo para dicas de tecnologia, análises, e-books grátis e ofertas exclusivas!

Clique aqui para se inscrever