Caracteres n?o imprim?veis, você já viu?

by

Às vezes as pessoas querendo deixar aquele texto feito no Word com um nome de arquivo todo “certinho”, coloca todos os acentos e vírgulas e até símbolos matemáticos no nome do arquivo, porém o que o usuário não sabe (e nem se dá ao trabalho de saber) é que ao criar nomes de arquivo assim a chance desse arquivo aparecer sem a formatação ou nem abrir em outro computador é muito grande. Nem é preciso ir muito longe com isso, basta criar um documento no Windows 7 e tentar abrir no Windows 2000, mesmo um documento do bloco de notas corre o risco de não abrir, por um detalhe tão simples quanto o nome do arquivo.

No Linux a situação é ainda mais capciosa já que os arquivos escritos com caixa alta e caixa baixa são distintos para o S.O., com isso teste.txt e Teste.txt são diferentes, mas você notou alguma diferença entre eles?

Recentemente recebi alguns arquivos da professora responsável pelo estágio supervisionado da Universidade.

Eu não conseguia abrir nenhum dos arquivos, no começo pensei que estivessem mesmo corrompidos, então baixei de novo.

Então vi que eles não estavam, tentei entender o que se passava; o OpenOffice dizia que os arquivos estavam corrompidos, pois não podia ler aqueles NOMES de arquivo, mas o Mandriva (meu S.O.) dizia que tudo estava ok…… Fui ao shell para verificar….

[adriano@meupc ~]$ cd  ‘/home/adriano/Downloads/Documentos – alunos e professores/’

Listei o conteúdo da pasta com o ls e um dos arquivos apareceu assim:

Declara��o de Conclus�o de Est�gio Curricular 2011-1.pdf’

Agora se nem eu consigo ler o nome desse arquivo desse jeito, que dirá o OpenOffice?

Eu posso é claro deduzir qual é o nome correto do arquivo, mas esperar que um software faça deduções é pedir demais por enquanto, não é mesmo?

Aí você pode me dizer então que basta mudar o nome do arquivo pra um nome mais fácil de ser lido pelo computador que tudo está resolvido, certo?

Sim está certo, mas como você vai digitar um caractere que você não sabe qual é?

E como posso fazer para descobrir qual é aquele caractere?

Utilizando um editor de textos tal qual o VIM (dá trabalho mas é o que há no que se propõe a fazer).

Abra um novo documento no vim e cole o trecho de texto com os caracteres não identificados, posicione o cursor no caractere a ser consultado e no modo de comandos digite: ga . No rodapé do vim vai aparecer a representação gráfica do caractere seguido do valor decimal, o valor hexadecimal e por fim o valor octal. Com estes valores você pode consultar a tabela ASCII para identificar os caracteres perdidos, ou se você já sabia qual era o caracteres e apenas quer substituir no vim basta usar o comando: %s,\%xfffd,c,g esse comando vai substituir todos os “ç” por c do texto que houverem no documento do vim.

Mas não existe um jeito mais fácil?

Felizmente para nós há sim. 🙂

No shell (bash) existe o comando auto completar, com isso basta acessar a pasta onde se encontram os arquivos com nomes mal comportados, digitar o começo do nome do arquivo e teclar <TAB>, o shell se encarrega de colocar os caracteres de escape e códigos octais necessários para representar o nome do arquivo, desse modo podemos usar o programa mv para trocar o nome do arquivo desse jeito:

mv Declara��o de Conclus�o de Est�gio Curricular 2011-1.pdf’ Declaracao_Conclusao_Estagio_Curricular_2011.pdf

Agora o nome do arquivo pode não estar tão “bonito” quanto antes, mas pelo menos posso abrir tranquilamente não apenas no meu computador, como em praticamente qualquer computador. Afinal .pdf não significa formato de documento portátil à toa.

Anúncios

2 Respostas to “Caracteres n?o imprim?veis, você já viu?”

  1. Arquivos do estágio da Uninove « bitsontheblood Says:

    […] Felizmente no shell existem o autocompletar e os caracteres de escape que me salvaram o dia, para saber mais sobre este recurso clique aqui. […]

  2. Rejane de lima Says:

    EU sinceramente ja me deparei com arquivos assim é ruim a beça,é bom saber como arrumar,quando precisar,boa informação

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s


%d blogueiros gostam disto: