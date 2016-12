in Artigos

by Felipe Falcão

De acordo com a Wikipedia OCR é definido como: acrônimo para o inglês Optical Character Recognition, é uma tecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bits sejam eles escaneados, escritos a mão, datilografados ou impressos. Dessa forma, através da OCR é possível obter um arquivo de texto editável por um computador.

A tecnologia OCR é uma mão na roda quando você precisa editar um texto que está em uma imagem ou arquivo PDF por exemplo. Existem muitos softwares com a tecnologia OCR, neste artigo lhe apresentaremos um dos melhores o Wondershare PDFelement. Mas antes, vamos entender como a OCR funciona.

Como a OCR funciona?

Para entender como o OCR funciona, é necessário primeiro saber o que é TIFF. TIFF é um formato de arquivo raster para imagens digitais. Quando você usa o seu scanner para obter uma imagem de um texto impresso, por exemplo, é criado uma imagem .TIFF, é possível distinguir essa imagem e ler na tela do computador. Para o computador, no entanto, o arquivo .TIFF não passa de pontos brancos e pretos – o texto é todo igual para o computador. Daí basta o OCR fazer um rastreamento e determinar que letra combina com aquela sequencia especifica de pontos! Dessa forma o computador consegue interpretar cada letra.

Vantagens do OCR

As vantagens do OCR são muitas, mas vamos listar as principais:

A digitalização de documentos o que reduz em muito a quantidade de papel utilizada numa empresa. As informações podem ser facilmente atualizadas, visto que agora são arquivos digitais. Com todas as informações em formato digital é possível fazer pesquisas por palavras-chave e obter melhores resultados de forma mais rápida do que uma varredura com o olho no documento físico Pode ser facilmente compartilhado. Diminuição das perdas ou extravios de documentos, como também a diminuição do transito dos mesmos.

Utilizando a tecnologia OCR

Para essa parte iremos usar o Wondershare PDFelement. Este software além de trazer a tecnologia OCR, o PDFelement também integra a criação, edição e conversão do PDF, tudo num só lugar. Você pode editar textos, imagens e páginas em PDF, anotar e comentar, além de converter o PDF para vários outros formatos, ou vice-versa, e muito mais. Depois de fazer o download e instalar o programa, clique em abrir.

Agora escolha o arquivo que deseja transformar em arquivo de texto. Escolhemos aqui um arquivo PDF. Lembrando que você pode usar arquivo de imagem também.

Agora basta apertar no botão OCR.

Após isso, uma caixa aparecerá e você poderá configurar o idioma em que o seu arquivo original está. Depois, basta apertar o botão OK.

Em pouco tempo você terá um arquivo completamente editável!