4 ferramentas de OCR online gratuitas colocadas no teste final

4 ferramentas de OCR online gratuitas colocadas no teste final

Se quiser converter qualquer texto impresso em texto digital que possa copiar, colar, editar e pesquisar, você precisará usar scanners de reconhecimento óptico de caracteres (OCR).





Quando você opta por digitalizar ou tirar uma foto de um documento, ele é salvo em um formato como JPEG ou PDF. Software OCR pode então reconhecer as letras e números nesses documentos e convertê-los em um PDF pesquisável ou em um arquivo que pode ser editado em programas como o Microsoft Word.





O problema é que alguns scanners OCR funcionam muito melhor do que outros, com o melhor sendo bem pesado na carteira.





Omnipage18, por exemplo, custa US $ 150, mas é especialmente bom para reconhecer idiomas diferentes. Adobe Acrobat Pro DC custa US $ 400 de dar água nos olhos, mas tem uma precisão incrível. ABBYY FineReader custa $ 150, mas é fantástico para converter documentos como revistas e brochuras em texto pesquisável. Estaremos testando a oferta online da ABBYY posteriormente neste artigo.

No entanto, se você procura alternativas gratuitas que você pode download e usar no Windows ou OS X, você deve experimentar essas ferramentas de OCR. Mas se você preferir usar um grátis, conectados Ferramenta de OCR, continue lendo, já que experimentamos os primeiros, com os resultados abaixo.



O teste

Parece que a maioria das pessoas agora usa seus smartphones para fazer a varredura para eles, decidi usar Aplicativo Scannable do Evernote (Gratuito no iOS e Android). Eu examinei a primeira página do Richard Dawkin's Monte de escalada improvável , para ver quais resultados podemos obter com uma formatação muito básica. Eu também digitalizei uma página de Tim Ferriss ' O Chef de 4 horas para experimentar os scanners com alguma formatação um pouco mais complicada. Salvei cada um desses arquivos como PDF.

Em seguida, esses documentos foram examinados por meio de algumas das melhores ferramentas de OCR on-line para ver se se saíram bem.





OCR online grátis [não mais disponível]

Felizmente, não é necessário registro para usar o OCR online gratuito. E fiquei duplamente impressionado quando vi sua reivindicação de manter a formatação e o layout do meu documento.

O site afirma ser capaz de suportar PDF, GIF, BMP, JPEG, TIFF e PNG como entrada. As saídas podem ser DOC, um documento de texto PDF, RTF e TXT. Infelizmente, não consegui descobrir se eles tinham um limite de tamanho de arquivo.





Documento básico para PDF

Convertido de forma absolutamente perfeita. Não há muito mais a dizer! Estamos indo para um muito bom começo.

Documento Básico para DOC

As palavras reais parecem ter se convertido perfeitamente, exceto 'ount' de 'Monte Rushmore' de alguma forma desaparecendo. A formatação é uma história diferente, no entanto. Muitas vírgulas foram substituídas por sublinhados e espaços aleatórios foram inseridos em pontos ao longo do documento. Quando você vir mais tarde como o software premium se saiu neste teste, porém, isso não é um esforço ruim em absoluto .

Documento complexo para PDF

Documento Complexo para DOC

Desta vez, a conversão demorou apenas 10 segundos, com o texto novamente convertido com cerca de 95% de precisão. Houve alguns problemas de espaçamento estranhos e o software teve problemas para converter a fonte no canto superior direito do documento e perdeu alguns caracteres aqui e ali.

Veredito

i2OCR

i2OCR faz algumas afirmações impressionantes. A ferramenta reconhece mais de 60 idiomas, pode lidar com layouts de várias colunas (removendo a formatação), não tem limites de tamanho de arquivo, pode converter arquivos carregados e de URLs. E você também não precisa se registrar para usar esta ferramenta.

O serviço funciona simplesmente extraindo o texto de sua imagem e gerando texto não formatado. Você pode corrigir rapidamente quaisquer erros na visualização lado a lado, antes de copiar o texto para outros programas ou fazer o download como DOC, PDF ou HTML.

Nota: quando tentei carregar meus documentos PDF, eles foram rejeitados pelo i2OCR, então eu precisei convertê-los para JPEG (fazendo uma captura de tela deles e, em seguida, enviando os arquivos).

Documento Básico para Texto Simples

Documento complexo para texto simples

A maior parte do texto foi convertida sem muitos erros, exceto o título e a receita no canto superior direito, que era ilegível para esta ferramenta. A forma como as colunas foram convertidas em texto simples estava longe do ideal. Se você quiser fazer essa conversão viável, muito tempo seria necessário para reorganizar as linhas em frases coerentes.

Veredito

OCR online

O OCR online atualmente oferece suporte a 46 idiomas diferentes e pode converter PDF, JPG, BMP, TIFF e GIF em formato Word, Excel ou Texto Simples. O site afirma que 'os documentos convertidos se parecem exatamente com os originais - tabelas, colunas e gráficos'.

A versão que você pode usar sem se registrar permite converter até 15 imagens por hora (limite de 5 MB). Se você se inscrever para uma conta, poderá comprar mais páginas além desse limite, ao mesmo tempo em que pode converter documentos de várias páginas e arquivos ZIP.

Documento Básico para DOC

O documento básico foi convertido perfeitamente, exceto pelo algarismo romano eu não sendo pego. Como o site prometia, a formatação era exatamente como no livro. Parabéns a esta ferramenta.

Documento Complexo para DOC

Depois de ficar desapontado com as ferramentas de OCR anteriores na conversão do documento complexo, fiquei extremamente impressionado com o OCR online. O layout era quase perfeito, como você pode ver acima. Mais uma vez, a receita não foi escolhida muito bem, mas quaisquer outros pequenos erros foram insignificantes.

Veredito

Resultados absolutamente fantásticos do OCR online. A única desvantagem que vejo é que não há como baixar os documentos convertidos como PDFs, pois os formatos de saída mencionados incluem apenas DOCX, XLSX e TXT.

ABBYY FineReader Online (teste de 10 páginas)

Conforme mencionado anteriormente, a ABBYY é uma das líderes de mercado em software OCR, custando cerca de US $ 150 por seu programa completo para download. Eles oferecem um Teste gratuito de 10 páginas para sua ferramenta online, porém (registro obrigatório). Por uma assinatura de $ 5, sua ferramenta online permitirá que você converta 200 páginas todos os meses.

Os arquivos aceitos podem ter até 100 MB, em qualquer um dos formatos: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP e PNG. A ABBYY também reconhece quase 200 idiomas. As saídas são especialmente impressionantes, com escolha entre DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 e EPUB.

Você pode até experimentar alguns recursos BETA durante o teste. A primeira é a opção de traduzir seu documento para outro idioma. A outra é exportar seu documento convertido para sua conta de armazenamento em nuvem, seja Dropbox, Google Drive, Evernote, Microsoft OneDrive ou Box.

Documento básico para DOCX

Documento complexo para DOCX

Depois de convertido, havia muito poucas falhas no texto dentro do documento (além da dificuldade do OCR com a fonte da receita novamente!), Mas a formatação deixou muito a desejar.

As três colunas de alguma forma ocupavam duas páginas, com a coluna central aparecendo na segunda página. Se você realmente quisesse Faz qualquer coisa com este documento convertido, você acabaria arrancando seus cabelos.

Documento básico para PDF

Documento complexo para PDF

Veredito

O Resultado Final

Se, como a maioria das pessoas, você está apenas olhando para escanear alguns artigos de revistas e algumas contas domésticas, não precisará editar esses documentos. Portanto, a conversão direta para PDF será adequada para você, porque ainda será capaz de pesquisar esses documentos. Para isso, o OCR Online Grátis foi definitivamente a melhor ferramenta gratuita que testamos. Dito isso, se você estiver disposto a pagar US $ 5 por mês pela perfeição, FineReader Online da ABBYY foi um pouco mais preciso.

No que diz respeito à conversão de documentos para DOC, não conseguimos encontrar nenhuma solução que fosse perfeita, mas de longe os melhores resultados vieram de OCR online . A conversão não foi perfeita, mas a integridade da formatação foi mantida praticamente intacta e os erros foram insignificantes. Quando comparamos esses resultados com a oferta 'premium' da ABBYY, você não pode deixar de ficar extremamente impressionado.

Não incluímos os recursos de OCR do Google Drive nesta postagem; um pouco pela presença do Google em todos os lugares, mas mais pelo fato de que queríamos testar alguns outros serviços OCR online gratuitos por aí.

Para você: quais outras ferramentas de OCR on-line você recomendaria aos nossos leitores? E qual você experimentou que nunca mais usaria?

Compartilhado Compartilhado Tweet O email Um guia para iniciantes em animação de discurso

Animar a fala pode ser um desafio. Se você estiver pronto para começar a adicionar diálogo ao seu projeto, vamos dividir o processo para você.

não consigo inicializar no modo de segurança do Windows 10
Leia a seguir Tópicos relacionados
  • Internet
  • Produtividade
  • Conversão de arquivo
  • OCR
Sobre o autor Rob Nightingale(272 artigos publicados)

Rob Nightingale é graduado em Filosofia pela Universidade de York, no Reino Unido. Ele trabalhou como gerente e consultor de mídia social por mais de cinco anos, dando workshops em vários países. Nos últimos dois anos, Rob também foi redator de tecnologia e gerente de mídia social da MakeUseOf e editor de boletim informativo. Você normalmente o encontrará viajando pelo mundo, aprendendo edição de vídeo e fazendo experiências com fotografia.

Mais de Rob Nightingale

Assine a nossa newsletter

Junte-se ao nosso boletim informativo para dicas de tecnologia, análises, e-books grátis e ofertas exclusivas!

Clique aqui para se inscrever