5 webs de OCR gratis extraer el texto de un PDF, o una imagen

OCR son las siglas de Optical Character Recognition, o lo que es lo mismo, el reconocimiento óptico de caracteres. En lenguaje normal, viene a ser el proceso por el cual se extrae el texto de una imagen.

¿Recuerdas ese PDF del cual no podías copiar su texto, porque sus páginas estaban guardadas como imágenes? ¿O quizá aquella vez en la que escaneaste todos tus apuntes y luego no podías buscar en su contenido? Un software OCR te habría sido de gran ayuda, pero no hace falta que instales nada, ni te gastes un dineral. Hay muchas páginas web donde lo puedes hacer, y gratis.

1. Google Drive (o Google Docs)

Google Drive es un servicio de almacenamiento y edición de documentos, presentaciones y hojas de cálculo online. Sus funciones son muchas, pero la que vamos a ver a continuación es una no demasiado conocida: el análisis OCR.

Lo primero es entrar a Google Drive, para lo cual necesitarás una cuenta de Gmail. Después, en la pantalla principal elige Subir > Archivos.

Subir drive

Después se abrirá una pequeña ventana en la parte inferior de la ventana y la subida se iniciará automáticamente. Una vez termine, haz clic sobre el nombre del archivo que has subido.

Subido

Esto abrirá una previsualización del archivo. Probablemente ya puedas seleccionar el texto y copiarlo al portapapeles, pero elige Archivo > Abrir con > Google Docs para que se exporte en un formato editable.

El resultado es bastante bueno, reconociendo formato básico como negritas y cursivas.

2. Free Online OCR

¿Pero por qué complicarse tanto? A lo mejor lo único que quieres es subir tu PDF (o imagen) y obtener el texto, sin más. En tal caso Free Online OCR es de lo más agradable a la vista que vas a encontrar.

El proceso consta de dos únicos pasos. Primero, elige el archivo en tu disco duro, y después en qué formato recibirás el resultado, pudiendo elegir entre PDF, TXT, DOC y RTF. En unos segundos podrás descargar el resultado a tu ordenador.

FreeOCR

El resultado es aceptable, aunque peor que Google Docs. Algunos párrafos los omite por completo, aunque a cambio intenta generar un documento DOC manteniendo el formato original, cosa que no pasa en el anterior.

3. NewOCR

Otra alternativa es NewOCR, más sobrio y con algo más de publicidad, pero que en cierto modo va más al grano. Lo malo: extrae el texto sin formato.
newocr
Eso sí, en cuanto a los resultados, parece reconocer bastante mejor el resultado que Free Online OCR, y más o menos igual que Google Docs.

4. Free Online OCR

Free Online OCR tiene una versión gratuita y una de pago. La diferencia radica en una serie de limitaciones incluidas en la versión gratuita. Sólo puedes convertir 15 imágenes en una hora, el tamaño del archivo máximo es de 4 Mb, y no puedes subir varias imágenes en un ZIP.
Aún con eso, es válido y funcional. El proceso consta de dos partes, subir la imagen y después -tras introducir un CAPTCHA- iniciar el reconocimiento.
onlineocr
Después el resultado se mostrará como texto plano, aunque también lo puedes descargar en el formato que eligieras: DOC, XLS o TXT.
Sorprendentemente, el resultado es de los mejores, superando con creces a todos los anteriores. No sólo reconoce el texto perfectamente, sino que lo muestra en un archivo DOC respetando la maquetación original (si bien las imágenes aparecen en blanco y negro). Ideal si tu documento tiene tiene un diseño especial que vuelve locos a los demás.

5. Free OCR

Por último, Free OCR, un servicio algo estándar por el cual puedes obtener el texto de una imagen, sin formato. El resultado es normal tirando a malo, y con nuestro PDF de prueba -el mismo que funcionó en todos los servicios anteriores- no encontró nada.

Después de ponérselo más fácil con otra imagen, sí ha funcionado, aunque muestra bastante texto incomprensible y no reconoce bien caracteres no ingleses.
freeocrrrrr

¿No tienes conexión a Internet? Entonces prueba con esta pequeña utilidad para Windows: GT Text.

Uso de cookies

Este sitio web utiliza cookies para mejorar su experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies