Google Docs con reconocimiento de texto en documentos PDF e imágenes

Google Docs con reconocimiento de texto en documentos PDF e imágenes

por

Google Docs agrega una característica para el reconocimiento de texto, que convierte archivos PDF o imágenes en texto plano editable. Esta opción OCR (Reconocimiento óptico de caracteres) fue lanzada hace un año como un experimento, pero al parecer Google ha tenido el suficiente tiempo para mejorar la exactitud de los resultados.

Para utilizar esta opción, basta con marcar la casilla de  “Convertir el texto de archivos de imagen o PDF a documentos de Google Docs” cuando se está cargando un archivo. El archivo se muestra en Google Docs como un documento de texto en lugar de su formato original, así que si quieres subir una imagen, tendrás que subirla desmarcando la casilla.

Según Google, en algunos casos un 90% del texto es convertido correctamente, aunque parece tener problemas cuando se trata de dos columnas. Sin embargo, creo que este servicio resultaría más interesante si se combina con reCAPTCHA, aunque para ello tardara un par de días en su conversión.

Link: Google Adds OCR for PDF Files and Images (Google Operating System)