Publicado el 17/09/2009 a las 5:29 am por Boxbyte

Prueba de Turing pública y automática para diferenciar máquinas y humanos
El día de ayer Google compró reCAPTCHA, un sistema desarrollado originalmente por la Universidad de Carnegie Mellon y que más tarde se convirtió en una compañía sólida encargada de proporcionar CAPTCHAS o bien letras cifradas que fueran difícilmente interpretadas por bots. De esta manera ayuda a proteger más de 100,000 sitios de spam y fraude, ¿Recuerdan el caso de Christopher Poole (aka moot ó la persona más influyente del mundo)?.
Pero la importancia de la empresa radica no solo en la implementación de un servicio Web gratuito para brindar CAPTCHAs en lenguajes de programación como PHP o plugins para Wordpress, sino en el método que utiliza para brindar esta imágenes que solo los humanos pueden interpretar y que al mismo tiempo ayuda a digitalizar textos.
Continuar Leyendo Google adquiere reCAPTCHA: Enseñando a leer a la máquina »
Publicado el 27/08/2009 a las 3:57 pm por Boxbyte

EPUB, el formato basado en tres estándares de código abierto (OPS, OPF y OCF) ahora será soportado por Google Books. Ya contaba con soporte PDF, pero ahora agregará el formato abierto con el que será más fácil visualizar texto e imágenes (que se ajustan a las pantallas pequeñas de cualquier dispositivo que lea libros electrónicos), sobre todo teniendo en cuenta que la mayoría de dispositivos (teléfonos, netbooks, lectores e-ink) no pueden leer imágenes basadas en versiones PDF.
Ahora más de 1 millón de libros de dominio público estarán disponibles para descargar bajo este formato en Google Books, claro que no es una tarea fácil ya que el proceso de digitalización implica el escaneo y reconocimiento de texto OCR para guardar la información dentro de archivos XML que se encuentran en el formato EPUB, contrario a solo tener la portada y el texto del libro.
Uno de los sitios que ya utilizaba este formato es ePubBook, con una gran cantidad de libros gratuitos en EPUB pero sin un proceso de digitalización de una copia física original, sino nacidos directamente en EPUB (Portada, texto, tabla de contenidos y algunas imágenes).
Este movimiento de Google ya se veía venir, después de que Sony anunció la adopción de este formato junto con la solución de Adobe Content Server 4 para proteger las copias de editores temerosos de la piratería (es decir soluciones DRM).
Continuar Leyendo Google Books empieza a ofrecer más de 1 millón de libros en formato EPUB »