<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>FayerWayer &#187; Books</title>
	<atom:link href="http://www.fayerwayer.com/tag/books/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.fayerwayer.com</link>
	<description>Dosis diarias de tecnología en español.™</description>
	<lastBuildDate>Tue, 14 Feb 2012 18:30:43 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Google adquiere reCAPTCHA: Enseñando a leer a la máquina</title>
		<link>http://www.fayerwayer.com/2009/09/google-adquiere-recaptcha-ensenando-a-leer-a-la-maquina/</link>
		<comments>http://www.fayerwayer.com/2009/09/google-adquiere-recaptcha-ensenando-a-leer-a-la-maquina/#comments</comments>
		<pubDate>Thu, 17 Sep 2009 09:29:59 +0000</pubDate>
		<dc:creator>Boxbyte</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Books]]></category>
		<category><![CDATA[Captcha]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[OCR]]></category>
		<category><![CDATA[reCAPTCHA]]></category>

		<guid isPermaLink="false">http://www.fayerwayer.com/?p=36347</guid>
		<description><![CDATA[El día de ayer Google compró reCAPTCHA, un sistema desarrollado originalmente por la Universidad de Carnegie Mellon y que más tarde se convirtió en una compañía sólida encargada de proporcionar CAPTCHAS o bien letras cifradas que fueran difícilmente interpretadas por [...]]]></description>
			<content:encoded><![CDATA[<div id="attachment_36348" class="wp-caption aligncenter" style="width: 580px"><img class="size-full wp-image-36348" title="dcvf9tks_13fp86ngd5_b" src="http://www.fayerwayer.com/up/2009/09/dcvf9tks_13fp86ngd5_b.jpg" alt="" width="570" height="89" /><p class="wp-caption-text">Prueba de Turing pública y automática para diferenciar máquinas y humanos</p></div>
<p>El <a href="http://googleblog.blogspot.com/2009/09/teaching-computers-to-read-google.html" target="_blank">día de ayer Google compró</a> <a href="http://recaptcha.net/learnmore.html" target="_blank"><strong>reCAPTCHA</strong></a>, un sistema desarrollado originalmente por la Universidad de Carnegie Mellon y que más tarde se convirtió en una compañía sólida encargada de proporcionar <a href="http://es.wikipedia.org/wiki/Captcha" target="_blank">CAPTCHAS</a> o bien letras cifradas que fueran difícilmente interpretadas por <a href="http://es.wikipedia.org/wiki/Bot" target="_blank"><em>bots</em></a>. De esta manera ayuda a proteger más de 100,000 sitios de spam y fraude, ¿<a href="http://www.fayerwayer.com/2009/04/la-persona-mas-influyente-del-mundo-segun-time-es-%C2%BFmoot/" target="_blank">Recuerdan el caso de Christopher Poole</a> (aka <em>moot </em>ó la persona más influyente del mundo)?.</p>
<p>Pero la importancia de la empresa radica no solo en la implementación de un <a href="http://recaptcha.net/whyrecaptcha.html" target="_blank">servicio Web gratuito</a> para brindar CAPTCHAs en lenguajes de programación como PHP o plugins para WordPress, sino en el método que utiliza para brindar esta imágenes que solo los humanos pueden interpretar y que al mismo tiempo ayuda a digitalizar textos.</p>
<p><span id="more-36347"></span>Dado a que lo textos digitalizados generalmente provienen de los archivos escaneados periódicos y libros antiguos, a los programas de OCR les resulta difícil reconocer estas palabras porque la tinta y el papel se han degradado a lo largo del tiempo, pero si estas se convierten en CAPTCHAs para resolverse por humanos se simplifica el proceso de reconocimiento.</p>
<div id="attachment_36349" class="wp-caption alignright" style="width: 324px"><img class="size-full wp-image-36349" title="recaptcha1jpg" src="http://www.fayerwayer.com/up/2009/09/recaptcha1jpg.gif" alt="" width="314" height="125" /><p class="wp-caption-text">Sistema reCAPTCHA</p></div>
<p>El texto escaneado es objeto de análisis por dos diferentes programas de <a href="http://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres" target="_blank">reconocimiento óptico de caracteres</a> (OCR), en los casos en que los programas no están de acuerdo la imagen/palabra en cuestión se convierte en un CAPTCHA. La palabra se muestra junto con una palabra de control ya conocida, entonces el sistema asume que si los humanos escriben la palabra de control correctamente, la palabra en cuestión también es correcta.</p>
<p>La identificación realizada por cada programa de OCR se le da un valor de 0.5 puntos y cada interpretación de un humano le da un punto completo, cuando la identificación alcanza 2.5 votos la palabra es considerada válida, al mismo tiempo que son recicladas constantemente como palabras de control.</p>
<p>Cerca de 200 millones de CAPTCHAs son resueltos por humanos alrededor del mundo cada día, es por eso que esta tecnología resulta muy valiosa para proyectos como <a href="http://books.google.com/" target="_blank">Google Books</a> y <a href="http://news.google.com/archivesearch" target="_blank">Google News Archive Search</a>.</p>
<p>Actualmente r<a href="http://en.wikipedia.org/wiki/ReCAPTCHA" target="_blank">eCAPTCHA</a> está digitalizando los archivos del <a href="http://es.wikipedia.org/wiki/The_New_York_Times" target="_blank"><em>New York Times</em></a>, Veinte años han sido digitalizados y el proyecto espera tener los 110 años efectuados en 2010.</p>
<p>Ahora &#8220;la maquina&#8221; de Google no solo almacenrá datos y conocerá tu perfíl como consumidor, sino que también aprenderá a leer con nuestra ayuda.<strong></strong></p>
<p><strong>Link:</strong> <a href="http://www.techcrunch.com/2009/09/16/google-acquires-recaptcha-to-power-scanning-for-google-books-and-google-news/" target="_blank">Scanning For Google Books And Google News</a><em> (TechCrunch / Gracias <a href="http://favilar.org/" target="_blank">Fernando</a>)</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.fayerwayer.com/2009/09/google-adquiere-recaptcha-ensenando-a-leer-a-la-maquina/feed/</wfw:commentRss>
		<slash:comments>33</slash:comments>
		</item>
		<item>
		<title>Google Books empieza a ofrecer más de 1 millón de libros en formato EPUB</title>
		<link>http://www.fayerwayer.com/2009/08/google-books-empieza-a-ofrecer-mas-de-1-millon-de-libros-en-formato-epub/</link>
		<comments>http://www.fayerwayer.com/2009/08/google-books-empieza-a-ofrecer-mas-de-1-millon-de-libros-en-formato-epub/#comments</comments>
		<pubDate>Thu, 27 Aug 2009 19:57:58 +0000</pubDate>
		<dc:creator>Boxbyte</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Amazon]]></category>
		<category><![CDATA[Books]]></category>
		<category><![CDATA[ebook]]></category>
		<category><![CDATA[EPUB]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Sony]]></category>

		<guid isPermaLink="false">http://www.fayerwayer.com/?p=34762</guid>
		<description><![CDATA[EPUB, el formato basado en tres estándares de código abierto (OPS, OPF y OCF) ahora será soportado por Google Books. Ya contaba con soporte PDF, pero ahora agregará el formato abierto con el que será más fácil visualizar texto e [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: center;"><a href="http://books.google.com/books?id=5twBAAAAQAAJ&amp;printsec=frontcover&amp;dq=frankenstein&amp;ei=QeSWSoSOGoWaMtLxjdUH&amp;hl=es#v=onepage&amp;q=&amp;f=false"><img class="aligncenter size-full wp-image-34767" title="googleepub" src="http://www.fayerwayer.com/up/2009/08/googleepub.jpg" alt="" width="570" height="190" /></a></p>
<p style="text-align: center;">
<p><a href="http://en.wikipedia.org/wiki/EPUB" target="_blank"><strong>EPUB</strong></a>, el formato basado en tres estándares de código abierto (OPS, OPF y OCF) <a href="http://booksearch.blogspot.com/2009/08/download-over-million-public-domain.html" target="_blank">ahora será soportado por</a> <a href="http://books.google.com/" target="_blank"><strong>Google Books</strong></a>. Ya contaba con soporte PDF, pero ahora agregará el formato abierto con el que será más fácil visualizar texto e imágenes (que se ajustan a las pantallas pequeñas de cualquier dispositivo que lea <a href="http://es.wikipedia.org/wiki/Libro-e" target="_blank">libros electrónicos</a>), sobre todo teniendo en cuenta que la mayoría de dispositivos (teléfonos, netbooks, lectores e-ink) no pueden leer imágenes basadas en versiones PDF.</p>
<p>Ahora más de <strong>1 millón de libros de dominio público</strong> estarán disponibles para descargar bajo este formato en Google Books, claro que no es una tarea fácil ya que el proceso de digitalización implica el <a href="http://www.fayerwayer.com/2009/08/presentan-un-nuevo-sistema-que-permite-escanear-mil-paginas-por-segundo/" target="_blank">escaneo</a> y reconocimiento de texto <a href="http://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres" target="_blank">OCR</a> para guardar la información dentro de archivos XML que se encuentran en el formato EPUB, contrario a solo tener la portada y el texto del libro.</p>
<p>Uno de los sitios que ya utilizaba este formato es <a href="http://www.epubbooks.com/" target="_blank">ePubBook</a>, con una gran cantidad de libros gratuitos en EPUB pero sin un proceso de digitalización de una copia física original, sino nacidos directamente en EPUB (Portada, texto, tabla de contenidos y algunas imágenes).</p>
<p>Este movimiento de <a href="http://www.fayerwayer.com/2009/06/google-quiere-entrar-al-mercado-de-los-libros-electronicos/" target="_blank">Google ya se veía venir</a>, después de que <a href="http://www.readwriteweb.com/archives/sony_adopts_open_but_still_drmed_format_for_ebooks.php" target="_blank">Sony anunció  la adopción de este formato junto con la solución de Adobe Content Server 4</a> para proteger las copias de editores temerosos de la piratería (es decir soluciones DRM).</p>
<p><a href="http://ebookstore.sony.com/" target="_blank"><span id="more-34762"></span>Sony</a> es actualmente el segundo competidor en el mercado de e-books después del Amazon con sus respectivos lectores (<a href="http://www.fayerwayer.com/2009/08/sony-reader-daily-edition-el-verdadero-competidor-del-kindle/" target="_blank">Sony Reader</a> y <a href="http://www.fayerwayer.com/2008/05/fwlabs-amazon-kindle-a-primera-vista/" target="_blank">Kindle</a>). Actualmente Kindle no soporta EPUB, ni tampoco completamente el formato PDF y posee su propio formato DRM restringido &#8220;AZW&#8221;.</p>
<p>La ventaja de EPUB es que sería compatible con <a href="http://www.fayerwayer.com/2009/08/futurologia-asus-y-msi-entraran-al-mercado-de-los-lectores-de-ebooks/" target="_blank">varios dispositivos</a>, abriendo la posibilidad a múltiples fuentes de contenido, claro que aún falta ver cómo termina el tema de la entrada de <a href="http://www.fayerwayer.com/2009/08/microsoft-yahoo-y-amazon-se-unen-contra-google-books/" target="_blank">Microsoft, Yahoo! y Amazon dentro de la <em>Open Content Alliance</em></a>. MIentras tanto los dejo con un intersante video sobre Google Books extraído del <span class="description">documental &#8220;El mundo según Google&#8221;.</span></p>
<p style="text-align: center;"><p><a href="http://www.fayerwayer.com/2009/08/google-books-empieza-a-ofrecer-mas-de-1-millon-de-libros-en-formato-epub/"><em>Click aqui para ver el video.</em></a></p></p>
<p><strong>Link</strong>: <a href="http://www.chw.net/2009/08/google-ofrece-un-millon-de-ebooks-epub/" target="_blank">Google ofrece un millón de eBooks EPUB</a> <em>(CHW)</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.fayerwayer.com/2009/08/google-books-empieza-a-ofrecer-mas-de-1-millon-de-libros-en-formato-epub/feed/</wfw:commentRss>
		<slash:comments>17</slash:comments>
		</item>
	</channel>
</rss>

