<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>FayerWayer &#187; OCR</title>
	<atom:link href="http://www.fayerwayer.com/tag/ocr/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.fayerwayer.com</link>
	<description>Dosis diarias de tecnología en español.™</description>
	<lastBuildDate>Tue, 14 Feb 2012 18:30:43 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>México: Se desarrolla una tecnología que permitirá acercar a los invidentes a Internet</title>
		<link>http://www.fayerwayer.com/2011/12/mexico-se-desarrolla-una-tecnologia-que-permitira-acercar-a-los-invidentes-a-internet/</link>
		<comments>http://www.fayerwayer.com/2011/12/mexico-se-desarrolla-una-tecnologia-que-permitira-acercar-a-los-invidentes-a-internet/#comments</comments>
		<pubDate>Tue, 27 Dec 2011 01:27:36 +0000</pubDate>
		<dc:creator>Jitten</dc:creator>
				<category><![CDATA[Hardware]]></category>
		<category><![CDATA[Ceguera]]></category>
		<category><![CDATA[Debilidad Visual]]></category>
		<category><![CDATA[discapacidad]]></category>
		<category><![CDATA[México]]></category>
		<category><![CDATA[OCR]]></category>
		<category><![CDATA[UNAM]]></category>

		<guid isPermaLink="false">http://www.fayerwayer.com/?p=560347</guid>
		<description><![CDATA[Fue desarrollada por el Ingeniero egresado de la Universidad de Cambridge Pablo Vidales, el cual busca acercar a los invidentes y débiles visuales para que utilicen una herramienta fundamental como Internet.]]></description>
			<content:encoded><![CDATA[<p>La brecha digital ha sido un problema constante para las personas que padecen una discapacidad física como la ceguera o la debilidad visual, por lo que el Ingeniero en Comunicación y Computación, Pablo Vidales buscó cambiar ese sombrío panorama. El dispositivo que desarrolló se llama <em>informA</em> y su función es convertir el texto en audio y viceversa.</p>
<p><em>informA</em> fue presentado durante el ciclo de conferencias &#8220;<a href="http://www.tic.unam.mx/conferencia_tic_inclusion.html">TIC para la inclusión. Tecnología, accesibilidad y sociedad</a>&#8221; realizado por la Universidad Nacional Autónoma de México (UNAM). Vidales mencionó algunas funciones de este dispositivo:</p>
<p><em>&#8220;La primera es que lee en voz alta los documentos impresos a través de la tecnología OCR (Reconocimiento Óptico de Caracteres): correos electrónicos y periódicos; además de brindar información del clima, fecha y hora exacta del lugar, fundamental para una persona que padece una discapacidad visual.&#8221;</em></p>
<p>La labor de la traducción del texto a audio, y viceversa, se realiza por medio de un servidor que sincroniza la información por medio del OCR y se accede mediante un teclado con menos de una decena de botones a manera de un árbol de niveles, pero se pretende que sea reemplazado con una perilla similar a la de los transmisores analógicos de radio. Esto permite que el usuario pueda elegir el tipo de servicio que va a consultar, por ejemplo, escuchar y responder un correo electrónico.</p>
<p>Vidales ha desarrollado <em>informA</em> desde el año 2008 y fue puesto a prueba en la ciudad alemana de Berlín, y se pretende que también sea probado y perfeccionado en México. Entre los planes a futuro es que esta tecnología se pueda ampliar a más servicios como el acceso a libros electrónicos, <em>podcast</em> e incluso sonorización del color.</p>
<p>Será una herramienta ideal para acercar a más personas a Internet, tanto en los ámbitos académicos como públicos, y así poder mejorar su calidad de vida, y ¿por qué no? convertirse en asiduos visitantes de <a href="http://www.fayerwayer.com/">FayerWayer</a>.</p>
<p><strong>Link:</strong> <a href="http://www.milenio.com/cdb/doc/noticias2011/4963ee1b44c72e0cdf2452a96f7f8cca">Internet para invidentes, programa que presenta ingeniero mexicano</a> <em>(Milenio)</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.fayerwayer.com/2011/12/mexico-se-desarrolla-una-tecnologia-que-permitira-acercar-a-los-invidentes-a-internet/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Google digitaliza 130.000 fotografías del Museo del Holocausto de Jerusalén</title>
		<link>http://www.fayerwayer.com/2011/01/google-digitaliza-130-000-fotografias-del-museo-del-holocausto-de-jerusalen/</link>
		<comments>http://www.fayerwayer.com/2011/01/google-digitaliza-130-000-fotografias-del-museo-del-holocausto-de-jerusalen/#comments</comments>
		<pubDate>Thu, 27 Jan 2011 21:00:04 +0000</pubDate>
		<dc:creator>ZooTV</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Política]]></category>
		<category><![CDATA[Fotografía]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Holocausto]]></category>
		<category><![CDATA[Museo]]></category>
		<category><![CDATA[OCR]]></category>
		<category><![CDATA[Yad Vashem]]></category>

		<guid isPermaLink="false">http://www.fayerwayer.com/?p=498482</guid>
		<description><![CDATA[En el marco de la conmemoración del Día Internacional de las Naciones Unidas del Recuerdo del Holocausto, el Museo del Holocausto de Jerusalén -conocido como Yad Vashem- publicó en Internet más de 130.000 fotografías en alta resolución y algunos testimonios [...]]]></description>
			<content:encoded><![CDATA[<div id="attachment_498712" class="wp-caption alignnone" style="width: 605px"><img class="size-large wp-image-498712" title="12631905547167012342" src="http://static.betazeta.com/www.fayerwayer.com/up/2011/01/12631905547167012342-595x367.jpg" alt="" width="595" height="367" /><p class="wp-caption-text">(c) Yad Vashem</p></div>
<p>En el marco de la conmemoración del <a href="http://www.un.org/es/holocaustremembrance/index.shtml" target="_blank">Día Internacional de las Naciones Unidas del Recuerdo del Holocausto</a>, el Museo del Holocausto de Jerusalén -conocido como <a href="http://es.wikipedia.org/wiki/Yad_Vashem" target="_blank">Yad Vashem</a>- publicó en Internet más de 130.000 fotografías en alta resolución y algunos testimonios de las víctimas del Holocausto.</p>
<p>Para lograr armar esta colección de imágenes <a href="http://www.fayerwayer.com/tag/google" target="_blank">Google</a> puso a disposición su tecnología de escaneo de imágenes y el uso de OCR (reconocimiento óptico de caracteres) con la finalidad de extraer y transcribir los textos presentes en las imágenes. De esta manera quienes visiten el sitio del museo podrán realizar diversas búsquedas de nombres o palabras, obteniendo como resultado una imagen relacionada con dicho término.</p>
<p><span id="more-498482"></span></p>
<p>Como un ejemplo de lo anterior Google describe que buscando las palabras <strong>“rena weiser”</strong>, se obtiene como resultado un enlace con el visado expedido a dicha persona en el Consulado de Chile en Francia.</p>
<p>Cada una de las fotografías que forman parte de esta colección se encuentra debidamente documentada con los nombres de las personas que aparecen en ellas, el año y el lugar donde fue registrada.</p>
<div class="gallery"><span class="link_all"><a href='http://www.fayerwayer.com/2011/01/google-digitaliza-130-000-fotografias-del-museo-del-holocausto-de-jerusalen/attachment/97856374117625996/' title='97856374117625996'>Ver Galería Completa <small>(9)</small> &raquo;</a></span><h4>Galería Fotográfica</h4><dl class="gallery-item">
                    <dt class="gallery-icon">
                        <a href='http://www.fayerwayer.com/2011/01/google-digitaliza-130-000-fotografias-del-museo-del-holocausto-de-jerusalen/attachment/97856374117625996/' title='97856374117625996'><img width="98" height="60" src="http://static.betazeta.com/www.fayerwayer.com/up/2011/01/97856374117625996.jpg" class="attachment-post-galeria" alt="97856374117625996" title="97856374117625996" /></a>
                    </dt>
                </dl><dl class="gallery-item">
                    <dt class="gallery-icon">
                        <a href='http://www.fayerwayer.com/2011/01/google-digitaliza-130-000-fotografias-del-museo-del-holocausto-de-jerusalen/attachment/10009680349283026927/' title='10009680349283026927'><img width="96" height="98" src="http://static.betazeta.com/www.fayerwayer.com/up/2011/01/10009680349283026927.jpg" class="attachment-post-galeria" alt="10009680349283026927" title="10009680349283026927" /></a>
                    </dt>
                </dl><dl class="gallery-item">
                    <dt class="gallery-icon">
                        <a href='http://www.fayerwayer.com/2011/01/google-digitaliza-130-000-fotografias-del-museo-del-holocausto-de-jerusalen/attachment/12196331926768813954/' title='12196331926768813954'><img width="98" height="60" src="http://static.betazeta.com/www.fayerwayer.com/up/2011/01/12196331926768813954.jpg" class="attachment-post-galeria" alt="12196331926768813954" title="12196331926768813954" /></a>
                    </dt>
                </dl><dl class="gallery-item">
                    <dt class="gallery-icon">
                        <a href='http://www.fayerwayer.com/2011/01/google-digitaliza-130-000-fotografias-del-museo-del-holocausto-de-jerusalen/attachment/12631905547167012342/' title='12631905547167012342'><img width="98" height="60" src="http://static.betazeta.com/www.fayerwayer.com/up/2011/01/12631905547167012342.jpg" class="attachment-post-galeria" alt="(c) Yad Vashem" title="12631905547167012342" /></a>
                    </dt>
                </dl><dl class="gallery-item">
                    <dt class="gallery-icon">
                        <a href='http://www.fayerwayer.com/2011/01/google-digitaliza-130-000-fotografias-del-museo-del-holocausto-de-jerusalen/attachment/12725528839853631619/' title='12725528839853631619'><img width="98" height="74" src="http://static.betazeta.com/www.fayerwayer.com/up/2011/01/12725528839853631619.jpg" class="attachment-post-galeria" alt="12725528839853631619" title="12725528839853631619" /></a>
                    </dt>
                </dl><dl class="gallery-item">
                    <dt class="gallery-icon">
                        <a href='http://www.fayerwayer.com/2011/01/google-digitaliza-130-000-fotografias-del-museo-del-holocausto-de-jerusalen/attachment/16507427481513536184/' title='16507427481513536184'><img width="63" height="98" src="http://static.betazeta.com/www.fayerwayer.com/up/2011/01/16507427481513536184.jpg" class="attachment-post-galeria" alt="16507427481513536184" title="16507427481513536184" /></a>
                    </dt>
                </dl></div>
<p><strong>Link:</strong> <a href="http://www.yadvashem.org/" target="_blank">Yad Vashem</a> <em>(Vía <a href="http://googleblog.blogspot.com/2011/01/explore-yad-vashems-holocaust-archives.html" target="_blank">The Official Google Blog</a>)</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.fayerwayer.com/2011/01/google-digitaliza-130-000-fotografias-del-museo-del-holocausto-de-jerusalen/feed/</wfw:commentRss>
		<slash:comments>73</slash:comments>
		</item>
		<item>
		<title>Google Docs con reconocimiento de texto en documentos PDF e imágenes</title>
		<link>http://www.fayerwayer.com/2010/06/google-docs-con-reconocimiento-de-texto-en-documentos-pdf-e-imagenes/</link>
		<comments>http://www.fayerwayer.com/2010/06/google-docs-con-reconocimiento-de-texto-en-documentos-pdf-e-imagenes/#comments</comments>
		<pubDate>Tue, 22 Jun 2010 15:45:18 +0000</pubDate>
		<dc:creator>Boxbyte</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Minipost]]></category>
		<category><![CDATA[Google Docs]]></category>
		<category><![CDATA[Imágenes]]></category>
		<category><![CDATA[OCR]]></category>
		<category><![CDATA[PDF]]></category>

		<guid isPermaLink="false">http://www.fayerwayer.com/?p=115511</guid>
		<description><![CDATA[Google Docs agrega una característica para el reconocimiento de texto, que convierte archivos PDF o imágenes en texto plano editable. Esta opción OCR (Reconocimiento óptico de caracteres) fue lanzada hace un año como un experimento, pero al parecer Google ha [...]]]></description>
			<content:encoded><![CDATA[<p><strong><img class="alignright size-full wp-image-115541" src="http://www.fayerwayer.com/up/2010/06/12818.gif" alt="12818" width="144" height="144" />Google Docs</strong> agrega una característica para el reconocimiento de texto, que convierte archivos PDF o imágenes en texto plano editable. Esta opción <strong><a href="http://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres" target="_blank">OCR</a></strong> (Reconocimiento óptico de caracteres) fue lanzada hace un año como un experimento, pero al parecer Google ha tenido el suficiente tiempo para mejorar la exactitud de los resultados.</p>
<p>Para utilizar esta opción, basta con marcar la casilla de  &#8220;Convertir el texto de archivos de imagen o PDF a documentos de Google Docs&#8221; cuando se está cargando un archivo. El archivo se muestra en Google Docs como un documento de texto en lugar de su formato original, así que si quieres subir una imagen, tendrás que subirla desmarcando la casilla.</p>
<p>Según Google, en algunos casos un 90% del texto es convertido correctamente, aunque parece tener problemas cuando se trata de dos columnas. Sin embargo, creo que este servicio resultaría más interesante si se combina con <a href="http://www.fayerwayer.com/2009/09/google-adquiere-recaptcha-ensenando-a-leer-a-la-maquina/" target="_blank">reCAPTCHA</a>, aunque para ello tardara un par de días en su conversión.</p>
<p><img class="aligncenter size-full wp-image-115531" src="http://www.fayerwayer.com/up/2010/06/googledocsocr.jpg" alt="googledocsocr" width="570" height="158" /><strong>Link:</strong><em> </em><a href="http://googlesystem.blogspot.com/2010/06/google-adds-ocr-for-pdf-files-and.html" target="_blank">Google Adds OCR for PDF Files and Images</a><em> </em><em>(Google Operating System)</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.fayerwayer.com/2010/06/google-docs-con-reconocimiento-de-texto-en-documentos-pdf-e-imagenes/feed/</wfw:commentRss>
		<slash:comments>16</slash:comments>
		</item>
		<item>
		<title>Google adquiere reCAPTCHA: Enseñando a leer a la máquina</title>
		<link>http://www.fayerwayer.com/2009/09/google-adquiere-recaptcha-ensenando-a-leer-a-la-maquina/</link>
		<comments>http://www.fayerwayer.com/2009/09/google-adquiere-recaptcha-ensenando-a-leer-a-la-maquina/#comments</comments>
		<pubDate>Thu, 17 Sep 2009 09:29:59 +0000</pubDate>
		<dc:creator>Boxbyte</dc:creator>
				<category><![CDATA[Internet]]></category>
		<category><![CDATA[Software]]></category>
		<category><![CDATA[Books]]></category>
		<category><![CDATA[Captcha]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[OCR]]></category>
		<category><![CDATA[reCAPTCHA]]></category>

		<guid isPermaLink="false">http://www.fayerwayer.com/?p=36347</guid>
		<description><![CDATA[El día de ayer Google compró reCAPTCHA, un sistema desarrollado originalmente por la Universidad de Carnegie Mellon y que más tarde se convirtió en una compañía sólida encargada de proporcionar CAPTCHAS o bien letras cifradas que fueran difícilmente interpretadas por [...]]]></description>
			<content:encoded><![CDATA[<div id="attachment_36348" class="wp-caption aligncenter" style="width: 580px"><img class="size-full wp-image-36348" title="dcvf9tks_13fp86ngd5_b" src="http://www.fayerwayer.com/up/2009/09/dcvf9tks_13fp86ngd5_b.jpg" alt="" width="570" height="89" /><p class="wp-caption-text">Prueba de Turing pública y automática para diferenciar máquinas y humanos</p></div>
<p>El <a href="http://googleblog.blogspot.com/2009/09/teaching-computers-to-read-google.html" target="_blank">día de ayer Google compró</a> <a href="http://recaptcha.net/learnmore.html" target="_blank"><strong>reCAPTCHA</strong></a>, un sistema desarrollado originalmente por la Universidad de Carnegie Mellon y que más tarde se convirtió en una compañía sólida encargada de proporcionar <a href="http://es.wikipedia.org/wiki/Captcha" target="_blank">CAPTCHAS</a> o bien letras cifradas que fueran difícilmente interpretadas por <a href="http://es.wikipedia.org/wiki/Bot" target="_blank"><em>bots</em></a>. De esta manera ayuda a proteger más de 100,000 sitios de spam y fraude, ¿<a href="http://www.fayerwayer.com/2009/04/la-persona-mas-influyente-del-mundo-segun-time-es-%C2%BFmoot/" target="_blank">Recuerdan el caso de Christopher Poole</a> (aka <em>moot </em>ó la persona más influyente del mundo)?.</p>
<p>Pero la importancia de la empresa radica no solo en la implementación de un <a href="http://recaptcha.net/whyrecaptcha.html" target="_blank">servicio Web gratuito</a> para brindar CAPTCHAs en lenguajes de programación como PHP o plugins para WordPress, sino en el método que utiliza para brindar esta imágenes que solo los humanos pueden interpretar y que al mismo tiempo ayuda a digitalizar textos.</p>
<p><span id="more-36347"></span>Dado a que lo textos digitalizados generalmente provienen de los archivos escaneados periódicos y libros antiguos, a los programas de OCR les resulta difícil reconocer estas palabras porque la tinta y el papel se han degradado a lo largo del tiempo, pero si estas se convierten en CAPTCHAs para resolverse por humanos se simplifica el proceso de reconocimiento.</p>
<div id="attachment_36349" class="wp-caption alignright" style="width: 324px"><img class="size-full wp-image-36349" title="recaptcha1jpg" src="http://www.fayerwayer.com/up/2009/09/recaptcha1jpg.gif" alt="" width="314" height="125" /><p class="wp-caption-text">Sistema reCAPTCHA</p></div>
<p>El texto escaneado es objeto de análisis por dos diferentes programas de <a href="http://es.wikipedia.org/wiki/Reconocimiento_%C3%B3ptico_de_caracteres" target="_blank">reconocimiento óptico de caracteres</a> (OCR), en los casos en que los programas no están de acuerdo la imagen/palabra en cuestión se convierte en un CAPTCHA. La palabra se muestra junto con una palabra de control ya conocida, entonces el sistema asume que si los humanos escriben la palabra de control correctamente, la palabra en cuestión también es correcta.</p>
<p>La identificación realizada por cada programa de OCR se le da un valor de 0.5 puntos y cada interpretación de un humano le da un punto completo, cuando la identificación alcanza 2.5 votos la palabra es considerada válida, al mismo tiempo que son recicladas constantemente como palabras de control.</p>
<p>Cerca de 200 millones de CAPTCHAs son resueltos por humanos alrededor del mundo cada día, es por eso que esta tecnología resulta muy valiosa para proyectos como <a href="http://books.google.com/" target="_blank">Google Books</a> y <a href="http://news.google.com/archivesearch" target="_blank">Google News Archive Search</a>.</p>
<p>Actualmente r<a href="http://en.wikipedia.org/wiki/ReCAPTCHA" target="_blank">eCAPTCHA</a> está digitalizando los archivos del <a href="http://es.wikipedia.org/wiki/The_New_York_Times" target="_blank"><em>New York Times</em></a>, Veinte años han sido digitalizados y el proyecto espera tener los 110 años efectuados en 2010.</p>
<p>Ahora &#8220;la maquina&#8221; de Google no solo almacenrá datos y conocerá tu perfíl como consumidor, sino que también aprenderá a leer con nuestra ayuda.<strong></strong></p>
<p><strong>Link:</strong> <a href="http://www.techcrunch.com/2009/09/16/google-acquires-recaptcha-to-power-scanning-for-google-books-and-google-news/" target="_blank">Scanning For Google Books And Google News</a><em> (TechCrunch / Gracias <a href="http://favilar.org/" target="_blank">Fernando</a>)</em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.fayerwayer.com/2009/09/google-adquiere-recaptcha-ensenando-a-leer-a-la-maquina/feed/</wfw:commentRss>
		<slash:comments>33</slash:comments>
		</item>
	</channel>
</rss>

