Investigadores desarrollan un algoritmo para determinar si un tuiteo es mentira
(cc) Juampe López
Cuando ocurre un desastre natural o una tragedia, nunca falta gente que se dedica a inventar información y subirla a Internet, quizás con el ánimo de ser chistosos, o simplemente para divertirse confundiendo a la gente. Así para el huracán Sandy aparecieron fotos de gente buceando en las estaciones de metro o tiburones en la ciudad, o para el terremoto de 2010 en Chile salieron personas diciendo que Ricardo Arjona había muerto o que el Huáscar había desaparecido de Talcahuano.
Los investigadores Carlos Castillo (Qatar Research Institute), Marcelo Mendoza (Universidad Técnica Federico Santa), y Bárbara Poblete (Departamento de Ciencias de la Computación de la Universidad de Chile) escribieron en 2010 en paper [PDF] analizando los tuiteos emitidos tras el terremoto de 8,8 grados de magnitud, llegando a varias conclusiones que ahora aplicaron en un algoritmo.
Este “detector automático de eventos” usa 16 características para determinar la credibilidad de tuits noticiosos, y será publicado en la revista Internet Research el próximo mes.
“Nuestros datos muestran que es posible separar eventos que corresponden a noticias confirmadas de aquellos que en realidad son rumores”, explicó a FayerWayer Marcelo Mendoza, doctor en Ciencias de la Computación de la Universidad de Chile y académico de la UTFSM. “Twitter registra volúmenes muy significativos de tweets que no tienen valor informativo. Sin embargo, nuestro algoritmo puede detectar tweets informativos y extraer información relevante desde ellos”.
Entre las conclusiones de 2010, los investigadores determinaron que los rumores falsos tenían una alta probabilidad de ser tuiteados junto a un signo de interrogación, o una indicación de duda o negación. También concluyeron que los tuits verdaderos tienden a ser más largos e incluir URLs, que las personas que tuitean cosas verdaderas suelen tener más seguidores, y que los mensajes que son ciertos suelen ser más negativos que positivos en el tono en que están escritos. Además, los tuiteos verdaderos no suelen incluir signos de interrogación, exclamación o pronombres en primera o tercera persona.
El nuevo algoritmo desarrollado por Castillo, Mendoza y Poblete funciona bastante bien, logrando clasificar como “verdaderos” a los tuiteos verdaderos un 86% de las veces.
“El algoritmo realiza análisis agregado, es decir, caracteriza “grupos” de tweets (no tweets aislados). La fortaleza radica principalmente en la caracterización de eventos a partir de grandes volúmenes”, dice Mendoza. “Más tweets permiten mejores estimaciones”.
Por supuesto, no es un sistema perfecto y quizás una persona entrenada en el uso de redes sociales podría obtener un mejor resultado intentando determinar la veracidad de un mensaje. De todos modos, un algoritmo funciona muchísimo más rápido que una persona, y podría servir como un “primer filtro” para marcar los tuiteos dudosos.
De acuerdo al trabajo que saldrá publicado, “antes de que una noticia se transforme en trending topic es posible estimar la credibilidad de ella. Nosotros aplicamos nuestro algoritmo a los tweets del terremoto del 27-F mostrando que era posible validar las alarmas del tsunami antes de que éstas llegaran a Juan Fernández. Con un tráfico adecuado, la validación de la credibilidad de un evento puede realizarse durante los primeros 15 a 20 minutos transcurridos desde el primer tweet relacionado con el evento”, afirma Mendoza.
Quizás podría ahorrarnos algo de confusión entre los usuarios de la red social, aunque siempre habrá gente ingeniosa que intentará engañar al resto.
Link: Social media hoaxes: Could machine learning debunk false Twitter rumors before they spread? (Slate)
Lo mejor de Google I/O 2013 #IO13
Yahoo! y Facebook enfrentadas para adquirir Tumblr
Bill Gates supera a Carlos Slim como el hombre ...
Larry Page y la polémica que despertó contra Mi...
El nuevo Google Maps a primera vista
Google Glass a primera vista
Todo lo que vimos en la primera jornada del eve...
Larry Page: "Estamos sólo en el 1% de lo que po...
27 Comentarios
Investigadores desarrollan un algoritmo para determinar si un tuiteo es mentira
Mira que interesante ah.
ResponderEs cierto, lo desarrollaron entre TODOS los chilenos, pero no funciona. Que amarillista el articulo.
ResponderDe acuerdo contigo, menos con lo de amarillista, primero busca que significa estimado. por lo demas super de acuerdo contigo.
Prensa amarilla o prensa amarillista es aquel tipo de prensa sensacionalista que incluye titulares de catástrofes y gran número de fotografías con información detallada acerca de accidentes, crímenes, adulterios y enredos políticos.
http://www.fayerwayer.com/2012/12/trabajadores-de-foxconn-desean-poder-hacer-mas-horas-extra/
y luego uno pq te pone negativos, como dijeron por ahi tenia que ser el denis del 8, Negativazo desde tiempo inmemorables
Me saco el sombrero por este avance tan revolucionario y el aporte que esto significa para el progreso de nuestra humanidad!!
Responderdef(4chan_joke):
Responderif 4chan = True:
tweet = False.
ese pedazo de codigo parece Python o Ruby. para la proxima vez opina mejor, no son arcaicos. si quieres llamar arcaico a algo llamale a cobol, a, b, lisp, etc.
Efectivamente es Python, que me he tomado como hobby hace 3 semanas aprenderlo.
que bakan, me alegro harto por su logro
Responderun 86% si bien es alto, igual da falso positivos de un 14% eso aplicado a un 1 millon de tuits no es poco, pero si quieres clasificar grandes volumenes de tuits y promocionarlos automaticamente, clasificarlos, o usar herramientas para periodistas no esta nada de mal.
ojala que sigan creciendo estos tipos, merecen aplausos y es el tipo de cosas que mas se necesitan hoy en dia, capos los tipos
Yo creo que este artículo es un hoax
Responder:B
Eso le falto a Sagredo!
ResponderY si el Tweet es mentira, Pilar Sordo vendrá a "ayudarte" e "investigará" porque mientes jajajajaja gran fail esta noticia.
Responderque pasara cuando un mensaje falso y bien elaborado cumpla el patron de uno verdadero o viceversa, ellos mismos lo dicen:
Responder"los rumores falsos tenían una alta probabilidad de ser tuiteados junto a un signo de interrogación, o una indicación de duda o negación...los tuits verdaderos tienden a ser más largos e incluir URLs...las personas que tuitean cosas verdaderas suelen tener más seguidores...los mensajes que son ciertos suelen ser más negativos que positivos en el tono en que están escritos...los tuiteos verdaderos no suelen incluir signos de interrogación, exclamación o pronombres en primera o tercera persona."
en fin, solo son probabilidades y NO se porque el titulo dice "...un algoritmo para DETERMINAR..." debería ser "...para ESTIMAR..."
otro sitio de noticias copy paste ?
no gracias xD
Se me ocurrio algo parecido, se podria buscar tweets referente a un evento y haciendo un parseo buscarlos en Internet y mediante un algoritmo analizar la noticia.
ResponderNo estaria mal aplicarlo solo para probar, si el algoritmo que usan ellos no busca en Internet se le tendrian que dar una seria de patrones muy grandes, y es un problema y tiempo perdido.
Saludos.
Fui a una charla que dio Bárbara Poblete (Departamento de Ciencias de la Computación de la Universidad de Chile) en la FCFM de la UCHILE hace varios meses donde hablo un poco de esta investigacion y menciono que otro factor importante era la velocidad con que se transmitia la noticia :)
ResponderSe podría decir que detecta ironías tb?
Respondery si scribn asi abrviado xq no ls alknzan los 140 caractrs? Cómo lo sabrán?
ResponderSi bien se basa en algunas características propias de un hoax, es una excelente herramienta. además un twitter puede ser desmentido si uno puede leer atentamente el contexto del contenido del tweet. por lo general van siempre acompañados por un (?) o hay inconsistencias en cuanto a lo que se dice.
Respondera modo de ejemplo, se dijo por twitter que whatsapp iba a ser de prepago, pero si reenviabas "este mensaje" a 10 personas y pruebas que eres un usuario frecuente, se mantendrá gratuito. en la práctica la misma gente de whatsapp desmintió esta información y se la atribuyó a un twitero llamado hoaxslayer.
Deja tu Comentario