Posts Tagged ‘semantica’

¿Google se está abriendo algo a la web semántica?

dolors reig | January 7th, 2009 | No Comments »

Resultaba extraño que después de la adquisición de Powerset por parte de Microsoft, y a pesar de las múltiples manifestaciones de desconfianza hacia esa nueva forma de entender y codificar la web, Google se auto situara al margen de la evolución.

Fue una de las preguntas y reflexiones más interesantes de las que surgieron durante el último taller sobre web semántica que realicé:

-¿Y Google no está incorporando algoritmos semánticos? Mi respuesta se ve confirmada por lo datos que nos reportan hoy desde RWW. Quizás no de forma manifiesta pero difícilmente no existan en Google experimentos ni equipos de trabajo trabajando al respecto, digan lo que digan en comunicados oficiales.

Así, parece que los ejemplos comparativos que utilizábamos al comparar la vieja y la “nueva” forma de entender la web, la web semántica, van a dejar de sernos útiles: Desde hace poco, las búsquedas sobre fechas de nacimiento, conexiones familiares y otros tipos de información relacionada obtienen resultados en información estructrurada de forma explícitamente semántica. Preguntas como Who is Bill Clinton’s wife? What’s the capital city of France? obtienen resultados en forma de sujeto-predicado-objeto, o “tripletes” en términos semánticos.

Y las respuestas no están estructuradas de ese modo en las páginas de las que provienen. Parece, más bien, que Google crea estructura semántica desde datos semiestructurados o no estructurados (no marcados semánticamente) en absoluto. Dicho de otro modo, los resultados no son sólo de Freebase o Wikipedia, que los presentan estructrados, sinó de otros sitios que no trabajan con “tripletes” (sujeto-predicado-objeto, lenguaje RDF)

what-is-the-city-capital-of-france-buscar-con-google_1231356042557

Parece que los resultados son similares a los que devolvía hace unos tres años un viejo programa de Google, Direct Answers, aunque sus resultados eran mucho menos precisos.

No está claro que Google esté creando datos estructurados en páginas que no los contenían. Sería un error concluir en que se están realizando análisis semánticos sólo porque algunos de los resultados reportados aparecen en la forma sujeto-predicado-objeto (base del lenguaje semántico RDF), pero está claro que aparecen, son extraídos de páginas que a priori no siempre los contienen.

A la espera de tener más información, deciros que no llega a la precisión de Yahoo, que lleva tiempo trabajando con algoritmos semánticos. Además, el hecho de que Google no aporte datos RDF sobre las páginas, resta utilidad a la supuesta mejora en términos de su posible aprovechamiento por parte de terceras aplicaciones.

No es fácil la creación de datos estructurados a partir de cero, a pesar de que supondría una base común que permitiría innovar en mayor medida que la web común actual.

Terminar este artículo planteando un posible escenario. ¿Y si Microsoft adquiriera finalmente a Yahoo? La tecnología de Powerset y la de Yahoo juntas, por no hablar de la potencia de la imagen de una unión de marcas como esa….¿No sería quizás entonces el tema semántico un posible valor diferencial lo suficientemente fuerte como para resultar competencia para quien parece estar decidiendo a espaldas de estándares y del interés común la web del futuro?

Me gustaría dejaros algunas reflexiones más, derivadas de la discusión surgida entorno a este dato:  resulta extraño, de entrada, que una compañía que se auto define como abierta y transparente no responda claramente sobre este tipo de cuestiones. Es posible, como argumentan algunos, que Google esté experimentando cosas de forma contínua, llevando a cabo unos 50 a 200 experimentos a la vez, lo cual explicaría la “¿imposibilidad?” de hablar públicamente de todos ellos.

En fin… os mantendré informados.

Relacionados:



Videotutorial Práctico Twine (2), familiarización con la interface

dolors reig | July 10th, 2008 | 9 Comments »

Iniciamos ayer una serie de videotutoriales para entender y aprender a manejar Twine, la red social o red de intereses de la web semántica.

Os dejo hoy su segunda parte, la familiarización con su interface. Próximamente crearé un tercero sobre su evolución futura, coincidiendo, posiblemente con su salida de la fase beta que se producirá en octubre, aproximadamente.

Para su contextualización teórica os recomiendo el primer videotutorial.

Tenéis en este enlace una explicación por escrito de la herramienta, así como un pdf descargable en este.

Si ya sois usuarios de Twine podéis consultar el Ovillo creado al respecto: Videotutoriales Twine en español.



Sí…también hay juegos para la web inteligente-semántica ;)

dolors reig | May 23rd, 2008 | 5 Comments »

Se trata de un nueva línea de juegos útiles. Ideados por la Carnegie Mellon’s School of Computer Science que van más allá del mero entretenimiento. Están destinados a proveer datos reales, ajustar los algoritmos de la inteligencia artificial con el ambicioso objetivo de hacer más inteligente la web (últimamente, “web inteligente” es el término que va gestándose y proponiéndose en eventos tan importantes como el SemTech 2008 conference, como estrategia de márketing para la popularización de la web semántica).

La verdad es que he estado probándolos y en algunos casos creo que, incluso sin tener demasiados conocimientos de inglés, pueden ser entretenidos. Como herramienta de aprendizaje del idioma y a pesar de quizás estemos perjudicando su intención original (que lo dudo….seguro que contienen las típicas pruebas de fiabilidad y consistencia que invalidan los tests demasiado erróneos o azarosos), creo que tienen también su utilidad.

Además, si os habéis preguntado en algún momento si vuestos gustos coinciden con los de la mayoría de la población, si vuestro sentido común es más o menos compartido por el resto de la humanidad (internáutica, claro está), también podréis poneros a prueba valorando lo común de vuestros criterios estéticoso, las palabras derivadas de vuestros brainstorming o vuestra capacidad descriptiva o adivinatoria a partir de términos concretos.

No sé vosotros pero a mi hija, tan aficionada hace unos años (a los 7 u ocho, creo…) a preguntar constantemente ¿Qué te gusta más, esto o lo de más allá? creo que el juego en el que valoramos junto a otro participante díadas de imágenes y puntuamos según el grado de acuerdo, creo que le gustará.

La imagen enlaza ya a la aplicación, pero por si acaso, ahí va otro enlace: Gwap

Video: Oh my god, Dios está en todas partes.

dolors reig | May 16th, 2008 | 1 Comment »

Oh My God – A Film by Peter Rodger
Dirigido por Peter Rodger, la música es de Alexander van Bubenheim. Rodado en 22 países, Oh My God explora las distintas ideas y perspectivas acerca de Dios alrededor del mundo. El video es el trailer de la película, sobre la cual podéis consultar más detalles en www.omgmovie.com

Zemanta Pixie

La moda de lo semántico. ¿Qué significa semántico? ¿Qué forma parte de la web semántica?

dolors reig | May 15th, 2008 | 4 Comments »

Nova Spivack, Radar NetworksImage by dfarber via Flickr Leemos titulares, en ocasiones, ambiciosos con respecto a la llegada de determinadas herramientas de la web semántica. Un comentario a la última entrada sobre Twine expresaba ayer ciertas dudas sobre mi definición de la herramienta como la “Primera red social que utiliza tecnologías semánticas”.

Gracias al reciente Planeta Semántico de artículos en español sobre el tema descubro hoy la aclaración de Nova Spivack, CEO de Radar Networks, la compañía responsable de Twine, al respecto de la diferencia entre “semántico” y “web semántica”, en un breve post en el que clarifica acertadamente el significado del término. Traduzco su aclaraciones:

“Está de moda hoy etiquetar cada nueva aplicación como “semántica” pero, qué significa realmente eso? ¿Son todas las herramientas semánticas parte de la web semántica? ¿Cual es el criterio para que algo sea considerado semántico? ¿Significa que algo sea semántico que forma parte de la web semántica?
Se trata de algo realmente simple. Cualquier aplicación que puede entender el lenguaje hasta cierto punto puede ser etiquetada como semántica. Incluso Google es, en cierta medida, una aplicación semántica bajo esos criterios. Es una cuestión de grado: Powerset (aclaro que es la tecnología de buscador que acaba de incorporar wikipedia) es más semántico que Google, por ejemplo, porque entiende en mayor medida el lenguaje natural y no sólo en el sentido de palabras clave.

Para que cualquier aplicación pueda ser considerada parte de la “Web semántica” debe soportar una serie de estándares definidos por el W3C, incluyendo por lo menos el lenguaje de marcado RDF, y de forma potencial, también OWL y SPARQL. Estas son tecnologías que de forma colectiva componen la web semántica. Soportarlas o hacerse compatibles con ellas significa, por lo menos, hacer algunos datos visibles a aplicaciones externas.

No estoy seguro de si Powerset lo está haciendo ya. Tampoco de Freebase. Pero deberían (y creo que lo harán). Twine sí está usando RDF y OWL de forma interna, a pesar de que está en fase beta y sólo algunos participantes pueden acceder a los datos. Otras compañías, como el propio Digg están haciendo sus datos RDF públicos.

Cualquier aplicación que publique datos RDF puede considerase semántica además de parte de la web semántica.

Tejido social de ovillos semánticos: Twine.

dolors reig | May 12th, 2008 | 28 Comments »

Each line is drawn between two nodes, representing two IP addresses. This is a small look at the backbone of the Internet.Image via Wikipedia

Podríamos decir que Twine, como la primera herramienta social de la web semántica, es diferente del resto (Facebook, Tuenti, Hi5, etc…).

No personaliza cada contenido que compartimos para que solo pueda ser accesible, mediante registro, dentro de sí misma, sino que convierte-traduce, aplica marcadores sintácticos a nuestras aportaciones, adaptándolas a los lenguajes mayoritarios de la denominada web semántica. (Me gusta pensar la web semántica como el esperanto de la red, que hace comprensibles los contenidos, independientemente de su posición en Google o la plataforma en que estén construídos)

Existen varios modelos de red social, que podríamos definir en base a su carácter más o menos “semántico”. Así, ordenadas según su valor como fuentes de contenido, podríamos clasificar las redes sociales, la multitud de marcas comerciales surgidas de la web2.0 como:

“Estilo Facebook”: A pesar de que, según su planteamiento inicial conecta personas en base a interacciones previas en la vida real. es una herramienta multifuncional, con tantas posibilidades como queramos según los desarrollos que permiten sus apis abiertas.

“Estilo Twitter”: Conecta personas en base a temáticas y concurrencias en el tiempo. Su potencial como herramienta de comunicación creo que desborda su carácter social o como marcador social ocasional.

“Estilo Ning o los propios blogs”: Conecta personas en base a intereses (contenidos) y de forma secundaria en base a lo social. Su principal función es la de crear comunidades, ofreciendo una versatilidad total en cuanto a contenidos.

Estilo Diigo, Del.icio.us o Twine”: Conectan intereses. Aunque de forma variable (en el caso de Diigo es una buena herramienta, también, para formar comunidades), su principal función es el marcado social, la recomendación, la búsqueda de consensos sobre contenidos diversos..

El contenido, la forma de organizarlo, la encontrabilidad, mediante códigos y relaciones entre nodos de información son los protagonistas de la web semántica. Así, Twine es una herramienta de nueva generación, híbrida, de tránsito entre lo que ha demostrado ser más útil o rescatable de lo social(2.0) y lo más prometedor de la web 3.0 (semántico).

O dicho de otro modo: Si Facebook y el resto de las redes mayoritarias han sido criticadas por el sinsentido final de la conexiones e interacciones que establecen (el “para qué” de las redes sociales”) la esencia de Twine es precisamente que aporta el esperado significado a lo social.

grafosocial.jpg

Twine está actualmente en fase beta, con unos 30.000 usuarios, una beta que he podido comprobar que hace honor a sus objetivos de mejora colaborativa de la herramienta. Son los cordeles de información relativa al uso, sugerencias y mejoras de Twine (un paso más allá de foros de soporte) los primeros “cordeles”a los que somos invitados. Veámos, después de aproximadamente un mes de uso, cómo es su funcionamiento:

Las relaciones sociales se establecen de forma similar en Facebook, Twitter, Tuenti, Diigo, Pownce y el mismo Twine: invitar, aceptar invitaciones, concretar y descubrir perfiles, etc…de personas con las cuales compartir distintos contenidos. La diferencia es que en este caso, son “Twines” o lo que podríamos traducir como “ovillos” de información sobre ámbitos temáticos concretos. En el siguiente gráfico, que pertenece como el anterior a la presentación inicial de Nova Spivack orientada a contextualizar la herramienta, podemos ver las distintas características e interelaciones de la información que va a devolvernos Twine:

ovillostwine.jpg

El lenguaje de Facebook, por poner un ejemplo, como la propia web2.0, era capaz de detectar de forma cuantitativa algunas relaciones entre todos estos nodos (en este caso personas) pero no la calidad (cualidad) de sus relaciones o cualquier característica adicional (corporación, etiquetas asociadas a etiquetas, lugares, etc…).

El lenguaje de Twine, emulando al natural, interpreta permite todo eso. Así, lo que Nova Spivack define como la gran oportunidad en Twine es que facilita, mediante la concreción de relaciones semánticas, un tipo de colaboración mucho más inteligente.

¿Qué es un Twine?

El objeto compartido, que puede ser información textual, multimedia (imágenes y videos de YouTube, Flickr, Amazon, o otras fuentes online), emails y otros mensajes, etc…podrá, si así lo decidimos, pasar a formar parte de un Twine o “tejido”sobre determinada materia.

Antes, en otras redes, éramos nosotros quienes definíamos “tags” o metainformación simple para hacer la información indexable. Ahora Twine nos ayuda y valiéndose de las tecnologías de la web semántica sugiere, en base al rastreo electrónico, no sólo etiquetas sino también nombres de personas, lugares, empresas y muchas otras entidades que sus algoritmos reconocen.

¿Cómo recomendar un contenido?

La forma de marcar los contenidos es fácil. Si trabajamos con Firefox será un enlace en la barra de marcadores (bookmarks) la que podremos instalar y pulsar cuando queramos recomendar un item. Una ventana inteligente se abrirá, detectando de forma bastante precisa el resumen y los tags de forma automática. También por email (cada Twine tiende una dirección propia) podremos enviar, a un Twine en concreto o a un contacto de nuestra red social el contenido correspondiente.

concepto-twine.png

Como vemos en el gráfico, Twine aplica metadatos y lenguaje natural para extraer y añadir etiquetas a nuestras recomendaciones o contenidos de forma bastante precisa. “Personas”, “Organizaciones” y “Lugares” reconocibles como tales en el texto del artículo pasan a formar parte de los Twines con los que queramos compartir la información (sobre aprendizaje en el ejemplo superior).

Además, permite que nuestro criterio humano ajuste los posibles errores, actuando como corrector en caso de cometerlos. En el ejemplo, al intentar añadir como lugar “Spanish” no nos ha dejado y sí si añadimos “Spain”, que el sistema reconoce como país.

¿Cómo consultar Twines?

Así, cuando iniciamos una colección sobre un tema que nos interesa, el sistema abrirá un espacio a la derecha del concepto, en el que podremos consultar todos estos matices, así como los tags relacionados en la propia plataforma (en naranja) . Es un espacio dinámico, creciente, como un ovillo, que va añadiendo y valorando la importancia de múltiples temas que han podido reconocerse o inferirse a partir del teóricamente cada día más desarrollado contexto.

RDF, OWL, SPARQL, son las tecnologías de la web semántica que añadirán metainformación (información sobre el significado de la propia información), creando un “grafo semántico” en un repositorio inmensamente más estructurado que el actual en la web.

Finalmente…y esto hace de Twine una herramienta bastante innovadora en lo social, valorará la información, ya no en base al consenso general (del.icio.us) sino ponderando la importancia según la intensidad o el carácter de nuestra relación con el contacto que la aportó (búsqueda social cualificada).

Twine y el aprendizaje:

Como fuente de información, podemos consultar las actualizaciones de nuestros Twines, simplemente, entrando en el sistema. Un digest periódico o la propia portada nos devolverá las ultimas recomendaciones compartidas.

La posibilidad de recolectar o guardar información para verla más tarde me recuerda a los Entornos personales de Aprendizaje o escritorios virtuales en los que integramos nuestro curriculum y trazamos nuestros propios recorridos de aprendizaje, los PLE.

Se echa de menos en Twine la integración con otras herramientas. En mi caso, del.icio.us es una de las herramientas que utilizo con más frecuencia. Siguiendo los hilos de de información de soporte he sabido que se prepara su integración, la posibilidad de importar sus marcadores, así como de otras plataformas de marcado social, cita bibliográfica, etc…Sus APIs abiertas, sin duda, ofreceran en un futuro próximo la integración con otros tipos de herramientas.

Creo, finalmente que es una herramienta con futuro, que supera claramente las funcionalidades de base de datos semántica de su principal competidora: freebase, algo así comouna wikipedia gigantesca que semantifica todo lo que introducimos en ella pero no incorpora el elemento social. Aún así, están empezando a surgir (podemos leerlo en los Twines sobre herramientas de la web semántica) alternativas, según parece, aún menos potentes.

Deciros, por último, que como siempre que revisamos una herramienta y como premio si habéis llegado hasta aqui (me ha salido un post muy largo, lo sé….;)), tengo invitaciones disponibles a nombre de este blog. Dejad un comentario o solicitadlas por mail y, mientras no se agoten, os las haré llegar.

Otras fuentes de información:

Nota:
Tenéis algunos de estos enlaces en el nuevo planeta sobre web semántica, aún en fase beta, que he estado creando estos días. La idea es que os ofrezca enlaces y resúmenes de lo mejor publicado en español (estoy valorando dejar o no el inglés) sobre el tema. Escribidme, dicho sea de paso, si tenéis algún artículo o feed sobre web 3.0 o semántica para que pueda agregarlo. Hablaremos más de ello pero quería dejarlo aqui ya por si alguien quiere colaborar.

Nova Spivack: Entender (ahora sí) la web semántica (presentación)

dolors reig | April 29th, 2008 | 6 Comments »

Es un tema frecuente en este blog. Incluso, en cuanto pueda, le dedicaré un espacio específico en el wiki.

Llevo un tiempo intentando encontrar definiciones claras para algo tan complejo como la web semántica (en este post sobre herramientas de semantificación, por ejemplo), como otros blogs a nivel nacional e internacional (ReadWriteWeb), que incluso han planteado concursos que buscan una definición asequible sobre la esencia de eso que ya denominamos web 3.0 (en la presentación se habla incluso de 4.0).

Y es así porque, como veréis también en la presentación, el nivel de complejidad que unos 10.000.000 de bloggers en el mundo hemos aportado a la web es inmanejable (una aguja en un pajar, como también nos comenta Spivack) siguiendo los sistemas estadísticos (Google) actuales. Me he quedado con ganas (lo haré si me llega la “ansiada” invitación) de probar Twine, la herramienta que centra esta presentación. Si queréis entender de una vez por todas hacia dónde nos dirigimos y os pasa como a mi mientras realizaba esta traducción, esta presentación es ahora vuestro lugar.

A pesar de la licencia libre del documento he solicitado permiso a Spivack para subir a Slideshare la traducción. Espero que no haya problema y que nos permita disfrutar de su trabajo.