Posts Tagged ‘RDF’

Entrevista web semántica – 3.0 para la revista Computing

dolors reig | September 22nd, 2009 | 6 Comments »

Muy buenas, las preguntas que me formulaban hace unas semanas, en una entrevista para la revista Computing sobre web 3.0 – web semántica.

La guardaba desde hace tiempo para una ocasión especial, como lo es el cambio de look de El caparazón.

Espero que os guste.

“¿Qué novedades plantea la Web 3.0? ¿Qué diferencias existe con respecto a la Web 2.0?

No existe un consenso alrededor de lo que es web 3.0. De hecho, una de las definiciones típicas es la que constata un hecho puramente cronológico: Web 3.0 es la tercera década de la web. Si significará o no un cambio cualitativo, tema que es indudable para la web 2.0 o social, es algo que no sabemos aún. Sí podemos describir algunas de las tendencias hacia las que parece dirigirse la web de hoy. Algunas representan características más disruptivas que otras (web semántica) respecto a lo que tenemos hoy.

Otras, que voy comentando en El caparazón, serían según los analistas más relevantes en el ámbito anglosajón, cosas como la web en tiempo real, la web ubicua(con conceptos como Cloud Computing o Telefonía móvil), el Embodiment, la Internet de las cosas o la web contextual (entendiendo la que personaliza la experiencia del usuario según su contexto social, geográfico, etc…).

Quizás la teoría más extrema al respecto sea la de la Singularidad, que según la definición oficial supone que el progreso tecnológico y el cambio social se acelerarán debido al desarrollo de inteligencia super humana, cambiando nuestro ambiente de manera tal, que cualquier ser humano anterior sería incapaz de comprender o predecir.

Recomiendo la serie de vídeos de Simón Hergueta, además de otros sobre el tema que recopilaba en una entrada reciente (al final).

¿Qué es la web semántica y qué retos plantea?

La web semántica es aquella que se construye en un lenguaje que los ordenadores pueden “entender”. Se refiere, más allá de la transmisión de señales, a la comunicación.

Es una web de datos escritos en formatos interoperables, de bases de datos compatibles que construyen algo así como ámbitos conceptuales globales en toda la web. Son datos, dicho de otro modo, que los ordenadores pueden interpretar, relacionar con otros, etc… para devolvernos resultados o una experiencia de usuario más cómoda y satisfactoria.

Para que todo ello sea posible (y ese es el reto básico), debe definirse un estándar (el W3C es el organismo encargado de ello) además de traducir los conceptos del mundo a códigos informáticos (ontologías, otro de los retos). RDF y derivados son formas de marcar el contenido de cualquier página web de forma semántica.

El reto está en la interoperabilidad (la necesidad de que todas las páginas se adapten a un mismo lenguaje), además de en la complejidad, a la hora de marcar contenidos e incluso de definirlos.

Es, sin duda, una web mucho más costosa pero más eficiente a largo plazo.

¿Qué iniciativas hay interesantes sobre esa web semántica? En España hay algunos ejemplos?

Hay muchas iniciativas interesantes en Intranets o en el ámbito de la gestión del conocimiento corporativo. También en aplicaciones en sectores “verticales”, en los que es más posible la creación de ontologías, el trabajo de base para el funcionamiento de la web semántica. El turismo sería uno de los más beneficiados al respecto. El sector farmacéutico, la automoción son otros de los que el W3C recoge en su directorio (incluyo enlace a la presentación correspondiente en español al final)

Menos frecuentes son a nivel “mainstream” o generalizado, aunque Wikipedia, ahora Bing y el mismo Google estén trabajando ya con algoritmos semánticos. Como aplicaciones de éxito podemos hablar de Twine, una herramienta intermedia entre lo social (o de intereses), propio de la web 2.0, y la web semántica, en el sentido de organizar la información que recibe (los marcadores sociales) con ayuda de código semántico. El resultado es bastante bueno, logrando recomendaciones automáticas bastante adaptadas a nuestros intereses. Read More



¿Google se está abriendo algo a la web semántica?

dolors reig | January 7th, 2009 | No Comments »

Resultaba extraño que después de la adquisición de Powerset por parte de Microsoft, y a pesar de las múltiples manifestaciones de desconfianza hacia esa nueva forma de entender y codificar la web, Google se auto situara al margen de la evolución.

Fue una de las preguntas y reflexiones más interesantes de las que surgieron durante el último taller sobre web semántica que realicé:

-¿Y Google no está incorporando algoritmos semánticos? Mi respuesta se ve confirmada por lo datos que nos reportan hoy desde RWW. Quizás no de forma manifiesta pero difícilmente no existan en Google experimentos ni equipos de trabajo trabajando al respecto, digan lo que digan en comunicados oficiales.

Así, parece que los ejemplos comparativos que utilizábamos al comparar la vieja y la “nueva” forma de entender la web, la web semántica, van a dejar de sernos útiles: Desde hace poco, las búsquedas sobre fechas de nacimiento, conexiones familiares y otros tipos de información relacionada obtienen resultados en información estructrurada de forma explícitamente semántica. Preguntas como Who is Bill Clinton’s wife? What’s the capital city of France? obtienen resultados en forma de sujeto-predicado-objeto, o “tripletes” en términos semánticos.

Y las respuestas no están estructuradas de ese modo en las páginas de las que provienen. Parece, más bien, que Google crea estructura semántica desde datos semiestructurados o no estructurados (no marcados semánticamente) en absoluto. Dicho de otro modo, los resultados no son sólo de Freebase o Wikipedia, que los presentan estructrados, sinó de otros sitios que no trabajan con “tripletes” (sujeto-predicado-objeto, lenguaje RDF)

what-is-the-city-capital-of-france-buscar-con-google_1231356042557

Parece que los resultados son similares a los que devolvía hace unos tres años un viejo programa de Google, Direct Answers, aunque sus resultados eran mucho menos precisos.

No está claro que Google esté creando datos estructurados en páginas que no los contenían. Sería un error concluir en que se están realizando análisis semánticos sólo porque algunos de los resultados reportados aparecen en la forma sujeto-predicado-objeto (base del lenguaje semántico RDF), pero está claro que aparecen, son extraídos de páginas que a priori no siempre los contienen.

A la espera de tener más información, deciros que no llega a la precisión de Yahoo, que lleva tiempo trabajando con algoritmos semánticos. Además, el hecho de que Google no aporte datos RDF sobre las páginas, resta utilidad a la supuesta mejora en términos de su posible aprovechamiento por parte de terceras aplicaciones.

No es fácil la creación de datos estructurados a partir de cero, a pesar de que supondría una base común que permitiría innovar en mayor medida que la web común actual.

Terminar este artículo planteando un posible escenario. ¿Y si Microsoft adquiriera finalmente a Yahoo? La tecnología de Powerset y la de Yahoo juntas, por no hablar de la potencia de la imagen de una unión de marcas como esa….¿No sería quizás entonces el tema semántico un posible valor diferencial lo suficientemente fuerte como para resultar competencia para quien parece estar decidiendo a espaldas de estándares y del interés común la web del futuro?

Me gustaría dejaros algunas reflexiones más, derivadas de la discusión surgida entorno a este dato:  resulta extraño, de entrada, que una compañía que se auto define como abierta y transparente no responda claramente sobre este tipo de cuestiones. Es posible, como argumentan algunos, que Google esté experimentando cosas de forma contínua, llevando a cabo unos 50 a 200 experimentos a la vez, lo cual explicaría la “¿imposibilidad?” de hablar públicamente de todos ellos.

En fin… os mantendré informados.

Relacionados:



Web semántica y redes sociales. Más allá de los buscadores “Google Killer”

dolors reig | October 28th, 2008 | 7 Comments »

Cuando hablamos de web semántica, uno de los ejemplos típicos se refiere a los buscadores “Google Killer” y la mayor precisión que alcanzarán si combinan algoritmos perfeccionados (semánticos) con bases de datos amplias (como la que tiene Google en la actualidad). Me he levantado hoy con dolor de cabeza, así que si introduzco en Hakia “what drug treats a headache?” obtendré una respuesta satisfactoria.

Pensamos, además, en la web, cuando su potencia permitiría también mejorar la eficiencia de nuestras herramientas de escritorio, cuya interoperabilidad con los datos de cualquier tipo de servidor podría hacernos también la vida más fácil.

Un ejemplo de aplicación de las tecnologías semánticas está en la mejora de las redes sociales:

Vivimos la eclosión de las redes sociales verticales, especializadas, ya sean temáticas o territoriales, “Glocalizadas” o de nicho. La larga cola de la web 2.0 incluye ya aplicaciones y comunidades de personas, redes formales en empresas 2.0, independientes de los circuitos de networking social generalista (Facebook, Myspace como ejemplos paradigmáticos).

Lo decíamos, en otras palabras, al presentar Twine como red de intereses redentora del colapso 2.0. Lo importante aquí no es a quien conoces sinó la calidad de la relación, lo que compartes (conversaciones, intereses, Twines, Rooms, tópicos, tags) con tus contactos.

La socialización a través de los objetos es también la idea de Mark O’Neill,: “…organizando las redes de forma centrífuga alrededor de objetos, las redes sociales adquieren significado, incluso sin tener 200 milliones de usuarios y estar centradas en intereses minoritarios”.

En este contexto, la interoperabilidad, la portabilidad de los datos en redes sociales, el DNI universal, la huella dactilar de nuestra identidad digital se convierten en necesidad.

Icon for the FOAF (Friend of a Friend) project...

Image via Wikipedia

Como la OpenID, FOAF (Friend of a Friend), con mecanismos de representación de nuestros perfiles y SIOC (Semantically-Interlinked Online Communities) son desarrollos semánticos que pueden crear un login único y vinculado a nuestros intereses, automáticamente conectados a items de contenido en diversas comunidades.

¿Imagináis el potencial de poder rellenar registros completos de nuestros intereses y contactos de forma automática utilizando este tipo de archivos?

Con SIOC podríamos por ejemplo buscar en Facebook sobre un término y obtener resultados que podrían incluir personas, páginas de perfiles personales, pero también entradas de blogs desde Technorati, comentarios en Flickr y vídeos de YouTube. Un tag en delicious podría llevarnos, igualmente a resultados en muchas otras redes sociales.

Yahoo!, mediante su SearchMonkey, incorpora SIOC como vocabulario recomendado. La Google SocialGraph API (como base de Google Friend Connect) también tiene ese objetivo: permitir a las aplicaciones reutilizar la información sobre Grafos sociales en toda la web, mediante formatos abiertos como XFN y FOAF.

Ese sería el objetivo principal de la web semántica cuando sea realmente la web de las personas: que todo esté interconectado a pesar de que no nos demos cuenta de ello.

Existen hoy ya, herramientas de visualización, de humanización de todo ello. SIOC exporters para distintos sistemas y aplciaciones, como Twitter o Semantic radar, un fantástico complemento para Firefox que nos permitirá ver los contenidos RDF de cualquier página que los contenga.

Os hablaré en un próximo post de la implementación fácil de SIOC y FOAF en nuestros blogs y perfiles sociales a través de estas herramientas.

ACTUALIZACIÓN 29/10Web semántica y redes sociales (2), complementos, plugins semánticos, ya publicado.

Artículos relacionados / recomendados:

Tejido social de ovillos semánticos: Twine.

dolors reig | May 12th, 2008 | 28 Comments »

Each line is drawn between two nodes, representing two IP addresses. This is a small look at the backbone of the Internet.Image via Wikipedia

Podríamos decir que Twine, como la primera herramienta social de la web semántica, es diferente del resto (Facebook, Tuenti, Hi5, etc…).

No personaliza cada contenido que compartimos para que solo pueda ser accesible, mediante registro, dentro de sí misma, sino que convierte-traduce, aplica marcadores sintácticos a nuestras aportaciones, adaptándolas a los lenguajes mayoritarios de la denominada web semántica. (Me gusta pensar la web semántica como el esperanto de la red, que hace comprensibles los contenidos, independientemente de su posición en Google o la plataforma en que estén construídos)

Existen varios modelos de red social, que podríamos definir en base a su carácter más o menos “semántico”. Así, ordenadas según su valor como fuentes de contenido, podríamos clasificar las redes sociales, la multitud de marcas comerciales surgidas de la web2.0 como:

“Estilo Facebook”: A pesar de que, según su planteamiento inicial conecta personas en base a interacciones previas en la vida real. es una herramienta multifuncional, con tantas posibilidades como queramos según los desarrollos que permiten sus apis abiertas.

“Estilo Twitter”: Conecta personas en base a temáticas y concurrencias en el tiempo. Su potencial como herramienta de comunicación creo que desborda su carácter social o como marcador social ocasional.

“Estilo Ning o los propios blogs”: Conecta personas en base a intereses (contenidos) y de forma secundaria en base a lo social. Su principal función es la de crear comunidades, ofreciendo una versatilidad total en cuanto a contenidos.

Estilo Diigo, Del.icio.us o Twine”: Conectan intereses. Aunque de forma variable (en el caso de Diigo es una buena herramienta, también, para formar comunidades), su principal función es el marcado social, la recomendación, la búsqueda de consensos sobre contenidos diversos..

El contenido, la forma de organizarlo, la encontrabilidad, mediante códigos y relaciones entre nodos de información son los protagonistas de la web semántica. Así, Twine es una herramienta de nueva generación, híbrida, de tránsito entre lo que ha demostrado ser más útil o rescatable de lo social(2.0) y lo más prometedor de la web 3.0 (semántico).

O dicho de otro modo: Si Facebook y el resto de las redes mayoritarias han sido criticadas por el sinsentido final de la conexiones e interacciones que establecen (el “para qué” de las redes sociales”) la esencia de Twine es precisamente que aporta el esperado significado a lo social.

grafosocial.jpg

Twine está actualmente en fase beta, con unos 30.000 usuarios, una beta que he podido comprobar que hace honor a sus objetivos de mejora colaborativa de la herramienta. Son los cordeles de información relativa al uso, sugerencias y mejoras de Twine (un paso más allá de foros de soporte) los primeros “cordeles”a los que somos invitados. Veámos, después de aproximadamente un mes de uso, cómo es su funcionamiento:

Las relaciones sociales se establecen de forma similar en Facebook, Twitter, Tuenti, Diigo, Pownce y el mismo Twine: invitar, aceptar invitaciones, concretar y descubrir perfiles, etc…de personas con las cuales compartir distintos contenidos. La diferencia es que en este caso, son “Twines” o lo que podríamos traducir como “ovillos” de información sobre ámbitos temáticos concretos. En el siguiente gráfico, que pertenece como el anterior a la presentación inicial de Nova Spivack orientada a contextualizar la herramienta, podemos ver las distintas características e interelaciones de la información que va a devolvernos Twine:

ovillostwine.jpg

El lenguaje de Facebook, por poner un ejemplo, como la propia web2.0, era capaz de detectar de forma cuantitativa algunas relaciones entre todos estos nodos (en este caso personas) pero no la calidad (cualidad) de sus relaciones o cualquier característica adicional (corporación, etiquetas asociadas a etiquetas, lugares, etc…).

El lenguaje de Twine, emulando al natural, interpreta permite todo eso. Así, lo que Nova Spivack define como la gran oportunidad en Twine es que facilita, mediante la concreción de relaciones semánticas, un tipo de colaboración mucho más inteligente.

¿Qué es un Twine?

El objeto compartido, que puede ser información textual, multimedia (imágenes y videos de YouTube, Flickr, Amazon, o otras fuentes online), emails y otros mensajes, etc…podrá, si así lo decidimos, pasar a formar parte de un Twine o “tejido”sobre determinada materia.

Antes, en otras redes, éramos nosotros quienes definíamos “tags” o metainformación simple para hacer la información indexable. Ahora Twine nos ayuda y valiéndose de las tecnologías de la web semántica sugiere, en base al rastreo electrónico, no sólo etiquetas sino también nombres de personas, lugares, empresas y muchas otras entidades que sus algoritmos reconocen.

¿Cómo recomendar un contenido?

La forma de marcar los contenidos es fácil. Si trabajamos con Firefox será un enlace en la barra de marcadores (bookmarks) la que podremos instalar y pulsar cuando queramos recomendar un item. Una ventana inteligente se abrirá, detectando de forma bastante precisa el resumen y los tags de forma automática. También por email (cada Twine tiende una dirección propia) podremos enviar, a un Twine en concreto o a un contacto de nuestra red social el contenido correspondiente.

concepto-twine.png

Como vemos en el gráfico, Twine aplica metadatos y lenguaje natural para extraer y añadir etiquetas a nuestras recomendaciones o contenidos de forma bastante precisa. “Personas”, “Organizaciones” y “Lugares” reconocibles como tales en el texto del artículo pasan a formar parte de los Twines con los que queramos compartir la información (sobre aprendizaje en el ejemplo superior).

Además, permite que nuestro criterio humano ajuste los posibles errores, actuando como corrector en caso de cometerlos. En el ejemplo, al intentar añadir como lugar “Spanish” no nos ha dejado y sí si añadimos “Spain”, que el sistema reconoce como país.

¿Cómo consultar Twines?

Así, cuando iniciamos una colección sobre un tema que nos interesa, el sistema abrirá un espacio a la derecha del concepto, en el que podremos consultar todos estos matices, así como los tags relacionados en la propia plataforma (en naranja) . Es un espacio dinámico, creciente, como un ovillo, que va añadiendo y valorando la importancia de múltiples temas que han podido reconocerse o inferirse a partir del teóricamente cada día más desarrollado contexto.

RDF, OWL, SPARQL, son las tecnologías de la web semántica que añadirán metainformación (información sobre el significado de la propia información), creando un “grafo semántico” en un repositorio inmensamente más estructurado que el actual en la web.

Finalmente…y esto hace de Twine una herramienta bastante innovadora en lo social, valorará la información, ya no en base al consenso general (del.icio.us) sino ponderando la importancia según la intensidad o el carácter de nuestra relación con el contacto que la aportó (búsqueda social cualificada).

Twine y el aprendizaje:

Como fuente de información, podemos consultar las actualizaciones de nuestros Twines, simplemente, entrando en el sistema. Un digest periódico o la propia portada nos devolverá las ultimas recomendaciones compartidas.

La posibilidad de recolectar o guardar información para verla más tarde me recuerda a los Entornos personales de Aprendizaje o escritorios virtuales en los que integramos nuestro curriculum y trazamos nuestros propios recorridos de aprendizaje, los PLE.

Se echa de menos en Twine la integración con otras herramientas. En mi caso, del.icio.us es una de las herramientas que utilizo con más frecuencia. Siguiendo los hilos de de información de soporte he sabido que se prepara su integración, la posibilidad de importar sus marcadores, así como de otras plataformas de marcado social, cita bibliográfica, etc…Sus APIs abiertas, sin duda, ofreceran en un futuro próximo la integración con otros tipos de herramientas.

Creo, finalmente que es una herramienta con futuro, que supera claramente las funcionalidades de base de datos semántica de su principal competidora: freebase, algo así comouna wikipedia gigantesca que semantifica todo lo que introducimos en ella pero no incorpora el elemento social. Aún así, están empezando a surgir (podemos leerlo en los Twines sobre herramientas de la web semántica) alternativas, según parece, aún menos potentes.

Deciros, por último, que como siempre que revisamos una herramienta y como premio si habéis llegado hasta aqui (me ha salido un post muy largo, lo sé….;)), tengo invitaciones disponibles a nombre de este blog. Dejad un comentario o solicitadlas por mail y, mientras no se agoten, os las haré llegar.

Otras fuentes de información:

Nota:
Tenéis algunos de estos enlaces en el nuevo planeta sobre web semántica, aún en fase beta, que he estado creando estos días. La idea es que os ofrezca enlaces y resúmenes de lo mejor publicado en español (estoy valorando dejar o no el inglés) sobre el tema. Escribidme, dicho sea de paso, si tenéis algún artículo o feed sobre web 3.0 o semántica para que pueda agregarlo. Hablaremos más de ello pero quería dejarlo aqui ya por si alguien quiere colaborar.