Archive for the ‘herramientas semánticas’ Category

La web semántica, con Kumo y Google, un poco más cerca

| May 22nd, 2009 | 13 Comments »

Trasladaba la información hace un tiempo, entrevistada para una revista acerca del desarrollo de la semweb: “queda muy poco para que podamos considerarla una realidad”

Pues bien, no con Wolfram Alpha, que ya veíamos cómo no parece trabajar con algoritmos semánticos, sinó a través de los grandes de la web: Microsoft, con un Kumo inminente y Google con la intención de no  quedarse atrás:

Les decía entonces:

“Powerset será el germen del nuevo buscador semántico de Microsoft y su éxito determinará el tiempo de implantación de la Web 3.0. “La Web semántica es el futuro y será una realidad a medio plazo. Llegará antes si Microsoft mantiene su apuesta por lanzar un buscador semántico basado en las normas de W3C, porque en cuanto Google tenga una dura competencia incluirá la normativa semántica. Hace falta el empuje de una empresa con la fuerza de Microsoft para lograrlo”

Está teniendo lugar estos días Innovacamp Mediterránea. (#ICM09). Mi intervención, mañana a las 17:20, tratará sobre la web 3.0 (aquí la presentación básica: la tercera década de la web), así que trasladaré allí algunos de los siguientes argumentos:

“Será complejo y caro convertir los algoritmos matemáticos base de toda la información de Internet a lenguaje semántico. Hay trillones de páginas en Internet y los expertos evalúan que en su traducción se podría llegar a cuadruplicar el tiempo necesario para hacer una web. Los primeros pasos se dieron hace 5 años, y su crecimiento es lento.”

“La tecnología semántica es, sobre todo, utilizada por pequeñas empresas que hacen desarrollos puntuales para organismos y grandes firmas. Suelen centrarse en la atención de consultas públicas, como los muñecos robots de atención al cliente de la web de Grupo Vodafone o el servicio de ayuda para buscar información de Tata.  Buscadores como Yahoo y Mozilla o Wikipedia incorporan, poco a poco, tecnología semántica.”

semantica broma

Google ha decidido desmarcarse de esta evolución y no se pronuncia sobre la Web semántica, “porque no es un tema que tenga que ver con nosotros”, asegura un portavoz. El buscador, que tiene más del 73% del mercado mundial (corrijo el dato que la revista publica), utiliza tecnología semántica en una pequeña parte de la realización de sus búsquedas, pero no es la normalizada por W3C. Oficialmente no piensa en una evolución hacia la Web semántica”

“Así, el mismo Berners-Lee ha dicho que Google podría ser reemplazado como líder supremo de Internet por otra compañía que utilice la Web semántica, a pesar de haber desarrollado un método muy eficaz de búsqueda que le ha posicionado como líder:

La pelota está ahora en el tejado de Microsoft. El gigante de software para ordenadores se prepara para librar la batalla por Internet, imprescindible para mantener su dimensión empresarial a largo plazo. En unos años, los ingresos de las empresas de TI y telecomunicaciones procederán de los servicios y la publicidad movida en Internet, porque todos los terminales serán meras ventanas asomadas a la Red. Y quien domine las búsquedas dominará el mercado publicitario, porque el 54% de las compras se inician en buscadores, frente a un 30% que van directamente a la página del servicio o la tienda. El éxito del navegador de Microsoft, Explorer, es incontestable y ronda la mitad del mercado en las economías occidentales, pero su buscador LiveSearch no despega y apenas alcanza el 9% de las búsquedas estadounidenses, porcentaje que baja en otros países.

En julio pagó unos 100 millones de dólares por Powerset, buscador semántico base en Wikipedia. “Microsoft cree en la búsqueda semántica y vimos que la tecnología de Powerset era muy buena y desarrollada de acuerdo a la normativa de W3C. Apostamos por la Web semántica, y estamos viendo cómo exportar esta tecnología a  la www (corrijo tb)”.

En fin…que Kumo, el nombre previsto para el lanzamiento, saldrá en pocas semanas al mercado. Lo confirmo leyendo un artículo en La Cofa:

“Parece que Google se ha dado cuenta que la competencia apremia…

Como en otras ocasiones Google no quiere perder su posición innovadora y según ha indicado apuesta fuerte por las soluciones semánticas. Así este martes acaba de anunciar varias nuevas funcionalidades como:

  • Rich Snippets: Permite obtener un resumen de información sobre un término de búsqueda para que el usuario pueda de un vistazo hacerse una idea general. Por ejemplo si un usario teclea el nombre de un restaurante, el buscador podrá mostrar opiniones de usuarios, clasificaciones… Para ello se basa en la utilización de RDFa y Microformatos.
  • Google Squared: Que permite (de forma similar a Wolfram Alpha, añado) obtener de las consultas información estructurada y presentarla en formato tabla de datos.
  • Google Search Options: Incorpora opciones de búsqueda que en algunos casos parecen tener un fundamento semántico como la representación gráfica de términos semánticos, identificar si una entrada es una opinión, y hasta destacar el texto que recoge el sentimiento del autor.”

Kumo, Kumo, Kumo…(Actualización 25/5: Bing, Bing, Bing….;)) creo que vamos a quedar tan saturados del término como del de Wolfram Alpha en breve…. para que luego digan que el de “web 2.0″ cansa ;)

Fuente imagen.

Artículos en El caparazón sobre web semántica

Presentación: La tercera década de la web

| April 16th, 2009 | 13 Comments »

En fase beta (aún por terminar), os dejo la presentación base de una sesión que impartiré el próximo martes 21 de abril. Me invita Óscar Martínez Ciuró, de Trànsit projectes y será en el marco del Máster en Cultura Histórica y Comunicación de la Universidad de Barcelona que imparte.

Falta concretar ejemplos sobre el futuro, las posibilidades de la web en el ámbito de la historia, así como añadir referencias web al respecto de varios de los puntos. Estará en versión definitiva en algunos días, cuando termine también el post o slidecast (voz) que la complete:

Los nuevos entornos de información personalizada

| April 10th, 2009 | 6 Comments »

Sobreinformados, cierto. Abrumados de nuevas aplicaciones que prometen mejorar lo que, hasta cierto punto, ya nos funciona.

Creíamos que la etapa de consolidación de la web 2.0 iba a ser la de reducción, por selección natural, de servicios y fuentes, pero quizás no esté siendo así.

Trabajo en una presentación acerca de lo que es, será o debería ser (tenemos el privilegio de que está por construir y por tanto, como prosumidores, cierto poder sobre la dirección que tomará) la web 3.0

Y creo que incluiré, como tema fundamental además del semántico, las nuevas aplicaciones de personalización de la experiencia en la web.

A ese objetivo, el de crear entornos personales de filtrado de la información que creemos relevante se dirigen aplicaciones de “mashup” de distintas fuentes o lectores de feeds más o menos sofisticados, como Netvibes, Pageflakes,  Igoogle, Yahoo Pipes o mi hasta ahora insustituible Feedly o el resto de lectores de noticias personalizados que quiero presentaros hoy.

Si nos aproximamos a ellos con calma, sin vivirlos como nuevas aplicaciones que vengan a colmar el vaso repleto de lo 2.0 sinó como meta-herramientas de filtro y optimización de lo que ya tenemos, si dedicamos algún tiempo a configurarlas, a apropiárnosla, creo que terminaremos viviéndolas como rentables.

Establezco antes de empezar a describir algunas de las más relevantes entre las novedades, una diferencia que creo importante. El primer bloque tratará sobre herramientas de filtrado “ajeno” de la información, algo así como planetas de las noticias más populares que contienen múltiples temáticas y pueden ser personalizados sólo hasta cierto punto. Van más allá de los portales genéricos de los periódicos o la prensa digital pero siguen sirviendo a objetivos publicitarios además de informativos y nos ofrecen  aún un nivel medio de personalización:

1. Agregados de noticias de los medios más populares (predefinidos):

  • Kosmix, supuesto Google Killer de forma, en mi opinión, exagerada: Aunque lo máximo que podemos personalizar es la disposición de las distintas ventanas (al estilo Netvibes), puede ser una buena forma de acercarnos al concepto de entorno personal o una puerta de entrada adecuada para personas con poca experiencia como consumidores de información en la web.

kosmix-the-web-organized-for-you_1239380457424

  • Shyftr añade la posibilidad de añadir fuentes propias y desde hace unas horas, el concepto de filtros personalizados. Me ha recordado alguna lectura sobre el futuro, vinculado a la web semántica, de los PLE, EVA o entornos personales – virtuales de aprendizaje,  que consistirán, más que en agregados de fuentes, en agregados de resultados de búsqueda según términos de interés.No es el tema de este post y seguro que lo vemos con más calma, pero de momento, tenéis una buena revisión de las posibilidades que abre Shyftr en el blog de Louis Gray. He solicitado invitaciones y quedo a la espera de poder profundizar más:

shyftr_1239381358248

¿Evangelización de la autonomía informativa? Creo que ambos son, como leíamos para Facebook en el ámbito de las redes sociales, una buena forma de empezar a crear entornos personalizados sin dejar que el caos nos abrume.

2. Agregados de noticias personalizados (con algunas fuentes predefinidas  pero que permiten añadir fuentes de elección propia (más similares a lectores de feeds):

meehive-daily-hive_1239381637996

Resultan parecidos incluyendo (como no) búsquedas en twitter y responden al segundo modelo del que os hablaba, que permite, para usuarios avanzados, más autónomos, probablemente productores además de consumidores de información,  personalizar al máximo los contenidos que queremos leer.

Si añadimos, además, feeds de etiquetas en delicious o de twines de interés, podemos satisfacer necesidades exigentes como las que podemos tener si trabajamos, investigamos o estudiamos en la red.

Relacionados:

Usabilidad y ontologías: Nuevo paso en la evolución de la semweb de la mano de Twine

| March 19th, 2009 | No Comments »

Me entrevistaban el otro día acerca de la web 3.0, la web semántica y me resultaba difícil, a pesar de la experiencia en varios talleres sobre el tema, acercarla al usuario sin mencionar la primera aplicación que se ha encargado de ello: Twine.

Quería dejaros, además de la noticia sobre este nuevo e importante desarrollo, algunas de las cosas que les comentaba:

Sobre si hay empresas trabajando hoy en la construcción o desarrollo de la web 3.0….

“Muchas empresas trabajan para la web semántica y pueden forzar a Google (elemento imprescindile para convertirla en “mainstream”) a reconocer que la adopta o adoptarla en algunos puntos.  Twine, una aplicación que está haciendo de algún modo de puente hacia esta (ya es casi tan popular como delicious), está a punto de lanzar un servicio para hacer más fácil la escritura de datos semánticos (ontologías). Otras empresas como Hakia o Yahoo llevan ya tiempo incorporando todo esto a su buscador…. y Kumo, el nuevo buscador que lanzará este año Microsoft y que puede suponer una seria competencia para Google, adoptará, además de mecanismos propios de la búsqueda vertical y sintáctica, elementos de la semweb.”

Sobre si la web semántica sustituye a la actual….

“La web semántica es una capa añadida a la web actual, no la sustituye. Añade significado visible a los buscadores que mejora la eficiencia, la experiencia de usuario de la web, pero en cuanto a lo formal, el diseño de lo que vemos actualmente no va a cambiar demasiado.”

Sobre el porqué de la no adopción o la adopción partcial por parte de algunos buscadores, de la semweb:

“La construcción de ontologías (lenguajes, algoritmos que dirían a los ordenadores cuándo una cosa es un lugar, una persona, un evento, una organización, qué relaciones tiene con otras cosas, qué componentes la integran, etc…) es compleja y no existe hoy ningún buscador que pueda ser demasiado preciso en todos los ámbitos de conocimiento. Mientras no estén desarrolladas todas las ontologías, tendrán que combinar, como lo hará Microsoft, distintos sistemas.”

Como idea general, es una web más eficiente, más adaptada a nuestro lenguaje natural como humanos, más independiente de nosotros. (Tenéis en Presentación: Construyendo entre todos la web semántica. un buen tutorial básico para su comprensión)


Pero vayamos a la noticia que ha motivado este post: Twine, que parece que está creciendo hasta el punto de aproximarse a la popularidad de delicious, prepara una herramienta “usable” para la creación de ontologías, base para asegurar la eficiencia de la web semántica.

Hemos escrito mucho aquí acerca de Twine. Su bookmarklet, que acaba de mejorar, quizás sea su característica más popular. Con un solo click en páginas con microformatos adecuados (u otros marcadores semánticos) se etiquetan de forma automática los contenidos, clasificando Twine cada concepto clave según sean personas, lugares y otros tipos de información para mejorar su eficiencia como portal de búsquedas y recomendaciones afines a nuestros intereses.

El ahorro de tiempo y la precisión (en inglés) suponen, respecto a Delicious, una importante ventaja y así parecemos haberlo valorado los usuarios:

Según Nova Spivack en RWW, Twine, si sigue creciendo al ritmo actual, habrá sobrepasado a Delicious, una de las herramientas fundamentales de la web 2.0 en verano de este mismo 2009.

Sobre la nueva aplicación, que será lanzada, previsiblemente, este año, es destacable que se lanzará con licencia Open Source, así como que las ontologías creadas no trabajarán únicamente en Twine sinó que podrán ser utilizadas por cualquier aplicación.


ontologysite

La complejidad, el trabajo que supone crear ontologías (según Wikipedia son la formulación de exhaustivos y rigurosos esquemas conceptuales dentro de uno o varios dominios dados con la finalidad de facilitar la comunicación y la compartición de la información entre diferentes sistemas y entidades), hace que a día de hoy sean aún pocas las creadas, la mayoría en temas de tecnología)

La dificultad de semantización de los contenidos es, como veíamos, uno de los principales argumentos de Google para la no implantación de tecnologías semánticas en su buscador. Así, herramientas usables para crearlas podrian cambiar de forma radical este escenario, suponiendo un paso importante en la evolución de la web semántica.

No será la primera en ese sentido: Protege o CmapTools Ontology editor, que parte de la idea de los mapas conceptuales para ayudar a la edición de ontologías llevan tiempo trabajando. También Microsoft, que parece que apuesta desde hace tiempo como ventaja estratégica por la web semántica, anunciaba hace poco un nuevo complemento de semantización para Word 2007 que permite a los autores anotar palabras o frases con términos definidos en ontologías externas.

Pero si esta promesa de Twine es capaz de trabajar de forma tan intensa por la usabilidad como lo ha hecho la firma hasta hora con su aplicación para redes de interés, creo que puede acelerar de forma significativa la evolución de la web.

Os dejo, para finalizar, el usuario de El caparazón en Twine.

Taller para formadores: Web 3.0 / Twine: construyamos entre todos la web semántica

| March 2nd, 2009 | 3 Comments »

Os dejo programa del Taller que impartiré el próximo día 5 de marzo para Formadores de personas adultas, organizado por la Unidad de Formación Permanente de la Direcció General d´Ensenyaments professionals, artístics i especialitzars del Departament d´Educació de la Generalitat de Cataluña que dirige Juan Miguel Muñoz.

Dejaré también, el mismo día o el siguiente, la correspondiente presentación (a grandes rasgos en Presentación: Construyendo entre todos la web semántica. Espero que os sea útil.

1. ¿Qué es la web semántica? ¿Qué nos aporta como uusarios?

  • Evolución de la web 2.0 a la web 3.0, de la información al conocimiento.
  • Porqué interesa, desde el punto de vista educativo la web semántica?

2. Qué son los contenidos semánticos?

  • Breve introducción a las ontologías, Folksonomías, Microformatos, RDF, Estándares (W3C).

3. Mitos y realidades sobre la web semántica.

  • La web semántica no es rentable (evolución econòmica de 2.0 a 3.0)
  • Web semántica: Experiencias de éxito.
  • Google no cree en la web semántica (Semantic web vs. Satanic Web)
  • La web 3.0 es la web semántica (diferencias entre ambos conceptos)
  • Otros (preguntas de los asistentes)

4. ¿Qué es Twine?

  • Diferencias entre Twine (3.0) y las redes sociales al uso (2.0): Obreros del conocimiento, aportando valor a la web semántica.
  • Twine y la educación, ejemplos concretos.

5. Práctica de las principales funciones de la herramienta

6. Otras herramientas semánticas útiles en educación

Os dejo también programa en catalán, como realizaremos el taller: Taller per a formadors: Web 3.0 / Twine: construint entre tots la web semàntica:

Objectius
Oferir als formadors elements de prospectiva educativa per preparar les futures activitats formatives amb un enfocament proper a les tendències tecnològiques i socials.
Blocs temàtics
1. Què és la web semàntica? Què ens aporta com a usuaris?

  • Evolució de la web 2.0 a la web 3.0, de la informació al coneixement.
  • Per què és interessant des del punt de vista educatiu la web semàntica?

2. Què son els continguts semàntics?

  • Breu introducció a les Ontologies, Folksonomies, Micro- formats, RDF, Estàndars (W3C).

3. Mites i realitats sobre la web semàntica.

  • La web semàntica no és rendible (evolució econòmica de 2.0 a 3.0)
  • Web semàntica: Experiències d´èxit.
  • Google no creu en la web semàntica (Semantic web vs. Satanic Web)
  • La web 3.0 és la web semàntica (diferències entre ambdós conceptes)
  • Altres (preguntes dels assistents)

4. ¿Què és Twine?

  • Diferències entre Twine (3.0) i les xarxes socials a l´ ús (2.0): Obrers del coneixement, Aportant valor a la web semàntica.
  • Twine i l´educació, exemples concrets.

5. Pràctica de les principals funcionalitats de l´eina. 6. Altres eines semàntiques útils en educació. Exemples

Destinataris
Formadors de formadors en Aprenentatge Reflexiu i Col·laboratiu (ARC) i en Tecnologies per a l’Aprenentatge Col·laboratiu (TAC) i altres formadors de formadors  interessats.
Formadors
Dolors Reig, Consultora d’e-learning, web, comunitats de pràctica i xarxes socials.
Modalitat i durada
PresencialDurada: 5 hores
Llocs de realització, calendari i horari
Centre de Recursos de FPA Nou de la Rambla, 49 08001 Barcelona

  • Dijous: 5 de març de 2009.

  • De 9.00 a 14 h.

Nubes de búsqueda, complemento semántico para Google

| February 16th, 2009 | 2 Comments »

Lleva tiempo en borrador, entre otras cosas porque quería testearla antes de presentarla: Search Cloudlet es un complemento fácil de utilizar en Firefox, que inserta nubes inteligentes de conceptos (tag clouds) en las interfaces típicas de búsqueda para Yahoo, Google, Google News y Google Blog Search.

Analiza microformatos para distinguir entre lugares, personas, etc…

search cloudlet, nubes de tags en búsquedas en google

Su instalación es fácil y su uso simple si dejamos las opciones por defecto. Si así lo hacemos, nos aparecerán, al entrar en la página de nuestro buscador (google.com, google.es, yahoo.es, etc…) las siguientes opciones:

Tag Cloud

Devuelve todas las keywords relevantes de la búsqueda, permitiendo que nos hagamos una idea aproximada sobre lo que necesitamos. En el caso de la imagen, reconozco como bastante acertados los términos que devuelve para El caparazón.

Site Clouds

La nube se centra en los sitios en los que la palabra introducida en el buscador es relevante. Podemos entonces, al hacer click en cualquiera de ellos, restringir la búsqueda al mismo.

Noticias y blogs

Si buscamos noticias, Source Cloud confeccionará una nube de fuentes. Location Cloud hará lo mismo con lugares y Author Cloud para autores. Recomiendan, por último, personalizar el número de resultados que devuelven habitualmente nuestros buscadores preferidos a unos 100, para mayor precisión. En el caso de Google, podéis personalizarlos desde aquí.

Feedly, el lector inmejorable, mejora ;)

| February 12th, 2009 | 5 Comments »

Si hay alguna herramienta que me siento orgullosa de haber recomendado es Feedly. También es una de las aplicaciones que no creía que pudiera ser mejorada, más desde su última integración con Ubiquity. En esto último me equivocaba:

Perfectamente integrado con Google Reader, su mejor alternativa, añade ahora Feedly Mini, una pequeña barra inferior en el navegador (Firefox) que nos informa del número de twitteos, conversaciones en Friendfeed, número de Diggs y número de veces que el post ha sido compartido en Google Reader o el propio Feedly (tema que ya era sincrónico).

Además, una flecha nos permitirá navegar a la siguiente recomendación sin tener que activar, como lo hacíamos hasta ahora, Feedly.

En el caso (frecuente para quien escribe) de leer algún enlace posteado en twitter, Feedly nos lo recordará, añadiendo la posibilidad de “retwittear” (RT) de forma fácil el contenido sin tener que entrar en Twitter.

Para Friendfeed, el tema es unirse a la conversación. Así, la ventana correspondiente añadirá la opción de hacerlo sin entrar en Friendfeed:

feedly-mini

Esto hasta ahora…pero parece que en breve también añadirá iconos a los principales servicios de bookmarking y otros medios sociales (delicious, por ejemplo):

feedly futuro

Si tenéis instalado Feedly un click en este enlace os permitirá configurar todas estas alertas, incluida la que marcará en Google Reader – Feedly los posts que ya hayan sido visitados como leídos.

Más Web social semántica, ahora para emailing

| January 30th, 2009 | 4 Comments »
semantic_x220SEAmail es un prototipo de sistema para email que está siendo desarrollado por la Universidad de Stanford como mejora semántica de los servicios de correo. El objetivo es informar a las personas adecuadas sin tener que seleccionar direcciones de mail, grupos o nombres.
 
Y no se trata sólo del autocompletado que ya nos ofrecen muchos otros servicios (Exchange, Gmail, etc…) sinó de selección inteligente de destinatarios.
 
Según el MIT’s Technology Review el desarrollo permitirá a los usuarios seleccionar a los destinatarios de un mensaje según una búsqueda determinada, creando grupos "al vuelo". Por ejemplo: "profesores de informática en Barcelona".
La interface es reveladora: Enviaremos un mail a las personas que satisfagan los siguientes criterios (nombre, grupo, ámbito de interés, etc …)
 semantic_email_chooser
 
 
Es fácil imaginar el potencial de la herramienta en una organización que ya almacene completas bases de datos sobre sus empleados, clientes, proveedores, etc… pero ¿podría servir para la web general, abierta?
 
 
El problema, en ese caso, puede ser el Spam. Oren Etzioni, director de un importante centro en el desarrollo de sistemas de Inteligencia Articial, The Turing Center, en la Universidad de Washington, nos previene acerca del peligro de los posibles usos del sistema para generar aún más correo "basura".
 
La importancia de la noticia está en que estamos hablando, más allá de gestores de mail, de sistemas de deducción de targets específicos en la web social (a partir de cualquier sistema de mensajería y no sólo del correo. Si la búsqueda pudiera extenderse a Friendfeed, Twitter, etc…, podría suponer un paso importante (aunque como veíamos, peligroso) para la evolución de la Web social semántica.
 
Existen, además, como hemos visto en ocasiones aquí, estándares definidos para perfiles sociales e intereses (FOAF, SIOC), que podrían hacer el salto hacia la generalización mucho más corto. De momento, parece que el sistema se probará en la Universidad de Stanford a finales de este mismo año.

Headup, navegación social contextual – semántica

| January 13th, 2009 | 4 Comments »
Headup es una muestra de la Web contextual social. Tenemos pendiente la segunda parte del post, sobre aplicaciones prácticas de esta y merecerá sin duda un espacio. Me ha recordado a Glue, la extensión semántica de Adaptive Blue para Firefox que asocia determinados contenidos mientras navegamos a items en Amazon, Librarything y otros servicios. También a Juice, que ya revisamos.

En el caso de Headup, ha sido otra de tantas de las aplicaciones que encuentro a veces, instalo en la barra de Firefox y compruebo antes de presentarla. Y os la presento porque en muy poco tiempo, me han sorprendido muy positivamente sus resultados en cuanto a relevancia.

home_logo
La idea es la identificación y marcado de ciertos items de las páginas que visitamos. Situando el cursor sobre ellos se abrirá una nueva ventana con resultados sobre contenidos afines en servicios web populares.

El criterio, el filtro que guía los resultados es social: Aportando nuestros nicks y contraseñas en Twitter, Friendfeed, Facebook, cuentas de correo de las que extraerá nuestros contactos, etc…podremos acceder a información relevante acerca de los items detectados. En especial me ha resultado especialmente atractiva la pestaña “Web activities” en la que se reflejan las actividades en la web (Twitter, Friendfeed, Facebook) de nuestros contactos al respecto de determinado item, una característica nueva y que  creo que, entre otras, convierte a la herramienta en bastante útil y distinta a las arriba mencionadas.

Os dejo vídeo explicativo de sus creadores:

¿Google se está abriendo algo a la web semántica?

| January 7th, 2009 | No Comments »

Resultaba extraño que después de la adquisición de Powerset por parte de Microsoft, y a pesar de las múltiples manifestaciones de desconfianza hacia esa nueva forma de entender y codificar la web, Google se auto situara al margen de la evolución.

Fue una de las preguntas y reflexiones más interesantes de las que surgieron durante el último taller sobre web semántica que realicé:

-¿Y Google no está incorporando algoritmos semánticos? Mi respuesta se ve confirmada por lo datos que nos reportan hoy desde RWW. Quizás no de forma manifiesta pero difícilmente no existan en Google experimentos ni equipos de trabajo trabajando al respecto, digan lo que digan en comunicados oficiales.

Así, parece que los ejemplos comparativos que utilizábamos al comparar la vieja y la “nueva” forma de entender la web, la web semántica, van a dejar de sernos útiles: Desde hace poco, las búsquedas sobre fechas de nacimiento, conexiones familiares y otros tipos de información relacionada obtienen resultados en información estructrurada de forma explícitamente semántica. Preguntas como Who is Bill Clinton’s wife? What’s the capital city of France? obtienen resultados en forma de sujeto-predicado-objeto, o “tripletes” en términos semánticos.

Y las respuestas no están estructuradas de ese modo en las páginas de las que provienen. Parece, más bien, que Google crea estructura semántica desde datos semiestructurados o no estructurados (no marcados semánticamente) en absoluto. Dicho de otro modo, los resultados no son sólo de Freebase o Wikipedia, que los presentan estructrados, sinó de otros sitios que no trabajan con “tripletes” (sujeto-predicado-objeto, lenguaje RDF)

what-is-the-city-capital-of-france-buscar-con-google_1231356042557

Parece que los resultados son similares a los que devolvía hace unos tres años un viejo programa de Google, Direct Answers, aunque sus resultados eran mucho menos precisos.

No está claro que Google esté creando datos estructurados en páginas que no los contenían. Sería un error concluir en que se están realizando análisis semánticos sólo porque algunos de los resultados reportados aparecen en la forma sujeto-predicado-objeto (base del lenguaje semántico RDF), pero está claro que aparecen, son extraídos de páginas que a priori no siempre los contienen.

A la espera de tener más información, deciros que no llega a la precisión de Yahoo, que lleva tiempo trabajando con algoritmos semánticos. Además, el hecho de que Google no aporte datos RDF sobre las páginas, resta utilidad a la supuesta mejora en términos de su posible aprovechamiento por parte de terceras aplicaciones.

No es fácil la creación de datos estructurados a partir de cero, a pesar de que supondría una base común que permitiría innovar en mayor medida que la web común actual.

Terminar este artículo planteando un posible escenario. ¿Y si Microsoft adquiriera finalmente a Yahoo? La tecnología de Powerset y la de Yahoo juntas, por no hablar de la potencia de la imagen de una unión de marcas como esa….¿No sería quizás entonces el tema semántico un posible valor diferencial lo suficientemente fuerte como para resultar competencia para quien parece estar decidiendo a espaldas de estándares y del interés común la web del futuro?

Me gustaría dejaros algunas reflexiones más, derivadas de la discusión surgida entorno a este dato:  resulta extraño, de entrada, que una compañía que se auto define como abierta y transparente no responda claramente sobre este tipo de cuestiones. Es posible, como argumentan algunos, que Google esté experimentando cosas de forma contínua, llevando a cabo unos 50 a 200 experimentos a la vez, lo cual explicaría la “¿imposibilidad?” de hablar públicamente de todos ellos.

En fin… os mantendré informados.

Relacionados:

MOBVIS, Internet de las cosas, Hiperenlaces a la realidad

| January 3rd, 2009 | 10 Comments »

Os dejo hoy algo así como la bola de cristal de lo que será la web en un futuro no demasiado lejano (ya sabéis…la Ley de Moore o evolución exponencial de algunas tecnologías), un nuevo adelanto en la Internet de las cosas, en la Ubicuidad de la web.

Presentábamos el otro día  CoMET, como la web 3.0 de las personas. En este caso, también se trata de un proyecto desarrollado por investigadores Europeos, MOBVIS, que desarrolla un nuevo sistema que permitirá a los dispositivos móviles con captación de imágenes enlazar, hacer hipertextuales los datos (imágenes) del mundo real:

Conciencia” sobre objetos, Visión artificial móvil:

La conciencia sobre objetos se utiliza para detectar y reconocer objetos de alto interés en escenarios urbanos, como edificios, infraestructura, gente y signos (logotipos, banners, etc…).  MOBVIS demuestra cómo la geo-indexación mejora notablemente el funcionamiento de objetos móviles mediante la explotación de la información de mapas de ciudades aumentados digitalmente. La consulta por imagen y la posición estimada basada en GPS llegan al servidor, que devuelve resultados de reconocimiento geo-indexado del objeto. Además, los visitantes pueden recibir información histórica, de eventos, tiendas, etc…sobre el punto de interés.

La novedad, con respecto a Google Street View está en el carácter de los datos que es capaz de interpretar. Mientras la primera identifica la localización via GPS o triangulación para mostrar a continuación imágenes de la zona, MOBVIS, “ve” el mundo a través de nuestros dispositivos móviles (“visión artificial móvil”).

No es la primera de las aplicaciones de la web semántica, la web que intenta interpretar el significado de los datos, que puede considerarse multiformato, mediante reconocimiento de patrones visuales, pero sí la que parece devolver resultados más espectaculares. Pensad un poco en ello, imaginad, aplicando también patrones visuales conocidos, cómo pueden configurar desarrollos como este nuestro futuro….

Tenéis en la página de MOBVIS posibles usos, escenarios de uso del sistema:

Hemos apuntado la localización urbana, información turística, mapas urbanos aumentados: La tecnología de MOBVIS puede servir para informar a los visitantes sobre objetos (sitios de interés, edificios), devolviendo información relevante.

La ilustración muestra una consulta de imagen (marco azul) y algunas imágenes de referencia (marco verde)  usadas para posicionar y orientar la búsqueda por imagen y en consecuencia, al usuario.

Existen relaciones geométricas relativas a la imagen de la consulta (marcadas por las líneas verde oscuro):

Localización visual, Posicionamiento multimodal, estimación de movimiento:

De modo similar a la tecnología GPS, MOBVIS puede determinar la localización de objetos en movimiento, así como su velocidad. Curiosamente, la visión por ordenador ha demostrado ser incuso más precisa que la localización GPS. Además, la localización basada en imágenes permite el hiperenlace a items reales o detección georeferencial de objetos. ¿La web semántica de la vida real?

Geo-Servicios y Actualización incremental del mapa (Crowdsourcing):
El sistema puede recoger actualizaciones de los mapas cuando los usuarios toman sus fotografías (no necesita las caravanas de Google por las calles, somos nosotros quienes la hacemos mejor). Sensores conectados a personas o vehículos se han encargado de registrar los datos con los que trabaja en la actualidad.

MOBVIS ha desarrollado un sistema de atención a partir de múltiples claves inspiradas en la atención humana y el movimiento de nuestros ojos. Además, la extracción de perfiles de recuperación de información 3D pude ser indexada en mapas de ciudades para obtener información (conciencia) sobre nuestra localización.

Resumiendo, podríamos decir que el sistema parte de una base de datos de panoramas geo-referenciados (como Google Street View). Los objetos en las imágenes se anotan de forma manual con información. Cuando se ha completado todo ello, el sistema es capaz de realizar búsquedas desde teléfonos móviles. A partir de las fotografías que podamos tomar, MOBVIS compara la fotografía con las que tiene en su base de datos para devolvernos enlaces relevantes.

Su punto fuerte es el algoritmo de chequeo de características visuales desarrollado por la Universidad de Ljubljana, en Eslovenia. Se trata de un sistema bastante preciso, capaz de distinguir entre objetos a partir de mínimas diferencias. En pruebas en el mundo real, parece que realizó inferencias correctas en el 80% de las ocasiones. En el 20% restante no devolvió resultados, no reportando en ningún caso falsos positivos.

Espectacular pero confuso, lo sé….suerte que he encontrado, para terminar, un vídeo desde la Universidad de Ljubljana al respecto:

Ubiquity, el Firefox (semántico y contextual) del futuro

| January 2nd, 2009 | 10 Comments »

Empieza el año y toca cumplir promesas pasadas. Así, hablábamos hace unos días de la Web contextual y os citaba Ubiquity, una extensión actual de Firefox recientemente actualizada,  que ofrece tecnología contextual (semántica) mediante texto (lo que ellos denominan “verbos”) en una línea de comando. Llevo unos días probándolo y definitivamente vale la pena.

Estos serían sus fundamentos:

Las aplicaciones web, como muchas de las de escritorio, parecen en ocasiones ciudades aisladas, sin demasiadas posibilidades para el intercambio de información Es un tema que intentan solucionar para la web algunas extensiones para Firefox: botones de marcado social o complementos como Greasemonkey irían en ese sentido.

Serían estos “puentes” entre ciudades más o menos abiertas (según el carácter de sus APIs) elementos imprescindibles para la web contextual o el GGG (Grafo Global Gigante) del que nos hablaba Berners-Lee y que supone la próxima etapa de la web. Extraigo de un post anterior:

“El GGG (Giant Global Graph, Grafo Global Gigante), viene a superar el Grafo social (la web 3.0 viene a superar la 2.0….) y describe la web del futuro:

Más allá de articular relaciones entre personas, la web tratará de unir personas a lugares, lugares a organizaciones, relacionar personas y lugares, documentos y personas, con los eventos y todas las variantes que puedan surgir de estos conceptos clave.”

Cada vez son más esos puentes. Podemos con Ubiquity, desde añadir eventos de forma simple a Google Calendar, añadir marcadores a Twine, Ping-fm a convertir selecciones a pdf, rtf o html, pasando por definir, traducir, localizar en Google Maps, convertir enlaces a tinyURLs, etc…(tenéis en el punto 3 recursos sobre listados)

Veámos cómo ponerlo a prueba:

1-Encontraremos el enlace a la descarga de Ubiquity aquí.

2-Una vez descargado y reiniciado Firefox (proceso usual para instalar cualquier extensión en este navegador), invocaremos, llamaremos a la interface, línea de comando o ventana desde la que interactuar con Ubuiquity. Las teclas predeterminadas para ello serán Ctrl y espacio pulsados de forma simultánea (ctrl-space para PCs, ‘option-space’ en el caso de Mac)

3-De lo que se trata ahora es de explorar los comandos (verbos) que nos serán más útiles. Podemos encontrar listados de los mismos, tanto en la página principal de Ubiquity (deberemos marcar, personalizar los que vayamos a utilizar desde aquí) como en algunos interesantes listados, entre los que destacaría el de RWW: Verbos instalables en Ubiquity .

Como ejemplo, os recomiendo probar un “update” en twitter. Tras invocar la línea de comando (mediante ctrl-space) y haber marcado la opción correspondiente, escribiremos los siguiente:

twitter [probando Ubiquity]

El listado completo de comandos es un comando más. Aparecerá si escribimos, siguiendo los pasos anteriores: command-list

Os dejo un vídeo que explica muy bien su funcionamiento:

Comentar para terminar que es muy probable que en este caso, la extensión forme parte de la próxima versión de Firefox. Lo comentábamos al hablar sobre web contextual y la evolución, tanto de IExplore como del propio Firefox en este sentido. Además, deciros que acaba de salir una nueva versión, mucho más rápida y con la posibilidad de usar distitntos “skins”.


Herramientas relacionadas:

Llega con fuerza la Web Contextual (1)

| December 25th, 2008 | 7 Comments »

Decíamos al final del artículo sobre tendencias en la web para 2009 que se aventura un futuro en el que el objetivo será combatir la sobreinformación, que a pesar de la progresión creciente en nuestras habilidades cognitivas para procesarla adecuadamente, nos llevará a ser mucho más selectivos, a filtrar bajo criterios sociales o (otra vez) semánticos, cada vez más y con herramientas más eficientes, nuestras fuentes de información en la red

La idea es poderosa y parece ir un paso  más allá de los estrictos criterios que parece exigir cualquier aplicación para poder ser considerada semántica: La web contextual pretenderá que navegadores y páginas reconozcan con mayor precisión lo que el usuario realmente quiere encontrar. Menos opciones y más significado, menos búsquedas en Google y más contexto, persiguiendo las siguiente mejoras en la experiencia de usuario:

  • Relevancia: entender mejor el contexto conlleva mayor relevancia de los contenidos para el usuario.
  • Eficiencia – Atajos: Los atajos contextuales facilitarían las búsquedas.
  • Personalización: El contexto está basado en las intenciones y la historia de navegación del usuario.
  • RemezclaMashups: en entornos abiertos, puede devolvernos información relevante e interoperable entre servicios de la web (Ubiquity puede insertar un mapa en un correo electrónico de forma muy fácil).

Este  tipo de tecnologías contextuales tienen en muchas ocasiones como base lenguajes propios de la web semántica. Se basan también en la filosofía de las APIs abiertas (que permiten la interacción entre distintas aplicaciones de la web).

El html plano, sin marcas semánticas, xml, rdf o microformatos, entre otros lenguajes de marcado semántico (metadatos), no permitía la interacción con el navegador a los niveles actuales. Hoy, cuando el navegador puede inferir ideas acerca de las páginas que visitamos, es capaz de devolvernos información relativa y/o relevante.

Tal y como decíamos al hablar de la web semántica, la web contextual entiende  mayor medida el comportamiento del usuario. La combinación de la información sobre la página con el comportamiento del usuario es lo que crea el contexto y por tanto, una web más inteligente.

No creo que como afirma Alex Iskold, de quien extraigo algunas de las  ideas en este post, la web contextual vaya a sobrepasar, a superar en cuanto a su frecuencia de uso, la costumbre de hoy de aproximarnos a la información a partir de resultados en el buscador. No en un primer momento, desde la premisa lógica de que no hay contexto sin información previa (información+comportamiento=contexto) y por tanto la primera aproximación a lo que buscamos deberá pasar casi siempre por buscadores, pero sí después, evitándonos muchos clicks innecesarios  y haciendo por tanto mucho más eficiente nuestra navegación posterior.

Creo, además, más allá de la idea original, que el tema debe incluir algunas cosas más, que también deben ser consideradas contextuales:

-La geolocalización, o oferta de contenidos según el lugar desde el que esté físicamente el usuario

-Los contenidos de relevancia “social”, aquellos que preferimos porque son los que prefieren nuestros contactos en redes sociales.

-También aprendería de nuestro comportamiento como usuarios, evitándo que nos encontremos una y otra vez con resultados que consideramos irrelevantes (Google está poniendo en práctica ya un sistema de filtrado de resultados personalizados según nuestras valoraciones previas, Google SearchWiki)

Una de las formas de aportar metadatos a las páginas que escribimos son los microformatos:

Presento siempre los microformatos como precursores, de fácil comprensión, de la web semántica.  Ofrecen una forma compatible con los estándares XHTML de embeber metadatos sobre diversas cosas, diciéndole al navegador que son gente, lugares, eventos, revisiones, etc…

Los Web Slices, introducidos por Internet Explorer 8, por ejemplo, entienden el microformato hAtom. Los Web Slices permiten a los que publicamos contenidos notificar a los usuarios de IE8 cualquier cambio en la información de nuestras páginas web. Weather.com podría, por ejemplo, crear un Web Slice que que notificara al usuario cualquier actualización en el clima local. El concepto es similar a lo que hacen los sistemas de sindicación de contenidos (feeds), pero de forma más focalizada en partes de la página y permitiendo al usuario la interacción con el sitio de forma directa, a través del navegador en la página.

XML realiza, en aplicaciones como Cooliris, un trabajo similar, señalando al navegador si una página contiene o no imágenes para que el visitante pueda verlas en 3D. AdaptiveBlue trabaja la web contextual mediante ABMeta, formato que permite anotar páginas que contienen información sobre libros, música, películas, productos, restaurantes, etc…

Todas estas aproximaciones se basan en el marcado de las páginas. Y a pesar de que algunos, preocupados por la web semántica, dedican tiempo a hacerlo, la mayoría de las páginas siguen estando escritas en HTML plano.

La web contextual en navegadores

Tanto Internet Explorer como Firefox, han incorporado potencialidades de la experiencia contextual, mediante distintos tipos de atajo: Internet Explorer 8 incorpora una nueva tecnología al respecto con sus Accelerators.

Según Microsoft, Accelerators ofrece acceso a servicios online comunes, desde cualquier página que visitemos. Son pequeños trozos de variables predefinidas en XML por el propio navegador: la URL activa, el dominio activo y el texto seleccionado. La acción más común de Accelerator es la búsqueda de información contextual en base a las selecciones del usuario. Otor ejemplo típico es la búsqueda de mapas a partir de direcciones.

No se trata, en ese caso, de semántica. Los accelerators resultan aún pesados de manejar y requieren bastante tiempo e intervención del usuario. Firefox mejora el tema, con una aproximación basada en menús, ofreciendo la tecnología contextual mediante texto. Su extensión es Ubiquity, hoy sólo una extensión pero muy posiblemente característica crucial en próximas actualizaciones.

He estado probándolo esta tarde y la veremos con mayor profundidad en un próximo post, pero resumiendo, podríamos decir que devuelve mashups generados por el usuario, basándose en el lenguaje. Funciona de forma similar a los accelerators: el usuario puede seleccionar un fragmento de texto, invocar Ubiquity y escribir un comando. Existen cientos de ellos ya implementados.


Veremos en la segunda parte de esta entrada los Widgets para blogs y complementos para navegadores (Firefox). En fin…que ya os debo dos entradas ;)

¿Os he deseado ya Feliz Navidad?

CoMET: La web 3.0 es la web de las personas

| December 20th, 2008 | 3 Comments »

Tomar diversas fotografías, etiquetarlas mediante marcado semántico (el cielo, la gente, las calles, las casas) y fundirlas para crear un entorno completo de forma inteligente es una de las cosas que pude ver hace poco en Adobe MAX 2008 Milan – Sneak Peeks.

Shai Avidan, el responsable para Adobe de otra impresionante herramienta para fotocomposición, “content-aware scaling” (escalado contextual de imágenes) que ya incorpora, como vimos, Photoshop CS4 es el responsable de la historia.

Os hablo de ella sólo como ejemplo de aplicación práctica de tecnologías semánticas, complementarias a las actuales, que mejorarán la web actual.

La idea básica de la aplicación anterior como de esta es la misma, la Internet de las personas que intenté transmitir en un taller reciente acerca de web 3.0, expresada por Simon Bergweiller, compañero de Matthieu Deru en la creación del proyecto CoMET en el Advanced Tangible Interface Lab (centro de investigación Alemán para la inteligencia artificial), en los siguientes términos:

“Las operaciones complejas deben estar ocultas. Son gestos simples del usuario los que permiten interactuar con la complejidad de las bases de datos de la Web 3.0, sin necesidad de conocer los complejos lenguajes de programación de base.”

Dicho en otros términos, la idea es que las cosas en internet, descritas de forma más completa, pueden ser entendidas por las máquinas: igual que en el ejemplo anterior, la inteligencia artificial generada por ordenadores y redes cada vez más potentes, puede representar importantes avances en usabilidad, en mejora de la experiencia del usuario.

Su kiosko o espacio interactivo compartido sería buen ejemplo de ello:

CoMET es un nuevo terminal creativo de intercambio que permite interactuar con objetos anotados de forma semántica.

En definitiva, se trata de un quiosco virtual experimental basado en un iPhone y un puntero que permite arrastrar iconos a través de la pantalla táctil.

Los MP3 que contiene son “cosas”, objetos traducidos al lenguaje de la máquina (etiquetas ID3) con información sobre el álbum y el artista. Un círculo alrededor de cada uno nos devuelve un listado automático de canciones, ordenadas por género, artículo o artista.

Cerca de la pantalla, varios “spotlets,” agentes inteligentes que permiten interactuar de distintas formas con los objetos, pueden reproducir MP3 o buscar en Youtube vídeos relacionados bajo un mismo criterio.

Veremos pronto la versión web de la aplicación, así como la ampliación de las modalidades de interacción con la herramienta a instrucciones verbales (reconocimiento de voz)

Imaginad las implicaciones del tema para entornos de entretenimiento doméstico…pudiendo hablar con el televisor para obtener objetos multimedia relativos a lo que estamos viendo…

Con solo un poco más de imaginación podemos ampiar el ejemplo a la Internet de las cosas: los componentes de cualquier mecanismo (un coche, por ejemplo) podrían estar dotados de antenas RFID que contengan información del producto e interactuen con el ordenador o “quiosco” para proveernos de detalles técnicos…

Fuente: Making sense of the ‘semantic Web’

Presentación: Construyendo entre todos la web semántica.

| December 11th, 2008 | 11 Comments »

Os dejo una presentación en la que he estado trabajando durante los últimos días y que será la base del taller que impartiré mañana en Alicante.

La idea es mostrar la parte útil, a la que todos podemos contribuir, de la semweb. Está pensado para ser el punto de partida hacia muchos otros recursos, así que los enlaces (estratégicamente situados lo más al centro posible de la presentación, la única forma de que funcionen ;) ) os llevaran a otros recursos y artículos.

He dudado y descartado, por tamaño, el formato de multipresentación de Slideshare (podéis ver un ejemplo en la zona “Videoteca”).

En fin…la presentación: Read More