Posts Tagged ‘google_futuro’

¿Google se está abriendo algo a la web semántica?

| January 7th, 2009 | No Comments »

Resultaba extraño que después de la adquisición de Powerset por parte de Microsoft, y a pesar de las múltiples manifestaciones de desconfianza hacia esa nueva forma de entender y codificar la web, Google se auto situara al margen de la evolución.

Fue una de las preguntas y reflexiones más interesantes de las que surgieron durante el último taller sobre web semántica que realicé:

-¿Y Google no está incorporando algoritmos semánticos? Mi respuesta se ve confirmada por lo datos que nos reportan hoy desde RWW. Quizás no de forma manifiesta pero difícilmente no existan en Google experimentos ni equipos de trabajo trabajando al respecto, digan lo que digan en comunicados oficiales.

Así, parece que los ejemplos comparativos que utilizábamos al comparar la vieja y la “nueva” forma de entender la web, la web semántica, van a dejar de sernos útiles: Desde hace poco, las búsquedas sobre fechas de nacimiento, conexiones familiares y otros tipos de información relacionada obtienen resultados en información estructrurada de forma explícitamente semántica. Preguntas como Who is Bill Clinton’s wife? What’s the capital city of France? obtienen resultados en forma de sujeto-predicado-objeto, o “tripletes” en términos semánticos.

Y las respuestas no están estructuradas de ese modo en las páginas de las que provienen. Parece, más bien, que Google crea estructura semántica desde datos semiestructurados o no estructurados (no marcados semánticamente) en absoluto. Dicho de otro modo, los resultados no son sólo de Freebase o Wikipedia, que los presentan estructrados, sinó de otros sitios que no trabajan con “tripletes” (sujeto-predicado-objeto, lenguaje RDF)

what-is-the-city-capital-of-france-buscar-con-google_1231356042557

Parece que los resultados son similares a los que devolvía hace unos tres años un viejo programa de Google, Direct Answers, aunque sus resultados eran mucho menos precisos.

No está claro que Google esté creando datos estructurados en páginas que no los contenían. Sería un error concluir en que se están realizando análisis semánticos sólo porque algunos de los resultados reportados aparecen en la forma sujeto-predicado-objeto (base del lenguaje semántico RDF), pero está claro que aparecen, son extraídos de páginas que a priori no siempre los contienen.

A la espera de tener más información, deciros que no llega a la precisión de Yahoo, que lleva tiempo trabajando con algoritmos semánticos. Además, el hecho de que Google no aporte datos RDF sobre las páginas, resta utilidad a la supuesta mejora en términos de su posible aprovechamiento por parte de terceras aplicaciones.

No es fácil la creación de datos estructurados a partir de cero, a pesar de que supondría una base común que permitiría innovar en mayor medida que la web común actual.

Terminar este artículo planteando un posible escenario. ¿Y si Microsoft adquiriera finalmente a Yahoo? La tecnología de Powerset y la de Yahoo juntas, por no hablar de la potencia de la imagen de una unión de marcas como esa….¿No sería quizás entonces el tema semántico un posible valor diferencial lo suficientemente fuerte como para resultar competencia para quien parece estar decidiendo a espaldas de estándares y del interés común la web del futuro?

Me gustaría dejaros algunas reflexiones más, derivadas de la discusión surgida entorno a este dato:  resulta extraño, de entrada, que una compañía que se auto define como abierta y transparente no responda claramente sobre este tipo de cuestiones. Es posible, como argumentan algunos, que Google esté experimentando cosas de forma contínua, llevando a cabo unos 50 a 200 experimentos a la vez, lo cual explicaría la “¿imposibilidad?” de hablar públicamente de todos ellos.

En fin… os mantendré informados.

Relacionados:

Google social o los futuros vicios de la web

| July 19th, 2008 | 2 Comments »

Decía el discurso hace año y medio, aproximadamente, que no existía una única blogosfera, sinó infinitas, distribuidas y sin protagonistas claros. Era una utopía, sigue siendo una utopía. Entre otras cosas porque los resultados de Google, el centro indiscutible de internet, siguen siendo los que son, favoreciendo la popularidad y haciendo difícil la selección por parte del usuario de informaciones u opiniones más allá de una treintena de blogs americanos y una docena de los mismos en nuestro idioma.

Por otra parte, seguro que os habréis preguntado alguna vez hasta donde llega la importancia del mercado de los buscadores. Me sorprendía leer esta mañana cómo, según estudios recientes, mucha gente aún realiza sus búsquedas desde el buscador, aún sabiendo las URL. Sería, por poner un ejemplo, introducir youtube.com en la barra de Google para ir a youtube, en lugar de escribir la url en la barra de navegación. Según usuarios ocasionales, es más fácil y te evitas confusiones con los .com, .net, etc…, cierto o no, es lo que argumentan.

Comentábamos hace poco que Google no está por la web semántica. ¿Por dónde irá entonces el futuro del mercado más rentable de la web? ¿nos ofrecerán al fin sistemas de búsqueda capaces de reforzar la blogosfera múltiple, de hacer más relevantes a nuestros intereses lo que vamos encontrando, de evitar las páginas de spam (splogs) o de evitar que “aterricemos” por error en páginas de phishing que pongan en peligro nuestra seguridad y cuenta corriente?

Florecen últimamente las startups que acotan nuestras búsquedas a las redes sociales que frecuentamos: Sightix.com, Delver o la creciente importancia de las búsquedas en Friendfeed serían ejemplos claros de ello que muy posiblemente desaparezcan en cuanto Google adopte de forma masiva los cambios en ese sentido que parece que ya está anuciando:

Una de las opciones más probables deriva de la adopción de la tecnología de Digg, un sistema “humanizado” que está probando, por el cual los usuarios podrán votar, penalizar o comentar los resultados:


Así, además de poder seleccionar en base a puntuaciones (positivas y negativas), podremos incluso eliminar de nuestras futuras búsquedas los enlaces que consideremos oportuno.

La idea, sinceramente ingénua, puede hacernos pensar que Google está intentando convertirse en un buscador realmente social y abierto. Jimmy Wales, responsable del proyecto Wikia Search, el primer buscador humano “de código abierto, transparente y colaborativo lo valora así:

“Las funcionalidades ‘experimentales’ de Google son divertidas y útiles, seguro, pero lo que importa es la cultura de libertad” Para Wales, Wikia Search tiene cuatro principios (transparencia, comunidad, privacidad y calidad), y con estos cambios Google solamente abordaría uno de ellos, el de la calidad de las búsquedas que ahora supuestamente podrían modificar directamente los usuarios.

Pero los otros tres principios siguen, según Wales, olvidados por Google. Asegura que “no hay sentido de Comunidad”, bromea sobre un posible interés de Google por la privacidad, y critica que el algoritmo de Google esté “bajo candado” para impedir toda transparencia en cómo ordena los resultados.

Sea como sea, creo que el mayor peligro de todo esto está en el último enlace que podéis ver en esta imagen: la posibilidad de eliminar resultados, que aseguran que harán constar en el cálculo de los futuros Page Rank:

Algunos hablan de meritocracia, otros, simplemente, de excesiva fe en las buenas intenciones del ser humano, cuyos intereses en la calidad de los contenidos de la web pueden no ser del todo auténticos. Las recientes informaciones sobre la venta de votos en menéame (de las que me entero gracias a Antonio Ortiz en Twitter) no hace más que ponernos sobre aviso de la competitividad, el engaño, como amenazas a una “época dulce” de la web que ya toca a su fin.

Artículos relacionados