Posts Tagged ‘powerset’

La web semántica, con Kumo y Google, un poco más cerca

| May 22nd, 2009 | 13 Comments »

Trasladaba la información hace un tiempo, entrevistada para una revista acerca del desarrollo de la semweb: “queda muy poco para que podamos considerarla una realidad”

Pues bien, no con Wolfram Alpha, que ya veíamos cómo no parece trabajar con algoritmos semánticos, sinó a través de los grandes de la web: Microsoft, con un Kumo inminente y Google con la intención de no  quedarse atrás:

Les decía entonces:

“Powerset será el germen del nuevo buscador semántico de Microsoft y su éxito determinará el tiempo de implantación de la Web 3.0. “La Web semántica es el futuro y será una realidad a medio plazo. Llegará antes si Microsoft mantiene su apuesta por lanzar un buscador semántico basado en las normas de W3C, porque en cuanto Google tenga una dura competencia incluirá la normativa semántica. Hace falta el empuje de una empresa con la fuerza de Microsoft para lograrlo”

Está teniendo lugar estos días Innovacamp Mediterránea. (#ICM09). Mi intervención, mañana a las 17:20, tratará sobre la web 3.0 (aquí la presentación básica: la tercera década de la web), así que trasladaré allí algunos de los siguientes argumentos:

“Será complejo y caro convertir los algoritmos matemáticos base de toda la información de Internet a lenguaje semántico. Hay trillones de páginas en Internet y los expertos evalúan que en su traducción se podría llegar a cuadruplicar el tiempo necesario para hacer una web. Los primeros pasos se dieron hace 5 años, y su crecimiento es lento.”

“La tecnología semántica es, sobre todo, utilizada por pequeñas empresas que hacen desarrollos puntuales para organismos y grandes firmas. Suelen centrarse en la atención de consultas públicas, como los muñecos robots de atención al cliente de la web de Grupo Vodafone o el servicio de ayuda para buscar información de Tata.  Buscadores como Yahoo y Mozilla o Wikipedia incorporan, poco a poco, tecnología semántica.”

semantica broma

Google ha decidido desmarcarse de esta evolución y no se pronuncia sobre la Web semántica, “porque no es un tema que tenga que ver con nosotros”, asegura un portavoz. El buscador, que tiene más del 73% del mercado mundial (corrijo el dato que la revista publica), utiliza tecnología semántica en una pequeña parte de la realización de sus búsquedas, pero no es la normalizada por W3C. Oficialmente no piensa en una evolución hacia la Web semántica”

“Así, el mismo Berners-Lee ha dicho que Google podría ser reemplazado como líder supremo de Internet por otra compañía que utilice la Web semántica, a pesar de haber desarrollado un método muy eficaz de búsqueda que le ha posicionado como líder:

La pelota está ahora en el tejado de Microsoft. El gigante de software para ordenadores se prepara para librar la batalla por Internet, imprescindible para mantener su dimensión empresarial a largo plazo. En unos años, los ingresos de las empresas de TI y telecomunicaciones procederán de los servicios y la publicidad movida en Internet, porque todos los terminales serán meras ventanas asomadas a la Red. Y quien domine las búsquedas dominará el mercado publicitario, porque el 54% de las compras se inician en buscadores, frente a un 30% que van directamente a la página del servicio o la tienda. El éxito del navegador de Microsoft, Explorer, es incontestable y ronda la mitad del mercado en las economías occidentales, pero su buscador LiveSearch no despega y apenas alcanza el 9% de las búsquedas estadounidenses, porcentaje que baja en otros países.

En julio pagó unos 100 millones de dólares por Powerset, buscador semántico base en Wikipedia. “Microsoft cree en la búsqueda semántica y vimos que la tecnología de Powerset era muy buena y desarrollada de acuerdo a la normativa de W3C. Apostamos por la Web semántica, y estamos viendo cómo exportar esta tecnología a  la www (corrijo tb)”.

En fin…que Kumo, el nombre previsto para el lanzamiento, saldrá en pocas semanas al mercado. Lo confirmo leyendo un artículo en La Cofa:

“Parece que Google se ha dado cuenta que la competencia apremia…

Como en otras ocasiones Google no quiere perder su posición innovadora y según ha indicado apuesta fuerte por las soluciones semánticas. Así este martes acaba de anunciar varias nuevas funcionalidades como:

  • Rich Snippets: Permite obtener un resumen de información sobre un término de búsqueda para que el usuario pueda de un vistazo hacerse una idea general. Por ejemplo si un usario teclea el nombre de un restaurante, el buscador podrá mostrar opiniones de usuarios, clasificaciones… Para ello se basa en la utilización de RDFa y Microformatos.
  • Google Squared: Que permite (de forma similar a Wolfram Alpha, añado) obtener de las consultas información estructurada y presentarla en formato tabla de datos.
  • Google Search Options: Incorpora opciones de búsqueda que en algunos casos parecen tener un fundamento semántico como la representación gráfica de términos semánticos, identificar si una entrada es una opinión, y hasta destacar el texto que recoge el sentimiento del autor.”

Kumo, Kumo, Kumo…(Actualización 25/5: Bing, Bing, Bing….;)) creo que vamos a quedar tan saturados del término como del de Wolfram Alpha en breve…. para que luego digan que el de “web 2.0″ cansa ;)

Fuente imagen.

Artículos en El caparazón sobre web semántica

Obreros de la web 3.0

| September 19th, 2008 | 2 Comments »

Corren tiempos de crisis. Aunque las grandes conferencias internacionales, ni la DEMOfall ni la Techcrunch50 parezcan darse cuenta. ¿O es que tal vez los modelos de negocio que basan la web 2.0 son diferentes de lo que conocemos para las empresas tradicionales? ¿Qué cuesta, quién construye, quien invierte en la web 3.0? ¿A cambio de qué?

Hablaremos en este post de algunas de estas cuestiones:

Estamos acostumbrados a la aparcición de nuevas startups, que siguiendo el ejemplo de la recientemente adquirida por Microsoft, Powerset, están trabajando en el alojamiento de repositorios de metadatos a los que contribuimos los usuarios a cambio de servicios de mayor o menor calidad.

Como ocurre para la web 2.0, son los datos cuantitativos, el volumen de contenidos que enviamos a los distintos servicios más o menos sofisticados en lo cualitativo, los que han estado construyendo la sociedad de la información, el inmenso negocio actual de la web.

(Me gusta referirme a la web 1.0, a la evolución social que supone la web 2.0 como sociedad de la información y pensar en la web 3.0 como sociedad ideal del conocimiento organizado. Hablaremos en otro momento de lo poco popular que resulta el término semántico)

Así, en lo 2.0 o en la lenta evolución que vivimos hacia lo 3.0, una empresa de calidad deberá ofrecer experiencias de usuario que motiven nuestra contribución a su aplicación. Y eso en dos sentidos:

  • Haciendo agradable, fácil, usable, su interface.
  • Ofreciéndonos amplios servicios y ciertos derechos sobre nuestros datos (facilidades en la     adquisición de nuevos conocimientos, mejores búsquedas, contactos, relaciones sociales, en algunos casos, como Knol, algo de dinero, etc…)

Este es el motivo, como bien explica un reciente y productivo contacto, Greg Boutin,  por el que las grandes compañías de lo semántico nos facilitan la tarea de etiquetar contenidos, manteniendo la propiedad sobre los mismos.

Puede leerse en los términos de uso de Twine , OpenCalais (la empresa de Reuters), la metaweb de Freebase, DapperUptake, una de las primeras redes horizontales (temáticas) semánticas dedicada a los viajes, la típica sentencia, en distintas variantes:

Mediante la aportación o generación de metadatos a este servico, los usuarios otorgan derechos no exclusivos, perpétuos y subrogables (que pueden ser vendidos a otra empresa), sobre los mismos a la empresa propietaria”

Estamos hablando, en otros términos, de que en 2007 habíamos cedido a Radar Networks, la empresa responsable de Twine, más de 300,000 conceptos, a los que su aplicación ha incorporado metadatos. O del valor que durante años han ido aportando los usuarios a Powerset, que como ya hemos comentado, ha resultado ser bastante rentable. Como ejemplo paradigmático, Facebook, el jardín vallado más rentable de la web 2.0 , tiene ya un valor en el mercado de 15 billones de dólares.

No todas las empresas de lo semántico trabajan de este modo. No parece que Zemanta o AdaptiveBlue, empresas de similar calidad en lo tecnológico, estén adquiriendo el mismo valor en base a recoger nuestras aportaciones. Y eso les resta potencial en un futuro no demasiado lejano. Si, como comenta Greg, estas empresas implementaran algún sistema de feedback por parte de los usuarios, logrando construir un repositorio semántico fuerte, su valor se incrementaría de forma drástica.

Es, como decíamos al principio, más que nunca, el usuario, el que va construyendo, día a día, la nueva web. Veremos cual es la retibución…

Relacionados:

Creating metadata: a task for humans or machines?
Planeta de noticias web semántica. (English/Spanish)

La web semántica no interesa ni a Google ni a Microsoft

| July 14th, 2008 | 2 Comments »

Hay quien cree que la batalla de Microsoft, sus desesperados intentos de competir con Google en el mercado publicitario (y su principal herramienta, las búsquedas en la web) acabaron.

Incluso en mi caso, defendí hace un tiempo, en base a la lectura de distintos análisis que el futuro, nada atractivo en mi opinión dibujaba un escenario de alianza Microsoft-Yahoo-Facebook contra un Google obligado a planear estrategias competitivas. Parece complicado, a la vista de las distintas filosofías de empresa, incluso de los hechos que hemos estado leyendo sobre la resistencia de Yahoo a los distintos embates económicos de Microsoft, seguir defendiéndolo.

Pero hace ya tiempo que creo que las ideologías, las filosofías son algo perfectamente moldeable y que lo que de verdad importa son cosas menos abstractas, como el poder o el capital.

De hecho, de hace pocos días son los rumores sobre el descontento de los accionistas de Yahoo con un equipo directivo que intenta defender sus posiciones sin argumentos económicos. Y es cuestión de semanas que el tema, con un cambio en el mismo, sea distinto.

Así que no me sorprende seguir leyendo argumentos en favor del primer escenario: La compra de Powerset por parte de Microsoft podría ser un paso, no hacia la web semántica sinó hacia el hundimiento definitivo y posterior adquisición por parte de Microsoft de Yahoo.

Nos lo cuenta Yihon Ding en su blog: The Secret behind Powerset Acquisition: Nadie, ni Google ni Microsoft, están por la web semántica, que parece lo que en términos ajedrecísticos se conoce por un gambito en el tablero de la lucha por el mercado de la red. El peón, la herramienta a sacrificar, ha sido en este caso PowerSet.

Powerset es una empresa joven, pública desde mayo de este mismo año, muy prometedora pero que, consciente de las pocas posibilidades que deja Google, de su escaso potencial “real” ante un escenario infinitamente más económicamente voraz que filantrópico o dicho de otro modo, sintiéndose incapaz de copar la diversidad de la web con su tecnología (wikipedia, entorno en el que ya trabaja, es infinitamente más homogénea y controlable que la web en su conjunto), se ha vendido por el escaso, según los analistas, precio de 100 millones de dólares.

SearchMonkey, también con tecnología semántica, es la última estrategia de supervivencia de Yahoo, a pesar de tener difíciles posibilidades de éxito cuando depende desde hace unos meses de la colaboración voluntaria de desarrolladores de alrededor del mundo. Microsoft lo sabe, como también que la mejor forma de acelerar el fracaso de SearchMonkey es lanzar un servicio competitivo en el ámbito semántico, único valor añadido de Yahoo como buscador sobre el omnipotente Google.

Por otra parte, Google no cree en la web semántica, como ha declarado en ocasiones con argumentos que van contra el usuario, contra el webmaster que, de forma muy resumida, sería demasiado torpe, si ya comete fallos con el html, como para construir páginas correctas siguiendo los más complicados estándares de la semweb. Sería también demasiado mentiroso: tal y como existen trucos actuales para falsear el Pagerank, aparecerían pronto trucos para posicionar mejor en la web semántica. Este tipo de argumentos han sido englobados en un discurso denominado “The Satanic web”.

semantic web improved

No sé a vosotros pero no me parecen excusas demasiado elaboradas y pueden ser argumentos fácilmente positivizados adoptando la “Romantic web” que sin duda prefiero.

Tampoco está claro que Microsoft esté interesado realmente en la web semántica. Entre los argumentos que se han aventurado sobre los motivos de la adquisición del buscador está el improbable de que intente integrar Powerset en su explorador para competir en el mercado de las búsquedas por el simple motivo de aparecer como página de inicio predeterminada.

O que quiera potenciar su predominio en la empresa, aplicando las tecnologías semánticas a intranets o sistemas de b2b (comercio electrónico entre empresas), susceptibles de ser mejorados tecnologías aún en desarrollo como Powerset.

Lo más probable, no obstante, es que se trate de una ofensiva indirecta cuya víctimas son Yahoo, objetivo final de la batalla y la “pobre” web semántica, que no tiene posibilidades de sobrevivir ni siquiera como caballo de batalla o valor añadido hacia una red mejor.

Leía esta mañana otra vez a Jesús Conde hablando de la Socialización de la creación en Second Life con su tradicional y ya visionaria visión optimista. Internet es un coto difícil de controlar. Y no está de moda hablar de opciones políticas en estos tiempos difíciles para la lírica, pero quizás va siendo hora de que seamos los usuarios los que, haciendo un uso intensivo de la misma, contribuyamos a construir esta nueva web más natural.

Aplicaciones como la ya tradicional Twine, Iminta o Genome parecen prestarnos soporte para ello.

Si Google decidiera (a pesar de las pérdidas económicas que a corto plazo podría suponerle) cambiar los actuales algoritmos por criterios semánticos, simplemente los webmasters se esforzarían en cumplir, como lo hacen ahora, otros estándares. Lo mismo con los trucos.

No nos faltará la ayuda del organismo creado para la defensa de la integridad y evolución de la red, el W3C, que recientemente ha aprobado un primer borrador de estándares semánticos (POWDER).

El declive de Google o el discurso actual en EEUU (Semtech 2008)

| May 25th, 2008 | 1 Comment »
SDForum Semantic Web SIG panel discussion at SemTech08

Image by captsolo via Flickr

Recomendaba hace poco en del.icio.us un artículo de Joaquin Borrego, experto en Inteligencia Artificial en el que nos hablaba de cómo, mientras en europa seguimos discutiendo sobre la viabilidad económica de la web2.0, Silicon Valley se preocupa ya de la utilización masiva (y con valor añadido) de tecnología de la Web Semántica.

Otro dato interesante que puede acercarnos al nuevo zeitgeist (interesante palabra: “el espíritu de los tiempos…”) es la aparición, últimamente, de artículos por parte de Google que explican-justifican los esfuerzos que requiere su funcionamiento (no olvidemos la alianza de Powerset con wikipedia o que el gran competidor y posible aliado futuro de Microsoft es Yahoo, un buscador que ya incorpora algoritmos o fórmulas semánticas)

También Tim Berners Lee, uno de los padres hablaba sobre cómo Google podría ser fácilmente superado por la web semántica y sus estándares universales en un plazo máximo de 50 años.

Esta misma mañana leía, también, en un post de Genís Roca, otro interesante discurso crítico hacia el fracaso-burbuja de la web2.0 centrado en su falta de implantación-posibilidades de rentabilización en el entorno empresarial.

Quizás hayamos aprendido la lección y esa es precisamente la intención principal del reciente SemTech 2008 Conference que finalizó estos últimos días: plantear, a priori y con respecto a la web3.0 las estrategias de rentabilización y de popularización que pueden garantizar su supervivencia.

Han participado, entre otros, Radar Networks, la empresa responsable de Twine, Powerset, Calais (Reuters) o AdaptiveBlue (podéis consultar un buen listado de empresas e ideas principales en Deliberate ambiguity)

¿Estamos preparados para ir un poco más allá?

Me comentaba hace poco un lector la poca implantación que podía tener la temática sobre web semántica o web3.0 entre personas que a duras penas conocen los principales recursos de polémica ya web2.0. Ese sería uno de los problemas que, de forma precoz, habría que abordar:

Hay que simplificar el mensaje para el público general. La gente no tiene porqué saber sobre cuestiones demasiado técnicas, como RDF o microformatos. Lo que buscan son beneficios tangibles en términos de mejorar sus espacios o hacer más satisfactoria su experiencia en la web.

Se proponen nuevos términos, más comprensibles, como el de web inteligente en la que podemos encontrar cosas de forma más rápida y experiementar interacciones más inteligentes, contextuales y apoyadas por la gran suma de información existente en la web. Mejorar las interfaces de interacción con el usuario es la mejor estrategia de márketing para la web semántica.

En cuanto a herramientas, se busca la “killer app” o aplicación estrella actual de semantización, capaz incluso de desbancar a google:

Twine es una herramienta prometedora (lo veremos pronto en otro post) , con importantes desarrollos previstos en otoño de este año, pero parece que el que mayores posibilidades para inversores posee en la actualidad es Powerset, el reciente buscador de wikipedia.


Reblog this post [with Zemanta]