Posts Tagged ‘kumo’

La web semántica, con Kumo y Google, un poco más cerca

dolors reig | May 22nd, 2009 | 13 Comments »

Trasladaba la información hace un tiempo, entrevistada para una revista acerca del desarrollo de la semweb: “queda muy poco para que podamos considerarla una realidad”

Pues bien, no con Wolfram Alpha, que ya veíamos cómo no parece trabajar con algoritmos semánticos, sinó a través de los grandes de la web: Microsoft, con un Kumo inminente y Google con la intención de no  quedarse atrás:

Les decía entonces:

“Powerset será el germen del nuevo buscador semántico de Microsoft y su éxito determinará el tiempo de implantación de la Web 3.0. “La Web semántica es el futuro y será una realidad a medio plazo. Llegará antes si Microsoft mantiene su apuesta por lanzar un buscador semántico basado en las normas de W3C, porque en cuanto Google tenga una dura competencia incluirá la normativa semántica. Hace falta el empuje de una empresa con la fuerza de Microsoft para lograrlo”

Está teniendo lugar estos días Innovacamp Mediterránea. (#ICM09). Mi intervención, mañana a las 17:20, tratará sobre la web 3.0 (aquí la presentación básica: la tercera década de la web), así que trasladaré allí algunos de los siguientes argumentos:

“Será complejo y caro convertir los algoritmos matemáticos base de toda la información de Internet a lenguaje semántico. Hay trillones de páginas en Internet y los expertos evalúan que en su traducción se podría llegar a cuadruplicar el tiempo necesario para hacer una web. Los primeros pasos se dieron hace 5 años, y su crecimiento es lento.”

“La tecnología semántica es, sobre todo, utilizada por pequeñas empresas que hacen desarrollos puntuales para organismos y grandes firmas. Suelen centrarse en la atención de consultas públicas, como los muñecos robots de atención al cliente de la web de Grupo Vodafone o el servicio de ayuda para buscar información de Tata.  Buscadores como Yahoo y Mozilla o Wikipedia incorporan, poco a poco, tecnología semántica.”

semantica broma

Google ha decidido desmarcarse de esta evolución y no se pronuncia sobre la Web semántica, “porque no es un tema que tenga que ver con nosotros”, asegura un portavoz. El buscador, que tiene más del 73% del mercado mundial (corrijo el dato que la revista publica), utiliza tecnología semántica en una pequeña parte de la realización de sus búsquedas, pero no es la normalizada por W3C. Oficialmente no piensa en una evolución hacia la Web semántica”

“Así, el mismo Berners-Lee ha dicho que Google podría ser reemplazado como líder supremo de Internet por otra compañía que utilice la Web semántica, a pesar de haber desarrollado un método muy eficaz de búsqueda que le ha posicionado como líder:

La pelota está ahora en el tejado de Microsoft. El gigante de software para ordenadores se prepara para librar la batalla por Internet, imprescindible para mantener su dimensión empresarial a largo plazo. En unos años, los ingresos de las empresas de TI y telecomunicaciones procederán de los servicios y la publicidad movida en Internet, porque todos los terminales serán meras ventanas asomadas a la Red. Y quien domine las búsquedas dominará el mercado publicitario, porque el 54% de las compras se inician en buscadores, frente a un 30% que van directamente a la página del servicio o la tienda. El éxito del navegador de Microsoft, Explorer, es incontestable y ronda la mitad del mercado en las economías occidentales, pero su buscador LiveSearch no despega y apenas alcanza el 9% de las búsquedas estadounidenses, porcentaje que baja en otros países.

En julio pagó unos 100 millones de dólares por Powerset, buscador semántico base en Wikipedia. “Microsoft cree en la búsqueda semántica y vimos que la tecnología de Powerset era muy buena y desarrollada de acuerdo a la normativa de W3C. Apostamos por la Web semántica, y estamos viendo cómo exportar esta tecnología a  la www (corrijo tb)”.

En fin…que Kumo, el nombre previsto para el lanzamiento, saldrá en pocas semanas al mercado. Lo confirmo leyendo un artículo en La Cofa:

“Parece que Google se ha dado cuenta que la competencia apremia…

Como en otras ocasiones Google no quiere perder su posición innovadora y según ha indicado apuesta fuerte por las soluciones semánticas. Así este martes acaba de anunciar varias nuevas funcionalidades como:

  • Rich Snippets: Permite obtener un resumen de información sobre un término de búsqueda para que el usuario pueda de un vistazo hacerse una idea general. Por ejemplo si un usario teclea el nombre de un restaurante, el buscador podrá mostrar opiniones de usuarios, clasificaciones… Para ello se basa en la utilización de RDFa y Microformatos.
  • Google Squared: Que permite (de forma similar a Wolfram Alpha, añado) obtener de las consultas información estructurada y presentarla en formato tabla de datos.
  • Google Search Options: Incorpora opciones de búsqueda que en algunos casos parecen tener un fundamento semántico como la representación gráfica de términos semánticos, identificar si una entrada es una opinión, y hasta destacar el texto que recoge el sentimiento del autor.”

Kumo, Kumo, Kumo…(Actualización 25/5: Bing, Bing, Bing….;)) creo que vamos a quedar tan saturados del término como del de Wolfram Alpha en breve…. para que luego digan que el de “web 2.0″ cansa ;)

Fuente imagen.

Artículos en El caparazón sobre web semántica



Usabilidad y ontologías: Nuevo paso en la evolución de la semweb de la mano de Twine

dolors reig | March 19th, 2009 | No Comments »

Me entrevistaban el otro día acerca de la web 3.0, la web semántica y me resultaba difícil, a pesar de la experiencia en varios talleres sobre el tema, acercarla al usuario sin mencionar la primera aplicación que se ha encargado de ello: Twine.

Quería dejaros, además de la noticia sobre este nuevo e importante desarrollo, algunas de las cosas que les comentaba:

Sobre si hay empresas trabajando hoy en la construcción o desarrollo de la web 3.0….

“Muchas empresas trabajan para la web semántica y pueden forzar a Google (elemento imprescindile para convertirla en “mainstream”) a reconocer que la adopta o adoptarla en algunos puntos.  Twine, una aplicación que está haciendo de algún modo de puente hacia esta (ya es casi tan popular como delicious), está a punto de lanzar un servicio para hacer más fácil la escritura de datos semánticos (ontologías). Otras empresas como Hakia o Yahoo llevan ya tiempo incorporando todo esto a su buscador…. y Kumo, el nuevo buscador que lanzará este año Microsoft y que puede suponer una seria competencia para Google, adoptará, además de mecanismos propios de la búsqueda vertical y sintáctica, elementos de la semweb.”

Sobre si la web semántica sustituye a la actual….

“La web semántica es una capa añadida a la web actual, no la sustituye. Añade significado visible a los buscadores que mejora la eficiencia, la experiencia de usuario de la web, pero en cuanto a lo formal, el diseño de lo que vemos actualmente no va a cambiar demasiado.”

Sobre el porqué de la no adopción o la adopción partcial por parte de algunos buscadores, de la semweb:

“La construcción de ontologías (lenguajes, algoritmos que dirían a los ordenadores cuándo una cosa es un lugar, una persona, un evento, una organización, qué relaciones tiene con otras cosas, qué componentes la integran, etc…) es compleja y no existe hoy ningún buscador que pueda ser demasiado preciso en todos los ámbitos de conocimiento. Mientras no estén desarrolladas todas las ontologías, tendrán que combinar, como lo hará Microsoft, distintos sistemas.”

Como idea general, es una web más eficiente, más adaptada a nuestro lenguaje natural como humanos, más independiente de nosotros. (Tenéis en Presentación: Construyendo entre todos la web semántica. un buen tutorial básico para su comprensión)


Pero vayamos a la noticia que ha motivado este post: Twine, que parece que está creciendo hasta el punto de aproximarse a la popularidad de delicious, prepara una herramienta “usable” para la creación de ontologías, base para asegurar la eficiencia de la web semántica.

Hemos escrito mucho aquí acerca de Twine. Su bookmarklet, que acaba de mejorar, quizás sea su característica más popular. Con un solo click en páginas con microformatos adecuados (u otros marcadores semánticos) se etiquetan de forma automática los contenidos, clasificando Twine cada concepto clave según sean personas, lugares y otros tipos de información para mejorar su eficiencia como portal de búsquedas y recomendaciones afines a nuestros intereses.

El ahorro de tiempo y la precisión (en inglés) suponen, respecto a Delicious, una importante ventaja y así parecemos haberlo valorado los usuarios:

Según Nova Spivack en RWW, Twine, si sigue creciendo al ritmo actual, habrá sobrepasado a Delicious, una de las herramientas fundamentales de la web 2.0 en verano de este mismo 2009.

Sobre la nueva aplicación, que será lanzada, previsiblemente, este año, es destacable que se lanzará con licencia Open Source, así como que las ontologías creadas no trabajarán únicamente en Twine sinó que podrán ser utilizadas por cualquier aplicación.


ontologysite

La complejidad, el trabajo que supone crear ontologías (según Wikipedia son la formulación de exhaustivos y rigurosos esquemas conceptuales dentro de uno o varios dominios dados con la finalidad de facilitar la comunicación y la compartición de la información entre diferentes sistemas y entidades), hace que a día de hoy sean aún pocas las creadas, la mayoría en temas de tecnología)

La dificultad de semantización de los contenidos es, como veíamos, uno de los principales argumentos de Google para la no implantación de tecnologías semánticas en su buscador. Así, herramientas usables para crearlas podrian cambiar de forma radical este escenario, suponiendo un paso importante en la evolución de la web semántica.

No será la primera en ese sentido: Protege o CmapTools Ontology editor, que parte de la idea de los mapas conceptuales para ayudar a la edición de ontologías llevan tiempo trabajando. También Microsoft, que parece que apuesta desde hace tiempo como ventaja estratégica por la web semántica, anunciaba hace poco un nuevo complemento de semantización para Word 2007 que permite a los autores anotar palabras o frases con términos definidos en ontologías externas.

Pero si esta promesa de Twine es capaz de trabajar de forma tan intensa por la usabilidad como lo ha hecho la firma hasta hora con su aplicación para redes de interés, creo que puede acelerar de forma significativa la evolución de la web.

Os dejo, para finalizar, el usuario de El caparazón en Twine.