Posts Tagged ‘web semantica’

Tetherless world: La ciencia de la web

dolors reig | June 13th, 2008 | 1 Comment »

El 11 de junio en el Rensselaer Polytechnic Institute tuvo lugar un debate en el que algunas cuestiones fueron planteadas y discutidas entre los asistentes y un soporte especial a la intervención de la inteligencia colectiva desde la web.

El Rensselaer’s Tetherless World Constellation inaugura una nueva área derivada de la web semántica, la “Web Science,” o ciencia web, cuyo estudio es la World Wide Web y su futuro. Según su propia definición:

Usamos poderosas técnicas científicas y matemáticas para explorar el modelado de la web desde plataformas de red e información. La idea es hacer de web un lugar adaptado al lenguaje natural y que sea útil a fines educativos y sociales.

Algunos de los tópicos tratados en el debate son:

  • Tecnologías de la web semántica.
  • Conocimiento
  • Privacidad, control y flujo de trabajo transparente
  • Tetherless y acceso a la web móvil. (Fantástico término;) que después de consultar varias fuentes, creo que significa un mundo interconectado mediante redes inalámbricas de telefonía móvil.
  • Confianza, redes sociales y tecnologías colaborativas para la web
  • Ciber infraestructura.
  • Ontologías, evolución, gestión y uso en disciplinas diversas.
  • Aspectos éticos, políticos y sociales sobre uso y usabilidad web.

11 de junio, tetherless conference

El debate sobre el futuro de la web:

Fue un debate retransmitido online, en vivo, que se pretende que continúe, en The Rensselaer pero con alcance abierto a toda la web. Podéis encontrar el video de su versión íntegra en este webcast de casi 2 horas apoyado en diapositivas del propio evento (requiere Silverlight, complemento a instalar, pero os lo recomiendo especialmente) Presentado por Tim Berners Lee, os dejo uno de los resúmenes publicados en la red, a la espera de tener tiempo para elaborar algo más amplio:

La web semántica, ¿es un sueño?

Sí, fue la respuesta de Spivack, CEO y fundador de Radar Networks (Twine). Un sueño o problema creciente conforme crecen los contenidos en la web. Se hace más necesario aclarar (“disambiguate”) datos. El enfoque de la Inteligencia artificial da importancia al software, el de la web semántica a los datos en sí mismos. No se trata de crear software más inteligente sinó datos más inteligentes.

Existen problemas técnicos y sociales pero para algunos, simplemente, no existe alternativa, dado el crecimiento exponencial de la información en la web. Se citan alternativas, como HAL-9000, un enfoque de la inteligencia artificial que no progresa demasiado. Otra solución pasa por usar el potencial del trabajo colaborativo de la gente (“the crowd”), un enfoque prometedor pero que no parece ser suficiente. Así, se trata de un objetivo a largo plazo, un gran proyecto cultural.

El rol de la Inteligencia artificial en la web del futuro:

Nigel Shadbolt es profesor de inteligencia artificial en la Universidad de Southampton, en UK. Defiende el papel de la IA en un futuro pero en una forma muy distinta a la actual. Lo que está por venir es un aumento de la inteligencia colectiva, fragmentos de micro-inteligencia evolucionarán en un ecosistema favorable.

Web multilingüe:

Wendy Hall, profesora de la Universidad de Southampton, UK, comentó el tema de la web china, con 5 millones de páginas que google no indexa (y unos 221milllones de usuarios, más en ningún otro país del mundo, según datos recientes que he encontrado).  El chino será pronto el lenguaje dominante en la web y muchos de los datos correrán a través de teléfonos móviles. Muchos de los “sitios clave” en inglés no son accesibles, por motivos políticos, en China. La fragmentación en cuanto al idioma puede llegar a ser importante pero la solución no pasa por enseñar o imponer inglés. Así, el Web Science Lab se ha creado en China y muchos progresos están teniendo lugar en ese país.

Nigel Shadbolt apunta que las distintas culturas parten de marcos ditintos para la información (el marcado semántico de los atributos de la información será distinto según cuáles sean esos atributos. Así, por poner un ejemplo sencillo, el calendario chino, distinto de otros, tendrá que ser semantificado de forma distinta) . Nova responde que cada cultura es responsable de mapear, de representar sus contenidos en un mapa conceptual que será trasladado, junto al resto, a representaciones globales e integradoras.

Tim Berners-Lee comentó que no es tan fácil: La diversidad cultural es un tema realmente importante. Sólo un 10% del contenido web podrá ser comprensible para todos, el resto, no.

Democracia y Web

Se plantea el tema desde la audiencia: Wendy contesta que la web puede cambiar la forma en que elegimos a nuestros políticos. Un ejemplo claro es el de Obama, que ha estado haciendo un uso intensivo de las nuevas tecnologías hacia un target de gente joven que, fuera de la red, no se hubiera involucrado en política. Así, la web aumenta el grado de participación, de representación democrática. Otro ejemplo de cómo puede cambiar nuestros criterios está en los usos auto-organizativos, autónomos (en el sentido de autopoder) de Wikipedia.

Nigel alerta sobre el peligro de “cyber vigilantism”, o cibervigilancia. También sobre el peligro de la “rampant blogosphere” (entrecomillo de forma literal pero el significado parece ser blogosfera indiscriminada, similar al concepto de medios fast food de Cobo y Romaní)

Nova también menciona lo opuesto: El peligro para la democracia que puede suponer la web: La libertad está actualmente en riesgo debido a cuestiones de privacidad y registro de datos. Está por ver cómo evolucionará la cuestión.

¿Una nueva ciencia de la Web?

La ciencia de la web, con un enfoque interdisciplinar, está pensada para popularizar el estudio de la web más allá de la típica población de geeks.

Datos multi-modales: La web semántica, ¿puede captar matices?

Nova responde que se está empezando por lo más sencillo, calendarios, eventos, etc…, así que no será hasta dentro de mucho tiempo que la web pueda captar cosas como los matices de interacción humana. No se trata de reemplazar la inteligencia humana sinó de liberarla.

Nigel comenta que el comportamiento está siendo ya integrado en la web: existen sensores que interactúan con la web sobre el medio exterior. “Entornos ambientales inteligentes” es el término…

Habrá alguna innovación, algún cambio en la disciplina de La lógica?

Sobre este tema, la lógica visual precisará de innovación si la web es capaz de comprender información multimodal. Tim responde que la lógica no describe cómo piensa la gente. Es posible que no todos los datos sean susceptibles de ser convertidos en lógicos (la forma de bailar de la gente, por ejemplo, no tiene porqué ser codificada)

Nova añade que no existe en la web un equivalente a la inteligencia o MRI funcional. Más que ampliar la lógica lo que se precisará serán sensores y fórmulas matemáticas capaces de medir distintas cosas y trasladarlas a la web.

Conclusión

La cuestión final es sobre los datos, cómo validarlos y, si van a ser compartidos, cómo manejar las cuestiones sobre privacidad. Nigel apuntaba a la Wikipedia como forma de validar información, de forma autocorrectiva. Nova coincide y añade que la razón, el sentido común, también contribuirán a la validación de los datos.



La moda de lo semántico. ¿Qué significa semántico? ¿Qué forma parte de la web semántica?

dolors reig | May 15th, 2008 | 4 Comments »

Nova Spivack, Radar NetworksImage by dfarber via Flickr Leemos titulares, en ocasiones, ambiciosos con respecto a la llegada de determinadas herramientas de la web semántica. Un comentario a la última entrada sobre Twine expresaba ayer ciertas dudas sobre mi definición de la herramienta como la “Primera red social que utiliza tecnologías semánticas”.

Gracias al reciente Planeta Semántico de artículos en español sobre el tema descubro hoy la aclaración de Nova Spivack, CEO de Radar Networks, la compañía responsable de Twine, al respecto de la diferencia entre “semántico” y “web semántica”, en un breve post en el que clarifica acertadamente el significado del término. Traduzco su aclaraciones:

“Está de moda hoy etiquetar cada nueva aplicación como “semántica” pero, qué significa realmente eso? ¿Son todas las herramientas semánticas parte de la web semántica? ¿Cual es el criterio para que algo sea considerado semántico? ¿Significa que algo sea semántico que forma parte de la web semántica?
Se trata de algo realmente simple. Cualquier aplicación que puede entender el lenguaje hasta cierto punto puede ser etiquetada como semántica. Incluso Google es, en cierta medida, una aplicación semántica bajo esos criterios. Es una cuestión de grado: Powerset (aclaro que es la tecnología de buscador que acaba de incorporar wikipedia) es más semántico que Google, por ejemplo, porque entiende en mayor medida el lenguaje natural y no sólo en el sentido de palabras clave.

Para que cualquier aplicación pueda ser considerada parte de la “Web semántica” debe soportar una serie de estándares definidos por el W3C, incluyendo por lo menos el lenguaje de marcado RDF, y de forma potencial, también OWL y SPARQL. Estas son tecnologías que de forma colectiva componen la web semántica. Soportarlas o hacerse compatibles con ellas significa, por lo menos, hacer algunos datos visibles a aplicaciones externas.

No estoy seguro de si Powerset lo está haciendo ya. Tampoco de Freebase. Pero deberían (y creo que lo harán). Twine sí está usando RDF y OWL de forma interna, a pesar de que está en fase beta y sólo algunos participantes pueden acceder a los datos. Otras compañías, como el propio Digg están haciendo sus datos RDF públicos.

Cualquier aplicación que publique datos RDF puede considerase semántica además de parte de la web semántica.



Nova Spivack: Entender (ahora sí) la web semántica (presentación)

dolors reig | April 29th, 2008 | 6 Comments »

Es un tema frecuente en este blog. Incluso, en cuanto pueda, le dedicaré un espacio específico en el wiki.

Llevo un tiempo intentando encontrar definiciones claras para algo tan complejo como la web semántica (en este post sobre herramientas de semantificación, por ejemplo), como otros blogs a nivel nacional e internacional (ReadWriteWeb), que incluso han planteado concursos que buscan una definición asequible sobre la esencia de eso que ya denominamos web 3.0 (en la presentación se habla incluso de 4.0).

Y es así porque, como veréis también en la presentación, el nivel de complejidad que unos 10.000.000 de bloggers en el mundo hemos aportado a la web es inmanejable (una aguja en un pajar, como también nos comenta Spivack) siguiendo los sistemas estadísticos (Google) actuales. Me he quedado con ganas (lo haré si me llega la “ansiada” invitación) de probar Twine, la herramienta que centra esta presentación. Si queréis entender de una vez por todas hacia dónde nos dirigimos y os pasa como a mi mientras realizaba esta traducción, esta presentación es ahora vuestro lugar.

A pesar de la licencia libre del documento he solicitado permiso a Spivack para subir a Slideshare la traducción. Espero que no haya problema y que nos permita disfrutar de su trabajo.