Posts Tagged ‘linked data’

Web semántica y reutilización de datos gubernamentales abiertos en UK y US

dolors reig | January 21st, 2010 | 5 Comments »

Comentábamos hace un tiempo la participación de Tim Berners-Lee, el inventor de la World Wide Web en sendas iniciativas, norteamericana y británica, de apertura, puesta a disposición del ciudadano (también, mediante APIs abiertas, de desarrolladores de aplicaciones, investigadores, etc…) de determinados datos no privados (accidentes de tráfico, pasajeros de aviación, agricultura, resultados escolares, etc…) que podrían ser de interés.

Se trata de una derivación de la Web semántica, la Web de los datos enlazados, que hemos analizado en varias ocasiones durante los últimos tiempos:

Data.gov.uk es el sitio británico, con 3 veces más volumen de datos de los que el sitio de US, más antiguo, ofrece hoy. Concretamente, The Data.gov.uk contiene acerca de 3,000 “data sets” (conjunto de datos), en contraste con los 1,000 data sets de US.

No me ha extrañado el compromiso británico con la innovación, que comenta Kirkpatrick. UK ha sido uno de los primeros países en recomendar desde el gobierno, en legislar hace poco más de un año, sobre cosas como el uso de twitter en educación.

Volviendo al tema, el gobierno de UK tiene una legislación tradicionalmente más adecuada a compartir este tipo de datos (The Freedom of Information Act). Además, se ha demostrado claramente entusiasta de las posibilidades de innovación que ofrece el trabajo con este tipo de datos públicos. Prueba de ello es que esponsoreaban hace poco un concurso, Show Us a Better Way, remunerando las mejores ideas sobre posibles mashups para aplicaciones o visualización de datos, en caso de tener acceso a los datos gubernamentales adecuados.

De aplicación más restringida en el caso de US, el sitio de UK incluye data sets militares cuyo carácter público puede resultar polémico o extraño. Los datos sobre  Suicidios en las fuerzas armadas son un buen ejemplo de ello.

Se aplica también a esta Nube de los Datos Enlazados el problema que Vinton Cerf, co-creador de los protocolos TCP-IP destacaría hace unos meses sobre los sistemas de Cloud Computing en general: que los proveedores de servicios en la nube más importantes, como Amazon, Google o IBM no se están preocupando por la interoperabilidad, generando una situación en la que empresas o organizaciones pierden la capacidad de migrar libremente de uno a otro proveedor.

No existen estándares “inter-cloud”, derivándose una situación similar a la de falta de comunicación y familiaridad entre redes de computadoras que vivimos en 1973.  Según Vint Cerf, los usuarios pronto querrán tener múltiples clouds que interactúen entre sí para sacar partido de la capacidad de computación que pueden ofrecer tales entornos combinados. “Hay mucho trabajo de investigación por hacer y muchos protocolos por diseñar y estándares por adoptar para permitir a los usuarios gestionar sus activos en la nube”.

Aunque  Cerf,  vinculado a Google (empresa tradicionalmente ajena a la evolución de la Semweb), no apunte en esta dirección, la Web semántica, la estructuración de los datos bajo sus formatos es una buena solución, como estándar independiente de marcas proveedoras de servicios en la nube.

Es algo que sabían en UK cuando contrataban a Berners Lee para la tarea, pero que parece que no arraiga con tanta fuerza en US. Si bien la administración Obama se muestra afín a utilizar técnicas de computación en la nube para conseguir mayores niveles de eficacia y de comunicación interdepartamental, no lo hace tanto a la hora de adoptar estándares semánticos.



La adecuada gestión de la colaboración en organizaciones y la web 3.0

dolors reig | September 10th, 2009 | 7 Comments »

Lo escribía hace unos meses Mark Radoff en Value-It blog, un espacio sobre web semántica que descubría hace poco gracias a Javier Carbonell y que os recomiendo especialmente:

Como parte de un estudio a largo plazo para la Comisión Europea, Ovum entrevistaba a varios administradores de IT  para intentar concretar Oportunidades y Amenazas en la adopción de software semántico en la empresa. Es una pregunta fundamental, que no falta en las diversas entrevistas sobre web semántica que me han realizado (os dejaré en breve la última, para la revista Computing):

¿Cuáles son las principales dificultades para la evolución de la web en ese sentido?

La respuesta, en este caso, me ha parecido tan sorprendente como relevante a la hora de apoyar una hipótesis que sostengo desde hace tiempo: el verdadero cambio de paradigma para la sociedad desde la web está en la web social y algunas de sus características son requisito fundamental para la evolución, tanto de la web como de la sociedad en su conjunto.

Volvamos un momento a los resultados, al descubrimiento de dos barreras fundamentales para la adopción generalizada de una semweb que ha demostrado ya su eficiencia, sobretodo,  en entornos cerrados (empresariales), pero que no termina de generar la confianza necesaria:

-Cierta resistencia a la “semántica” como término:

“[the term] Semantic web is a barrier. It’s associated with a vision of the web for 10 years to come. I make a point of not using ‘semantic web’”

El término “semántico” puede no ser atractivo para muchas empresas. Su uso abusivo en relación a resultados pobres hace unos años ha podido restarle credibilidad o mantener la idea de que la web semántica es algo a 10 años vista, absurdo y poco rentable ahora.

Escribo este artículo, no obstante, por la importancia de la segunda barrera identificada:

trabajo.jpg

-El verdadero obstáculo está en encontrar a gente que conozca de verdad el negocio:

La implementación de tecnologías semánticas requiere del mapeo de organizaciones, procesos, datos, terminologías, en un conjunto de conceptos, las ontologías o mapas conceptuales. Dicho en otros términos, es difícil encontrar empleados que conozcan bien, a través de varios departamentos, el negocio.

Lo hemos dicho en ocasiones al hablar de comunidades: la división en departamentos estancos propia de la organización del trabajo tradicional en empresas constituye un obstáculo a la necesaria fluidez del conocimiento.

Software colaborativo, comunidades de práctica (interdepartamentales, transversales a distintos departamentos, correspondientes a funciones, objetivos, procesos y no estrictamente a ámbitos de competencia), son pasos necesarios, incluso imprescindibles a la adecuada gestión del conocimiento en la empresa.

Recordemos, en este sentido a Wenger, que proponía ya en 1998 las CoP como acercamiento a la solución de este tradicional problema en empresas cuando es frecuente que el conocimiento importante se distribuya entre distintas unidades de negocio.

Las CoP (ahora virtuales o mixtas), pueden tener como objetivo eliminar o paliar los efectos de este tipo de barreras, que tienen su origen tanto en la organización jerárquica de las empresas como en la tradicional cultura del empleado insatisfecho (sostengo como ventaja fundamental de las comunidades la mejora en términos de satisfacción personal y clima laboral) y la ley del mínimo esfuerzo que puede aplicar a su desempeño.

Metáforas como la del agua o la electricidad se han utilizado a menudo en este sentido. Si el conocimiento no se entiende como algo que no tiene sentido si no fluye, si no propiciamos cambios en la cultura organizacional de la vieja lógica de “la información es poder” a la nueva de “la información compartida y contextualizada (también en un sentido temporal, actualizada) es poder”, si no es posible, en definitiva, la inteligencia colectiva, será imposible proveernos de herramientas (como las de la web semántica) que la potencien.

avaricia

Es importante, así, como vemos casi diario aquí, el cambio en el “mindware”, en la cultura empresarial hacia la colaboración.

O dicho de forma más definitiva, en cierto modo, a nivel de recursos humanos, de gestión del conocimiento intramuros, la empresa 2.0 es un paso previo a la empresa, en ese sentido, “semántica”.

Desmotivación laboral, avaricia con la información, miedo a la transparencia son todas problemáticas que intentamos abordar mediante Comunidades, software colaborativo o  recursos e ideas de la web social y que como vemos pueden significar, incluso, el estancamiento, a nivel tecnológico – de eficiencia, de la empresa.

Relacionados:



Web semántica, Linked data web: últimos conceptos, tendencias y aplicaciones

dolors reig | July 12th, 2009 | 3 Comments »

Hace ya un tiempo que no os hablo, si no es mediante las presentaciones de que me valgo en talleres de formación, ponencias, etc…,  de las novedades en Web semántica.

Uno de los motivos es que creo que, para el usuario final, son las aplicaciones concretas las que más refuerzan la necesidad de acercarnos a la semweb.

Quería dejaros hoy, sin embargo algunas noticias y datos sobre la evolución, en el ámbito de las organizaciones, de la “Linked Data web”, la web de los datos enlazados, un tema que Berners-Lee y el W3C enseñan y trabaja para  empresas y organizaciones (W3C eGovernment Interest Group, gobiernos de UK y  EEUU, etc…).

El concepto, muy útil para realizar la utopía semántica, consiste en la puesta en común, la liberación, la apertura de las bases de datos, del conocimiento que pueda organizarse en formatos ordenados (idealmente Semánticos – RDF o variantes, pero como mínimo susceptibles de ser “semantizados”, mínimamente ordenados, como el csv (al que podéis exportar cualquier hoja de cálculo)) al resto de la web.

ldw

La idea, que podéis ampliar y situar en el contexto de la Web semántica en la presentación que preparé para Novadors, es contribuir al grafo siguiente de “datasets” o conjuntos de datos abiertos, interoperables y correspondientes a estándares semánticos.

Esto permite la circulación de la información y mayor eficiencia para aplicaciones y las propias necesidades de conocimiento en organizaciones.

Observad la interesante evolución entre periodos, signo del intenso trabajo de evangelización – estructuración del W3C:

linked data web

080204_LinkedDataWeb
(linked data cloud 2008)

Se trabaja, en este sentido hoy, en la apertura de algunos datos de la administración pública, mejor en formatos propios de la web semántica pero que, como veíamos, sería útil también en formatos csv mínimamente estructurados:

No es una realidad para todos los gobiernos, pero  algunos trabajan, incluso, con datos RDFa  para cosas concretas (en UK, empleos del sector público).

En nuestro ámbito y en cuanto a los datos abiertos en la administración pública, estamos empezando.

Os recomiendo, si os interesa el tema, las presentaciones recientes de algunos amigos (Jordi Graells, Alberto Ortiz de Zárate) en el  V Congreso IDP – UOC: panel de acceso a la información pública y redes sociales, que resume Ismael Peña en 7 muy buenas entradas.

Dejo aquí la presentación, en el sentido de este post, de José Manuel Alonso, del W3C:

Leo, a punto de cerrar este post, algunas cuestiones clave en la Semantic Technology Conference, que parecen confirmar que la web semántica vive un buen momento, propiciado por la necesidad de mejorar, de hacer más eficientes los sistemas en tiempos de crisis económica.  Me resulta interesante e ilustrativo de las intenciones de startups y W3C lo siguiente:

  • Wolfram Alpha (funcional pero no estructuralmente semántico), ofrecerá APIs abiertas a su motor de búsqueda, tema  que permitirá a otros buscadores basados en lenguaje natural trabajar con sus algoritmos y bases de datos.
  • Se trata de una apertura parcial que responde solo en parte a la reciente opinión de Tim-berners Lee, en la misma línea de la web de los datos enlazados:

    “No sé si Wolfram Alpha piensa poner mucho de su conocimiento en la Web de los Datos Enlazados. Sería lo justo, porque imagino que mucho de lo que tiene proviene precisamente de esta.”

    Esto es cierto para muchas otras aplicaciones y/o sectores. La apertura ya, resulta una deuda social exigible en favor de la transparencia, operabilidad y eficiencia en la web.


    Más información:

    Linked data web: La web de los datos enlazados, mañana en Novadors

    dolors reig | July 2nd, 2009 | 4 Comments »

    Os dejo la presentación de la conferencia de cierre a las jornadas Novadors que daré mañana en Castellón. Contiene algunos vídeos embebidos, así que podéis ampliar viendo tutoriales sobre Twine, Web 3.0, Web semántica, experiencias de aplicación en sectores verticales y el resto de los temas de los que trata desde aquí mismo.

    Introduzco, por su importancia en el desarrollo de la web semántica en 2009, el concepto de Linked Data Web (web de los datos enlazados) del que hemos hablado de forma colateral aquí en ocasiones.  Anticiparos que se trata de la apuesta de Tim Berners-Lee desde el W3C sobre el establecimiento de estándares para la interoperabilidad de los datos RDF lenguaje esencial de la web semántica) distribuidos entre distintos recursos.

    Son muchos los organismos, las instituciones y empresas que están entrando en la “Linked data cloud”, cuestión que mejora la eficiencia de la web (más en la presentación y el vídeo de la Ted Talk de Tim Berners-Lee que os dejo más abajo).

    Introduzco también un último apunte sobre Singularidad y la película Trascendent Man, basada en las ideas de Ray Kurzweil y que llega a predecir, incluso, la inmortalidad del ser humano.

    Relacionados:

    Stream, fundamental en la web 3.0 y la próxima reconquista de Google

    dolors reig | May 21st, 2009 | 9 Comments »

    Tenía ganas de hablaros de ello desde que Pedro Villarubia, educador y buen amigo virtual, me dejaba en Twitter un par de enlaces de interés. Se trata de un concepto que comentábamos hace un tiempo y que está siendo uno de los más relevantes durante 2009: La web en tiempo real.

    Diría que la responsabilidad es casi exclusiva de Twitter pero podemos analizar, gracias a lecturas y reflexiones personales un poco más el tema. Así, comenta Nova Spivack que, como decíamos en la Presentación “Web 3.0, La tercera década de la web, el Stream supone un nuevo paso, una nueva metáfora en la evolución de la web.

    Internet tiene algunas décadas más que la web. Y aunque hoy identifiquemos ambos términos, no es así:

    La web es soportada por Internet como el software a los sistemas operativos de los equipos. Así, lo nuevo ahora sería el  Lifestreaming, llamado más tarde web en tiempo real, Statusfera o lo que ahora Spivack denomina la corriente (The Stream).

    Entorno a ello nacen múltiples herramientas, unas que a imagen y semejanza de Twitter, Facebook, Friendfeed, nos permiten dejar huellas inmediatas en la web y otras, derivadas de estas y de tecnologías como las de Sindicación y las más nuevas de open-source real-time technology (XMPP),  permiten cosas como la “Búsqueda en tiempo real”, el filtrado de la información, su organización, seguir “Tendencias” o incluso predecir el futuro.

    Incluso si el modelo de datos enlazados subyacente es como un grafo, incluso semántico, la experiencia de usuario será cada vez más orientada al stream.

    Así, si la web está formada de sitios, páginas y links, el flujo está formado de corrientes de información, incluso, a través de APIs abiertas, de los datos que tanto importan a la interoperabilidad y coherencia de la web abierta que queremos y representa el gráfico inferior (Linked data web):

    linked_data_standards

    • Cambio, ámbitos de conocimiento

    Los streams cambian a menudo y eso constituye parte de su valor.  De hecho el cambio es su característica principal.

    Eso distingue Streams (microblogging, blogs para Spivack) de otro tipo de web sites, colecciones estáticas de referencia, según, añadiría yo, entre otros factores, el ámbito de conocimiento, más o menos histórico o consensuado por la comunidad científica a que nos estemos refiriendo. Si hablamos de entornos que recogen datos prospectivos, de futuro, o de blogs que recogen informaciones en beta, conversación permanente, entonces el stream adquiere una importancia capital.

    • La web en construcción permanente.

    Aquí, la conversación lo es todo, con el RT (Retweets en Twitter) llegando incluso a superar en importancia al enlace como indicador cuantitativo de popularidad de las páginas.

    El tema me recuerda en parte a Wolfram Alpha,  definido oficialmente como herramienta de computación de conocimientos concretos, más que como motor de búsqueda. Aunque leáis que puede suponer una alternativa a Google, veréis si lo probáis y analizáis a fondo que se trata de algo muy distinto.

    • Independencia de la Interface, Personalización:

    Si en la era de la web era el proveedor el que controlaba la interface desde la que recibíamos los datos. en la nueva era, es el consumidor el que, haciendo uso de distintas herramientas de sistematización, de organización del flujo (lectores de feed, los Entornos personales de los que venimos hablando últimamente, la construye según sus propias necesidades o intereses.

    Es una de las características que también destacábamos para la web 3.0 y el aprendizaje en Entornos Personales (Aprendizaje 3.0):

    • Sobrecarga cognitiva:

    El tema provoca varias reflexiones. A nivel de e-competencias, si todo es cada vez más  conversacional, menos permanente, un requisito fundamental del flujo será la  sincronicidad en la respuesta. O respondemos de forma  inmediata, o lo hacemos de forma obsoleta, una vuelta de tuerca más al esfuerzo de interactuar con la información o una ubicuidad (telefonía móvil) cada vez más necesaria si no queremos quedarnos fuera de la corriente.

    Visto en otros términos, nos dirigimos a un mundo de Inputs momentáneos, atención distribuida y fragmentada,  viralidad efímera, momentos de celebridad, de visibilidad instantánea, que nos llegan a una velocidad inabarcable y que necesitarán,  bien de la evolución rápida de nuestro sistema cognitivo, bien de la importancia absoluta de  filtros que adapten esta nueva conciencia universal a las capacidades cognitivas humanas.

    Se me ocurren varias reflexiones al respecto. ¿Alcanzaremos así de forma permanente el estado de Flujo de Mihaly Csikszentmihalyi que había de llevarnos a la felicidad?
    ¿Deberíamos acotar nuestros intereses? La metáfora de las 10.000 horas necesarias para ser excelentes en cuanto a conocimiento (los Outliers de Malcolm Gladwell) podría ser válida solamente de este modo.  ¿Pero eso no nos limita, no limita la creatividad, la innovación?.  ¿Será la colaboración la única y creciente solución al problema de la inabarcabilidad del conocimiento?

    La sobrecarga cognitiva genera dudas, que no sólo nos afectan como humanos. Parece que a la gran compañía monopolista de la red, al propio Google, también le cuesta adaptarse al Stream:

    Así, mientras el Gran Hermano de la red (lo digo en tono irónico y exagerado ;) ) no suba al tren de la nueva tendencia, que reconoce oficialmente como una de sus debilidades, son otros quienes protagonizan el movimiento:

    • Nuevas aplicaciones, Publicidad:

    También afecta a nuevas formas de publicidad, de rentabilización de espacios: En una red orientada al Stream en la que podemos monitorizar la popularidad de cada cosa en cada momento, surgen nuevas oportunidades de monetización, basadas en precios mayores o rotación de anuncios para impresiones en las páginas más populares “en el momento actual”.

    Y a nuevas aplicaciones, nuevas Startup que en 2009 nos ofrecen múltiples formas de gestión del Stream: Notify, Friendfeed, aplicaciones de escritorio o complementos del navegador para interactuar con Twittter o cualquier otro servicio de comunicación basada en el “status”.

    • La mente, el espíritu global de la humanidad:

    Difiero en este punto del razonamiento que sitúa internet como nuestro sistema nervioso colectivo, la web como nuestro cerebro (brain) colectivo y el stream como nuestra mente (mind) colectiva.  O prefiero limitarlo al ámbito de la metáfora: El stream estaría representando, a nuestra imagen y semejanza, la mente, lo que el sistema está “pensando” en tiempo real.  Creo que el salto es hoy arriesgado y aún poético cuando se afirma que la inteligencia planetaria podria estar suponiendo cualquier forma de conciencia independiente.

    Pero lo que sí parece cierto es que de esa suma de conciencias, de contenidos, de informaciones generadas por milllones de usuarios y bajo el principio de que el todo es superior a la suma de las partes, podría estar emergiendo algo, no sólo más inteligente (como veíamos en Sabiduría de las multitudes) sinó también mucho más vivo y dinámico.

    Soñemos….

    Relacionados:

    Imágenes:

    Slide from Tim Berners-Lee’s TED talk in Feb 09

    Mcallan, Imaginación al poder.

    PASION, Redes 4G, calidad y cantidad para la internet de todas las cosas

    dolors reig | April 20th, 2009 | 7 Comments »

    Tengo la impresión, cuando me acerco a estos temas, de estar pisando terreno resbaladizo, generando expectativas exageradas, similares a las que protagonizó la Inteligencia artifical en los 70 -80.

    Más desde que conozco la teoría de Taleb sobre el “cisne negro”, perfectamente aplicable en un sentido positivo, al fenómeno de internet:  Nuestro conocimiento, basado en la experiencia, suele ser insuficiente para generar grandes innovaciones. Los avances, muy al contrario, se producen acompañados de las siguientes características:

    1. Nada en el pasado apuntaba esa posibilidad.
    2. Tiene un impacto extremo, positivo o negativo.
    3. Sólo es predecible en retrospectiva.

    Así, quería presentaros algunas cosas, hoy curiosidades, sin tener una certeza absoluta sobre su alcance o sobre si serán o no “cisnes negros” para el futuro, en positivo, de internet y la humanidad en general:

    Cantidad, Relevancia, Utilidad de las conexiones como uno de los hitos en el futuro de la red…

    Se predice que en 2017, las redes supondrán en la sociedad digitalizada alrededor de 1000 dispositivos por persona (laptops, teléfonos, mp3, juegos, sensores, etc…). Es lo que también se conoce como la “red de todas las cosas” y trabajan en la investigación para  su sincronización distintos proyectos de Redes personales inteligentes (PNs) y red personal global adaptativa (MAGNET Beyond)

    Se trata de las redes 4G (de cuarta generación) y significará servicios personalizados, dispositivos ubicuos y conectividad de banda ancha en todo lugar y momento.


    Pero también la calidad parece que se verá afectada:

    Es la conclusión a la que llegaremos tras conocer otro de los ámbitos de la investigación europea, la Comunicación más allá de las palabras:

    Que la web semántica pueda llegar a entender el lenguaje natural parece un objetivo alcanzable. Podrá ser capaz de entender de forma lógica los conceptos, de crear una web de datos enlazados (linked data) en lugar de la actual red de documentos, pero resulta imposible imaginar que capte determinada información contextual importante en la comunicación humana. Cosas como la ironía, el humor, la emoción y algunos otros matices,  parece que no serían alcanzables por las máquinas.

    Pues bien…parece que en el caso de algunas claves no verbales de la comunicación, estamos cerca de poder trasladárselas, a la vez que de enriquecer la comunicación en internet.

    Lo que hemos intentado suplir desde hace tiempo con emoticones, smileys, avatares, etc… ahora parece que puede ser transmitido, por un sistema de realidad aumentada capaz de interpretar el contexto y el “humor” en las comunicaciones por voz o textuales a través de la red.

    Trabaja en ese sentido el proyecto PASION (Psychologically Augmented Social Interaction Over Networks, Interacción social psicológicamente aumentada en redes):

    Desde sensores simples para indicar estados fisiológicos en base a la tasa cardíaca para redes sociales y juegos, hasta aplicaciones para trabajadores del conocimiento (integradas en MS Outlook, iGoogle, Skype, Thunderbird, etc..).

    Incluso se ha desarrollado un prototipo que trabaja en un teléfono móvil y proporciona información para coordinación de equipos de trabajo ( disponibilidad, indicadores y visualización que ilustran la posición social de un usuario en el grupo).

    En sectores específicos, la tele-psiquiatría promete: software para analizar expresiones faciales y variaciones en la voz podrían ayudar al tratamiento psicológico a través de internet.

    En cuanto a la formación, claves no verbales sobre “arousal” (excitación) o sobre dinámicas de interacción en el grupo pueden ser útiles para moderadores online o formadores en aplicaciones de e-learning.

    Internet para todo, desaparición de fronteras entre lo real y lo virtual, llamémoslo o no web 3.0, parece que cada vez estamos un poco más cerca.

    Fuentes: