Archive for the ‘herramientas semánticas’ Category

¿Nativos o náufragos digitales? Actitudes y competencias.

| July 29th, 2010 | 22 Comments »

Y no se trata solamente de que ignoren la necesidad de citar cuando copian un artículo sinó de cosas que creo más graves y que siguen desmitificando el tema de los nativos digitales, la idea de que de forma automática los jóvenes harán buen uso de las TIC porque les son naturales.

Se trata en este caso de la excesiva credibilidad que conceden a Google, priorizando como fuentes fiables de información los primeros resutlados. Lo confirma un estudio en el International Journal of Communication. “Trust Online: Young Adults’ Evaluation of Web Content.” que me ha parecido preocupante, ya no porque siga mostrando que las competencias digitales siguen sin formarse, como porque significa que este mundo más horizontal que tanto nos gusta y nos empeñamos en crear y diseminar, puede tener las generaciones contadas.

El estudio se realiza con 102 (datos posteriores informan de que fueron 1000) estudiantes de la Universidad de Illinois de Chicago, observados por los investigadores en lo que se suponen sus comportamientos habituales ante la pantalla y reporta resultados como los siguientes:

“Solo porque los jóvenes hayan crecido con la web no significa que podamos considerarles competentes en su uso” (los “Sabios digitales” que Mark Prensky definiría),  concluye Hargittai como responsable del estudio. Los educadores deben mostrar sitios específicos en clase y hablar de porqué una fuente es o no creíble”. “Muchos estudiantes piensan que si Google coloca algo en el número uno es porque es creíble”, comenta. “Y esto es potencialmente engañoso si tenemos en cuenta que Google no ordena los sitios según su credibilidad”.

O sí, matizaría, en cierto modo y si olvidamos las entradas patrocinadas, en cuanto a su popularidad (número y calidad de los enlaces entrantes).

Después de Google, otras marcas online mencionadas como creíbles son Yahoo!, SparkNotes, MapQuest, Microsoft, Wikipedia, AOL y Facebook.

En otros casos la confusión es todavía mayor, considerando los jóvenes que los sitios cuyo dominio tenía extensiones .gov, .edu o .org eran más fiables que el resto.

 

Yendo un poco más allá, creo que educadores, padres, dinamizadores TIC debemos enseñarles a:

-Defender el carácter meritocrático, más horizontal que nunca, de la web, de forma proactiva.

-Mostrarles los usos profesionales, de desarrollo de aficiones y conocimiento, más allá de los vinculados a las redes sociales al uso.

-Ayudar a que construyan, también de forma activa, su propia web personalizada según un entorno socio-profesional de interés determinado (Exploramos aquí el concepto de PLN), desde el punto de vista de concepto como de herramientas y competencias de networking.

-Educar la participación, los modos de ser sociales, la necesidad de ser proactivos como ciudadanos en la web.

-Descubrir, potenciar, posibilitar el desarrollo de sus propios lenguajes (alfabetizaciones múltiples) y creatividad en la web (El vídeo de Rediseñar 2010 que termina esta entrada es buena muestra de ello en la Universidad).

-Mejorar las competencias de búsqueda, potenciar las búsquedas semánticas, menos sujetas a criterios rankistas (en este sentido, afortunadamente, la web 3.0 sigue si propia evolución)

No van a servir, de no ser así, de no formar este tipo de actitudes y competencias, ni las tradicionales iniciativas OLPC ni que últimamente inventemos ordenadores ya a 35 dólares.

O el cambio que proponemos no va a suceder de forma espontánea  si dejamos que naveguen solos, que naufraguen (la expresión la leí hace poco en la web, no recuerdo dónde), no de la forma rápida y permanente que muchos/as deseamos.

 

 

Imagen: ChristopherA

Vídeo con subtítulos en español: Metaweb y otros sobre la web semántica

| July 24th, 2010 | 5 Comments »

Ha sido una de las noticias clave de la semana: Google (sí, la misma empresa que hace unos meses decía literalmente que la web semántica no tenía nada que ver con ella, que era una utopía irrealizable y que ya decíamos que era previsible que cambiase de opinión ;) ) compraba Metaweb, la empresa responsable de Freebase, que ya hacía más inteligente Google News y que ahora parece que va a incorporar sus “entidades”, ontologías y base de datos a toda la web.

Microsoft se adelantaba hace un tiempo, cuando adquiría Powerset . Ya entonces decíamos que había un único camino (decíamos que era el inicio “real” de la web semántica), el que ahora parece aclararse con la unión explícita y reconocida de la empresa más grande de la red comprando una de las más importantes en el ámbito de la semweb.

Son muchos los análisis posibles, además de que creo que vuelve a ser actualidad absoluta, vuelve a situarse en el centro de la web 3.0 la semantización de los contenidos web para ofrecer resultados más orgnaizados, inteligentes y útiles al usuario final.

Os dejo, además del vídeo de Metaweb que viene circulando en inglés en muchos otros lugares con subtítulos en castellano (gracias a Verónica, de Factor Humano, que se tomaba el trabajo de añadirlos hace un par de días), el material correspondiente al módulo sobre web semántica que terminaba hace unos días para la Escuela de Verano Espiral, similar al que impartiré en breve para la Universidad de Panamá.  Hay un apartado especialmente dedicado a resolver mitos y realidades sobre el tema de la web semántica – web 3.0 en el que podréis contrastar la actual posición de Google con la que mantenía hace un tiempo.

Recomiendo, finalmente, para una inmersión casi completa este importante concepto, el vídeo que subtitulé personalmente hace unos años ya.

Que siga la evolución:

 

Web 3.0, Web semántica, la película: traducción y visión crítica

| May 11th, 2010 | 13 Comments »

Seguro que habéis leído o visto el vídeo en el que Dixon, Tim Berners-Lee, Clay Shirky, David Weinberger, Nova Spivack, Jason Shellen, Lee Feigenbaum, John Hebeler, Alon Halevy, David Karger y Abraham Bernstein exponen sus puntos de vista acerca de la sobreinformación o nos devuelven el concepto de web semántica.

Tenía ganas de comentarlo aquí, tal vez porque llevamos ya unos años hablando de la materia y el título me resulta, en la línea abusiva que comenta Dixon, algo engañoso.

Utilizaba como base, tanto del temario del curso de Posgrado Virtual Educa que preparo como de algún informe realizado una entrevista que me realizaban hace un tiempo y publicaban en la revista Computing, así que disculpadme si suena familiar la idea que siempre comento:

La web 3.0 es mucho más que la web semántica. La web semántica fue imaginada, de hecho, por el propio Tim Berners Lee que aparece en el vídeo, mucho antes de la tercera década de la web. En esta, en la Web 3.0, si preferís llamarla así, se incluyen muchos otros conceptos, que el tiempo dirá si son tanto o más importantes que el de la propia semantización de los datos que vamos depositando, directa o indirectamente (se obvia en el vídeo el importante concepto de la web al cuadrado, la squared web, que supone el añadido de los datos del mundo real transmitidos a partir de sensores a la web).

Más allá de esta primera apreciación, el vídeo no añade demasiadas novedades a lo que hemos venido relatando, definiendo, reportando en múltiples entradas, vídeos, tutoriales, entrevistas, aquí.

Quería, de todos modos, dejaros algunas ideas que creo, aunque no demasiado nuevas, importantes en el vídeo:

 

Los primeros 7 minutos relata el alcance de la sobre información, del crecimiento exponencial de los datos en la web. 9,6 bilones de libros, 1690 librerías del congreso, trillones de páginas en breve, comenta Spivak (cada tweet, cada mensaje en Facebook, cada información del mundo real, añadimos, pueden ser una página) serán inmanejables en breve para Google.

Ante ello necesitamos filtros, estructura, etc… (si pensara hoy en montar un negocio de noticias, sería de agregación de distintas fuentes distribuidas mediante herramientas inteligentes que proporcionaran personalización, comenta Shirky)

Es necesario, es la base de la web semántica, estructurar todos esos datos, definir relaciones entre ellos para que puedan facilitar la comunicación, más allá de la transmisión de datos entre ordenadores. La interpretación humana, la creación de ontologías, podría ser necesaria en un momento inicial pero no imprescindible (de eso se habla cuando se menciona la web inteligente) después.

Construccíón de contextos. Linked data project, destaco las novedades aportadas por Lee Feigenbaum, el que más me ha gustado sin duda, que comenta por ejemplo una idea potente y enlazada con el conectivismo: La web semántica hace que cada enlace signifiquen algo para las máquinas. Podríamos decir que:

Si el conectivismo derivaba de las teorías de sistemas para explicar como aprendemos, cómo funcionan nuestros cerebros, podría ser que la web semántica y su propósito de dar significado para las máquinas a las conexiones cerrara el círculo, resultando la forma de aprender, también, de los ordenadores.

Shirky lo formula de un modo parecido: pasamos de querer construir cerebros en silicona a aplicar criterios de cerebro al mundo de información que hemos creado. Sin olvidar la importancia de las folcsonomías, de la construcción social de los significados, la combinación, la mínima estructura que aportan las ontologías a los datos, son, para el autor, desde una posición intermedia, necesarias.

Vuelvo a Feigenbaum porque también me resulta interesante su reflexión, que distingue la vertiente social de la tecnológica en cuando a la web 2.0.

Pasa algo parecido con la web semántica y añado, esa parte social por desarrollar es la que nos reserva las mayores sorpresas.

Destacar por último la visión realista de Weinberger: serán los mismos motivos políticos, económicos de siempre los que pueden frenar (los que como hemos visto, ya frenaron en su momento) la evolución de la semweb.

Poco más. Os dejo un par de los recursos didácticos de los que suelo valerme para explicar todo ello. El primero es la presentación que realizaba en Virtual Educa 2009, en Buenos Aires:

 

El segundo es el imprescindible vídeo que subtitulé hace un tiempo:

 

El tercero, que os animo a traducir también desde Dotsub (es una muy buena forma de aprender, desde idiomas a los conceptos), entiende la web 3.0 en el sentido amplio que prefiero:

 

Web 3.0, Web semántica, la película que motiva este post:

Crowdsourcing, remezcla, tecnologías semánticas y desarrollo en África

| April 14th, 2010 | 1 Comment »

Os hablaba hace unos días de Ushahidi, ejemplo de aplicación colaborativa conectada a necesidades reales, cuyo blog co-concursa con El caparazón en The Bobs. La planteaba como ejemplo de innovación colaborativa. con un objetivo interesante en Innosfera.

La que descubría hoy y por motivos similares, entra a formar parte de mi listado particular de buenas prácticas en colaboración online:

África es, quizás en la mayor medida posible, naturaleza y tierra. Y como tal no extrañan iniciativas como AfricaRuralConnect, el proyecto que acaba de ganar el Interactive Media Council Outstanding Achievement Award y explota a la perfección el amor por las tic y la tierra original africana que muchos profesamos.

En este sentido son pocas todavía las experiencias pero creo que África es un terreno excepcional, con muchas posibilidades (dispersión geográfica, posibildades de las TIC para suprimir intermediarios y favorecer el mercadeo local, también para mejor aprovechamiento de recursos y las ganas de prosperar y el optimismo de sus habitantes, son, entre otros, mis argumentos), para que la tecnología muestre su potencial para el desarrollo.

ARC es un producto desarrollado por la National Peace Corps Association (una asociación de voluntarios en el mundo) y va a proveer de una plataforma colaborativa para que los africanos y todos aquellos interesados en la Agricultura puedan aportar ideas.

Usar Biogas para cambiar la vida rural, ideas sobre cultivos, la idea es premiar las ideas que mejor prometan contribuir al desarrollo del continente.

El sitio está construido en Wegora, herramienta de escritura colaborativa que probaré en cuanto me llegue la invitación :) , que parece complementarse con un motor de análisis semántico.

El entorno remixa las ideas de los miembros de la comunidad para que esta las mejore, las comente, las cuestione. Se trata, creo,  de una idea fresca e interesante: remixes portables que siguen la idea original y el perfil del que la ha remezclado a través del sitio. La conversación resultante quiere simular la de empresarios haciendo networking o trabajando en un taller con ideas.

 

Conscientes de sus virtudes para fomentar cosas como el crowdsourcing y el trabajo colaborativo, los promotores de la iniciativa premiarán a quienes propongan las mejores ideas con $12,000 (este año el concurso es hasta el mes de Noviembre).

Los premios serán para las ideas más originales, creativas, prácticas, escalables y capaces de tener éxito en la mejora de las condiciones de vida de pequeños granjeros en el áfrica subsahariana.

Esperan que seamos muchos los que reconozcamos el valor de la experiencia y aportemos nuestras ideas para ayudar al desarrollo de la África rural.

 

Pull ¿Un mundo a medida? Web semántica y poderes económicos

| March 31st, 2010 | 6 Comments »

Ando ultimando detalles del temario de un curso de Posgrado sobre Tendencias web y educación en que la web semántica y sus desarrollos en la Linked data cloud tienen un protagonismo especial. Si la característica fundamenal de la educación en la web del futuro es la personalización, será necesaria una web mucho más estructurada para hacerlo posible.

Aunque considero excesiva la apropiación que intenta Siegel del término “web semántica”, comentando que fue él su autor y no Tim Berners Lee (el papel de este último en el desarrollo del concepto convierte el hecho fundacional en más bien anecdótico), creo que puede ser interesante leerle.

Su teoría no parece aportar demasiados detalles adicionales a la de la Larga cola, pero “Pull”, el libro que publica, creo que da en el clavo en cuanto al traer a la actualidad el próximo protagonismo de la semweb, de los datos estructurados, la ventaja competitiva que supondrá lo que ya Kevin Kelly y aquí mismo determinábamos como uno de los valores añadidos en cuanto a la oferta de contenidos en la web: la encontrabilidad de los datos.

La salida previsible de la crisis a partir de 2011 (año de la “próxima revolución de la web“, según algunos/as), el incremento de la cantidad de datos,   pueden significar la inversión en tecnologías que los hagan más relevantes.

Buscadores más inteligentes, más sensibles a metadatos puden corresponder a servicios de posicionamiento basados en la web semántica.

Me inquieta el alcance del fenómeno. Más si pensamos en términos de generosidad letal, de Sharismo. Es posible que si hoy se trata de compartir en la máxima extensión posible,  de aportar lo mejor de nosotros mismos a la evolución de web y humanidad, mañana debamos además invertir, volver a depender de lo económico, en que el lenguaje que utilicemos sea lo más interoperable, lo más universal posible.

Supongo que hemos aventurado otra nueva definición de lo que es o no semántico. Las hay sociales, que enfatizan el papel de los pares y sus recomendaciones en la desambiguación de la web y otras igualmente amplias, como la de Siegel, que discute Richard MacManus (coincido en su opinión) en RWW.

Pull es un trabajo algo intuitivo, que podría, en mi opinión, prescindir de la utilización del término web semántica. Como ejemplo de ello podéis encontrar en el site que acompaña el libro, The Power of Pull, un  “Semantic Web Acid Test.” que define la web semántica como aquella que estructura sus datos de forma simple, “no ambigua”.

No menciona cuestiones básicas para el desarrollo de esta, como el cumplimiento de estándares que permitan la interoperabilidad, “hablar el mismo lenguaje” entre bases de datos, lo que también se denomina la web estructurada, la linked data web, y los lenguajes XML, RDF, OWL, etc…que tantas veces hemos repasado,  pero que incide en algunas ideas que muchos/as vamos aventurando ya.

“El libro describe la era Pull, en la que los consumidores compran las cosas ondemand (a demanda). Productos, servicios, información, conocimiento, consejo, etc…

eso cambiará el mundo de los negocios, desde un modelo de interacción con el consumidor “lead-push” (liderazgo que atrae al consumidor) a un modelo “pull-follow”, de seguimiento y respuesta a cualquiera de sus demandas.”

En fin… me preocupa últimamente que el desarrollo semántico no pueda significar mayor relevancia de los datos de las organizaciones que puedan permitirse pagar por formar parte de una web más avanzada.

O que desaparezca el carácter “bottom up”, popular, de mayor relevancia de los contenidos generados por el usuario que los corporativos.

¿Peligra la meritocracia por la que todavía trabajamos con la que prometía ser una web mejor?

¿Será el futuro de una web a dos velocidades en la que la relevancia esté marcada en gran medida por la capacidad inversora del emisor de información?

¿Herramientas de semantización libres? Creo que en ellas está la posible solución.

En cuanto al futuro del consumidor inteligente es obvio que será de encontrabilidad, de larga cola o satisfacción de cualquier posible necesidad mediante el amplio repertorio de opciones posibles (cualquier cosa es posible ya, a nivel de tecnologías de la información y la comunicación) que ofrece la web.

Me ha recordado la entrevista que me hacía Carlos Albaladejo para  Universia, después del Debate resintonizando la educación: El futuro está en la personalización, en responder con eficiencia al “Pull” de un usuario afortunado, que podrá aprender de forma personalizada en un entorno de abundancia:

Explorador de datos públicos de Google abierto a todos

| March 9th, 2010 | 2 Comments »

Estados Unidos, UK se han unido recientemente al proyecto de Reutilización de datos gubernamentales, públicos. País Vasco, Asturias o Cataluña,  que incluso apuesta por la apertura de APIs a disposición del público general para operar, crear aplicaciones o Mashups con los datos estructurados de la Linked Data Web son otros ejemplos próximos.

Datos metereológicos, de estadística oficial, de turismo, accidentes de tráfico, pasajeros de aviación, agricultura, resultados escolares, etc… son indexados desde hace un año por Google y pueden formar parte ahora del explorador de datos públicos de Google.

El propósito de la nueva herramienta es hacer de los grandes datasets más o menos estructurados, entornos de fácil exploración, visualización y comunicación.

Si pensamos en la disolución de la línea entre lo profesional y lo amateur, este desarrollo de Google, con otros similares que permiten la realización de gráficos (Google charts), parece que siguen reforzándola.

Así, el tema puede ser útil para pequeñas organizaciones sin recursos para crear sistemas más complejos pero que tienen la necesidad de visualizar distintos datos y tendencias. Puede ser una buena herramienta, en este sentido (como Youtube direct), para pequeñas empresas periodísticas que quieran competir con los grandes medios.  También, por supuesto, puede significar la posibilidad de distintas investigaciones independientes.

Podemos ahora, como vemos en el ejemplo, embeber gráficos, tablas y otras herramientas de representación visual en nuestros sitios. Su carácter dinámico hará que si los datos se actualizan, también lo haga el gráfico.

Lo que hay en este momento son 13 datasets (bases de datos, conjuntos) disponibles, desde las estadísticas de educación en California a indicadores de desarrollo en el mundo desde el World Bank. También los datos públicos del U.S. Center for Disease Control (recordemos las Flu Trends, la evolución de la enfermedad que nos ofrecía Google),  el U.S. Bureau of Economic Analysis, Eurostat, la Organización para la cooperación económica y el desarrollo y el departamento de educación de California.

4 opciones de visualización, selección de criterios y variables dinámica son algunas de las cosas que podéis probar en este, que estoy segura que interesará a los que se dediquen a Orientación laboral, empleo sobre la evolución del paro en españa:

Web semántica y reutilización de datos gubernamentales abiertos en UK y US

| January 21st, 2010 | 8 Comments »

Comentábamos hace un tiempo la participación de Tim Berners-Lee, el inventor de la World Wide Web en sendas iniciativas, norteamericana y británica, de apertura, puesta a disposición del ciudadano (también, mediante APIs abiertas, de desarrolladores de aplicaciones, investigadores, etc…) de determinados datos no privados (accidentes de tráfico, pasajeros de aviación, agricultura, resultados escolares, etc…) que podrían ser de interés.

Se trata de una derivación de la Web semántica, la Web de los datos enlazados, que hemos analizado en varias ocasiones durante los últimos tiempos:

Data.gov.uk es el sitio británico, con 3 veces más volumen de datos de los que el sitio de US, más antiguo, ofrece hoy. Concretamente, The Data.gov.uk contiene acerca de 3,000 “data sets” (conjunto de datos), en contraste con los 1,000 data sets de US.

No me ha extrañado el compromiso británico con la innovación, que comenta Kirkpatrick. UK ha sido uno de los primeros países en recomendar desde el gobierno, en legislar hace poco más de un año, sobre cosas como el uso de twitter en educación.

Volviendo al tema, el gobierno de UK tiene una legislación tradicionalmente más adecuada a compartir este tipo de datos (The Freedom of Information Act). Además, se ha demostrado claramente entusiasta de las posibilidades de innovación que ofrece el trabajo con este tipo de datos públicos. Prueba de ello es que esponsoreaban hace poco un concurso, Show Us a Better Way, remunerando las mejores ideas sobre posibles mashups para aplicaciones o visualización de datos, en caso de tener acceso a los datos gubernamentales adecuados.

De aplicación más restringida en el caso de US, el sitio de UK incluye data sets militares cuyo carácter público puede resultar polémico o extraño. Los datos sobre  Suicidios en las fuerzas armadas son un buen ejemplo de ello.

Se aplica también a esta Nube de los Datos Enlazados el problema que Vinton Cerf, co-creador de los protocolos TCP-IP destacaría hace unos meses sobre los sistemas de Cloud Computing en general: que los proveedores de servicios en la nube más importantes, como Amazon, Google o IBM no se están preocupando por la interoperabilidad, generando una situación en la que empresas o organizaciones pierden la capacidad de migrar libremente de uno a otro proveedor.

No existen estándares “inter-cloud”, derivándose una situación similar a la de falta de comunicación y familiaridad entre redes de computadoras que vivimos en 1973.  Según Vint Cerf, los usuarios pronto querrán tener múltiples clouds que interactúen entre sí para sacar partido de la capacidad de computación que pueden ofrecer tales entornos combinados. “Hay mucho trabajo de investigación por hacer y muchos protocolos por diseñar y estándares por adoptar para permitir a los usuarios gestionar sus activos en la nube”.

Aunque  Cerf,  vinculado a Google (empresa tradicionalmente ajena a la evolución de la Semweb), no apunte en esta dirección, la Web semántica, la estructuración de los datos bajo sus formatos es una buena solución, como estándar independiente de marcas proveedoras de servicios en la nube.

Es algo que sabían en UK cuando contrataban a Berners Lee para la tarea, pero que parece que no arraiga con tanta fuerza en US. Si bien la administración Obama se muestra afín a utilizar técnicas de computación en la nube para conseguir mayores niveles de eficacia y de comunicación interdepartamental, no lo hace tanto a la hora de adoptar estándares semánticos.

Atictes, Jornades Internet mòbil: Web 3.0 mobile.

| November 27th, 2009 | 1 Comment »

Os dejo la presentación que realizaré el próximo domingo desde Citilab Cornellá para las jornadas Atic 2a Internet Mòbil.

Incluye alguna referencia sobre Mobile learning (enlaza la presentación al respecto de Hugo Pardo en Virtual Educa).

En la intersección de este con la Realidad Aumentada, como decíamos en Construcción colaborativa de la Realidad Aumentada, creo que están muchas de las claves del Futuro del e-learning y la educación:

Entornos de colaboración científica y ciudadana más eficientes gracias a la Web semántica

| October 31st, 2009 | 5 Comments »

Os dejaré en breve programa de Virtual Educa Buenos Aires 2009, que me llevará a Buenos Aires en unos días y donde explicaré como ejemplo didáctico de “Web semántica en educación”, la existencia de Entornos colaborativos con soporte semántico para la investigación científica 2.0 (e-ciencia semántica).

Confluyen en ella dos de los temas principales de este blog: la web semántica y la web social. Además, el conocimiento es uno de los dos ejes principales (con el relacional) en que situo la explicación de lo que es la nueva web:

Nace, en el Rensselaer Polytechnic Institute  una nueva  experiencia de optimización de la funcionalidad de la web en cuanto a conocimiento, creando un entorno que aísla, con el objetivo de potenciar su efecto,  las variables más relevantes (sociales, semánticas) para una construcción mejorada de conocimiento en la web.

Lo que se pretende es aumentar, optimizar las formas de acceso al conocimiento científico, (a un nivel sin precedentes en la historia de la ciencia, dicen ellos). Incluye, además, presupuestos para la semantización de contenidos científicos.

La idea, en mi opinión algo ambiciosa (la he leído como “la democratización del conocimiento” y reconocidamente no demasiado diferente de lo que se viene haciendo en Wikipedia, “permitiría que científicos, profesores y cualquier ciudadano puedan revisar los datos, interpretarlos, verificarlos, compartir información, continuar con estudios que quedaron empezados y, sobre todo, comprender realmente las palabras que encuentran en la red”

Veremos cómo evoluciona este nuevo acercamiento (Wolfram Alpha, aunque a nivel más cerrado, menos interoperable supone otro ejemplo del mismo intento) entre el lenguaje de la ciencia y el general. De momento, es un proyecto ambicioso:

“En palabras de Deborah McGuinness, segunda investigadora principal del proyecto y profesora de Constellation, “Las tecnologías semánticas reducen la barrera de entrada para hacer ciencia. Con la web semántica podemos tender un puente entre la pregunta que alguien quiere hacer con su limitado lenguaje científico y la extrema complejidad de los datos subyacentes”.

Fox, principal investigador del proyecto y profesor del Tetherless World Constellation en Rensselaer, comenta que: “existirán nuevas oportunidades de gran alcance para revisar datos. Puede no ser la tradicional revisión por parte de pares como es costumbre en la publicación científica porque muchas personas no serán expertos, pero cada usuario traerá consigo un punto de vista muy legítimo a los datos, particularmente cuando los utilicen en nuevas y diferentes formas”.2009-1001-tetherless_grant


  • Catedrales vs. bazares del conocimiento, mayor relevancia, diversidad:

Dejadme utilizar la metáfora de la Catedral y el Bazar (de los monopolios al conocimiento distribuido y diverso) porque el tema parece ir en ese sentido:

Mayor facilidad a la hora de compartir datos gracias a las tecnologías semánticas, facilitará cosas vinculadas tradicionalmente al conocimiento científico. En el caso de las citas, el acceso a ciertos “data sets” puede ser controlado con etiquetas semánticas sobre las fuentes, permitiendo a los usuarios dar créditos de forma adecuada a los creadores originales y permitiendo al creador, además, controlar quienes están accediendo o usando sus datos. Esto podría hacer que los científicos citaran con mayor facilidad servicios online en los Journals, comenta McGuinness.

Veremos cómo evoluciona esta iniciativa. De momento, el carácter abierto con que se plantea promete nuevos datos para la “Linked data web”, más allá de nuevos jardines vallados, como entorno distribuido, también, de construcción colaborativa de conocimiento, el mejor exponente de la www semántica abierta que nos conviene a todos.

Fuente noticia:  Fuente1Fuente 2.

Entrevista web semántica – 3.0 para la revista Computing

| September 22nd, 2009 | 11 Comments »

Muy buenas, las preguntas que me formulaban hace unas semanas, en una entrevista para la revista Computing sobre web 3.0 – web semántica.

La guardaba desde hace tiempo para una ocasión especial, como lo es el cambio de look de El caparazón.

Espero que os guste.

“¿Qué novedades plantea la Web 3.0? ¿Qué diferencias existe con respecto a la Web 2.0?

No existe un consenso alrededor de lo que es web 3.0. De hecho, una de las definiciones típicas es la que constata un hecho puramente cronológico: Web 3.0 es la tercera década de la web. Si significará o no un cambio cualitativo, tema que es indudable para la web 2.0 o social, es algo que no sabemos aún. Sí podemos describir algunas de las tendencias hacia las que parece dirigirse la web de hoy. Algunas representan características más disruptivas que otras (web semántica) respecto a lo que tenemos hoy.

Otras, que voy comentando en El caparazón, serían según los analistas más relevantes en el ámbito anglosajón, cosas como la web en tiempo real, la web ubicua(con conceptos como Cloud Computing o Telefonía móvil), el Embodiment, la Internet de las cosas o la web contextual (entendiendo la que personaliza la experiencia del usuario según su contexto social, geográfico, etc…).

Quizás la teoría más extrema al respecto sea la de la Singularidad, que según la definición oficial supone que el progreso tecnológico y el cambio social se acelerarán debido al desarrollo de inteligencia super humana, cambiando nuestro ambiente de manera tal, que cualquier ser humano anterior sería incapaz de comprender o predecir.

Recomiendo la serie de vídeos de Simón Hergueta, además de otros sobre el tema que recopilaba en una entrada reciente (al final).

¿Qué es la web semántica y qué retos plantea?

La web semántica es aquella que se construye en un lenguaje que los ordenadores pueden “entender”. Se refiere, más allá de la transmisión de señales, a la comunicación.

Es una web de datos escritos en formatos interoperables, de bases de datos compatibles que construyen algo así como ámbitos conceptuales globales en toda la web. Son datos, dicho de otro modo, que los ordenadores pueden interpretar, relacionar con otros, etc… para devolvernos resultados o una experiencia de usuario más cómoda y satisfactoria.

Para que todo ello sea posible (y ese es el reto básico), debe definirse un estándar (el W3C es el organismo encargado de ello) además de traducir los conceptos del mundo a códigos informáticos (ontologías, otro de los retos). RDF y derivados son formas de marcar el contenido de cualquier página web de forma semántica.

El reto está en la interoperabilidad (la necesidad de que todas las páginas se adapten a un mismo lenguaje), además de en la complejidad, a la hora de marcar contenidos e incluso de definirlos.

Es, sin duda, una web mucho más costosa pero más eficiente a largo plazo.

¿Qué iniciativas hay interesantes sobre esa web semántica? En España hay algunos ejemplos?

Hay muchas iniciativas interesantes en Intranets o en el ámbito de la gestión del conocimiento corporativo. También en aplicaciones en sectores “verticales”, en los que es más posible la creación de ontologías, el trabajo de base para el funcionamiento de la web semántica. El turismo sería uno de los más beneficiados al respecto. El sector farmacéutico, la automoción son otros de los que el W3C recoge en su directorio (incluyo enlace a la presentación correspondiente en español al final)

Menos frecuentes son a nivel “mainstream” o generalizado, aunque Wikipedia, ahora Bing y el mismo Google estén trabajando ya con algoritmos semánticos. Como aplicaciones de éxito podemos hablar de Twine, una herramienta intermedia entre lo social (o de intereses), propio de la web 2.0, y la web semántica, en el sentido de organizar la información que recibe (los marcadores sociales) con ayuda de código semántico. El resultado es bastante bueno, logrando recomendaciones automáticas bastante adaptadas a nuestros intereses. Read More

La adecuada gestión de la colaboración en organizaciones y la web 3.0

| September 10th, 2009 | 8 Comments »

Lo escribía hace unos meses Mark Radoff en Value-It blog, un espacio sobre web semántica que descubría hace poco gracias a Javier Carbonell y que os recomiendo especialmente:

Como parte de un estudio a largo plazo para la Comisión Europea, Ovum entrevistaba a varios administradores de IT  para intentar concretar Oportunidades y Amenazas en la adopción de software semántico en la empresa. Es una pregunta fundamental, que no falta en las diversas entrevistas sobre web semántica que me han realizado (os dejaré en breve la última, para la revista Computing):

¿Cuáles son las principales dificultades para la evolución de la web en ese sentido?

La respuesta, en este caso, me ha parecido tan sorprendente como relevante a la hora de apoyar una hipótesis que sostengo desde hace tiempo: el verdadero cambio de paradigma para la sociedad desde la web está en la web social y algunas de sus características son requisito fundamental para la evolución, tanto de la web como de la sociedad en su conjunto.

Volvamos un momento a los resultados, al descubrimiento de dos barreras fundamentales para la adopción generalizada de una semweb que ha demostrado ya su eficiencia, sobre todo,  en entornos cerrados (empresariales), pero que no termina de generar la confianza necesaria:

-Cierta resistencia a la “semántica” como término:

“[the term] Semantic web is a barrier. It’s associated with a vision of the web for 10 years to come. I make a point of not using ‘semantic web’”

El término “semántico” puede no ser atractivo para muchas empresas. Su uso abusivo en relación a resultados pobres hace unos años ha podido restarle credibilidad o mantener la idea de que la web semántica es algo a 10 años vista, absurdo y poco rentable ahora.

Escribo este artículo, no obstante, por la importancia de la segunda barrera identificada:

trabajo.jpg

-El verdadero obstáculo está en encontrar a gente que conozca de verdad el negocio:

La implementación de tecnologías semánticas requiere del mapeo de organizaciones, procesos, datos, terminologías, en un conjunto de conceptos, las ontologías o mapas conceptuales. Dicho en otros términos, es difícil encontrar empleados que conozcan bien, a través de varios departamentos, el negocio.

Lo hemos dicho en ocasiones al hablar de comunidades: la división en departamentos estancos propia de la organización del trabajo tradicional en empresas constituye un obstáculo a la necesaria fluidez del conocimiento.

Software colaborativo, comunidades de práctica (interdepartamentales, transversales a distintos departamentos, correspondientes a funciones, objetivos, procesos y no estrictamente a ámbitos de competencia), son pasos necesarios, incluso imprescindibles a la adecuada gestión del conocimiento en la empresa.

Recordemos, en este sentido a Wenger, que proponía ya en 1998 las CoP como acercamiento a la solución de este tradicional problema en empresas cuando es frecuente que el conocimiento importante se distribuya entre distintas unidades de negocio.

Las CoP (ahora virtuales o mixtas), pueden tener como objetivo eliminar o paliar los efectos de este tipo de barreras, que tienen su origen tanto en la organización jerárquica de las empresas como en la tradicional cultura del empleado insatisfecho (sostengo como ventaja fundamental de las comunidades la mejora en términos de satisfacción personal y clima laboral) y la ley del mínimo esfuerzo que puede aplicar a su desempeño.

Metáforas como la del agua o la electricidad se han utilizado a menudo en este sentido. Si el conocimiento no se entiende como algo que no tiene sentido si no fluye, si no propiciamos cambios en la cultura organizacional de la vieja lógica de “la información es poder” a la nueva de “la información compartida y contextualizada (también en un sentido temporal, actualizada) es poder”, si no es posible, en definitiva, la inteligencia colectiva, será imposible proveernos de herramientas (como las de la web semántica) que la potencien.

avaricia

Es importante, así, como vemos casi diario aquí, el cambio en el “mindware”, en la cultura empresarial hacia la colaboración.

O dicho de forma más definitiva, en cierto modo, a nivel de recursos humanos, de gestión del conocimiento intramuros, la empresa 2.0 es un paso previo a la empresa, en ese sentido, “semántica”.

Desmotivación laboral, avaricia con la información, miedo a la transparencia son todas problemáticas que intentamos abordar mediante Comunidades, software colaborativo o  recursos e ideas de la web social y que como vemos pueden significar, incluso, el estancamiento, a nivel tecnológico – de eficiencia, de la empresa.

Relacionados:

La cara oculta de la tecnología RFID y la web de las cosas

| September 4th, 2009 | 5 Comments »

Pensaba hace un rato en los efectos sociales de la web semántica, en cómo siendo algo que sigue estando por construir y resultando algo impredecible la dirección que irá tomando, estamos a tiempo de pensarla, de construirla. ¿Será tan disruptiva como la web 2.0?

¿Viviremos algún Black Swan Event (Teorías del cisne negro, o The black Swan, sobre eventos impredecibles y disruptivos) entorno a ella?

Son varios ya los grupos, espacios foros, blogs que miran al 2020. ¿Cómo será entonces el nuevo entorno en el que, al parecer participamos de forma algo más democrática que nunca antes?

Es arriesgado opinar aún pero diría que podrían ser otras, potenciadas por la eficiencia de sistemas sémánticos, las tecnologías que realmente pueden significar revoluciones.

Se habla mucho en estos días de la web de las cosas, de la tecnología RFID, de la web al cuadrado, este último un nuevo concepto, formulado por Tim O’Reilly y John Battelle, que significaría un crecimiento exponencial, más que artimético de la web a partir de la intersección de las tecnologías de la web social con la Internet de las cosas (objetos reales conectados a la red por medio de sensores).

Ampliar información sobre productos antes de comprarlos, tarjetas multiuso como moneda en ciudades, dependerán de la proliferación de etiquetas RFID y lectores en móviles, tarjetas de crédito, etc…

Asusta un poco pensar en las consecuencias, en cuestión de amortización de puestos de trabajo que todo eso puede suponer, a pesar de abaratar el coste del producto. Asusta también pensar en temas como la privacidad, en el volumen de datos que sistemas de este tipo introducen en la web, en cómo puede aumentar el potencial y por tanto, la amenzaza, de la siempre controvertida publicidad basada en comportamiento (Behavioral ads, Behavioral targeting).

Un artículo reciente en Wired UK resumía este tipo de escenario, el que puede ser habitual en poco tiempo:

verichip-protest-277w

“Imaginemos lo transparentes que son nuestras preferencias personales para los anuciantes cuando el “clickstream” del mando del televisor se mezcla con la historia de exploración web, los datos de nuestra tarjeta de crédito, nuestro email, grabaciones de nuestros movimientos via cámaras con reconocimiento facial, etiquetas identificadoras por radio frecuencia y mapas de señales de nuestro teléfono móvil”

Nos preocupa la privacidad en las redes sociales, la posibilidad de que nuestros datos estén en venta con objetivos publicitarios, pero imaginemos que los datos anteriores, generados por muchas de las aplicaciones de la web de las cosas,  pueden ser consultados por futuros empleadores o posibles encargados de calcular el precio de seguros de salud….

Existen campañas, movimientos contra las tecnologías RFID. Katherine Albrecht, responsable de CASPIAN (Consumers Against Supermarket Privacy Invasion and Numbering) y Spychips, un sitio dedicado al tema que nos ocupa,  las identifica como lo peor que ha ocurrido y ocurrirá a nuestra privacidad como consumidores.

Si bien es cierto que creo que se exageran, en ocasiones, los términos en campañas de este tipo, que dibujan las peores pesadillas distópicas de Orwell,  creo que es importante que estemos alerta sobre nuestros derechos como usuarios, también, de la web 3.0.

Relacionados:

Minería de datos y sentimientos en la web, herramientas clave en la evaluación de actuaciones en los social media

| August 25th, 2009 | 3 Comments »

Aunque me cuesta aceptar que el adjetivo “sentimental” sea el más apropiado para definir sistemas más cualificados – completos para medir el “zeitgeist”, el estado de opinión sobre determinadas cuestiones en la web, quería hablaros de una serie de desarrollos que van, en los últimos tiempos, en ese sentido.

Hace tiempo que la reputación digital, su medición para empresas que se sienten vulnerables en el nuevo entorno apunta como uno de los negocios más claros en la red y creo que lo que viene a continuación tiene que ver con ello. También con el análisis de tendencias en mercados dinámicos, más cambiantes y probablemente predecibles que nunca.

Le llamábamos hasta ahora “datamining”, recogida y procesamiento de datos como muestra de la inteligencia colectiva, pero parece que ahora las tecnologías van siendo cada vez más capaces de captar sus matices:

Así, el NYT titula un reciente artículo de este modo: “Minería de sentimientos, no de hechos, en la web“. Y nos habla de herramientas comerciales, destinadas a empresas, como Scoutlabs, Jodange (que incorpora datos de más de 450,000 fuentes, incluyendo medios digitales masivos, blogs, twitter, etc… y trabaja en la elaboración de predicciones de futuro) Newssift, etc…

Para usuarios de a pie,  Tweetfeel, Twendz y Twitrratr permitirán tomar el pulso a Twitter,  la que ya se denomina el alma de la web, significando versiones simplificadas y gratuitas de las anteriores que podéis probar para una visión práctica de todos estos nuevos conceptos.

RWW listaba hace unos días nuevos servicios: Syosmos, Backtype, Evri y su API de medición sentimental, etc…

evri_sentiments_2Captura de pantalla Evri

Faltan todavía definiciones de inteligencia, sentimiento y su interacción que den sentido a cualquier análisis serio. Leía ayer mismo al respecto un interesante artículo que podríamos pensar en el contexto de la relación entre desarrollos tecnológicos y ciencias sociales, ¿Tienen futuro las ciencias sociales?….  ¿Están fundamentados de forma teórica ciertos desarrollos tecnológicos que se deberían partir de definiciones conceptuales desde distintas disciplinas no tecnológicas?

Así, Evri y su API sentimental,  parten de análisis contextuales, muy ricos en cuanto a su carácter de semánticos, pero  sin profundizar demasiado en la psico-sociología de la opinion, mientras que otros, como Bo Pang, investigador en Yahoo intentaba con  “Opinion Mining and Sentiment Analysis,” uno de los primeros libros académicos acerca del análisis sentimental de los datos, aportan una mirada mucho más profunda al tema:

“El software que desarrolla incluye distintos filtros de mejora cualitativa de los resultados, como la polaridad (carácter negativo-positivo del estado de opinión), la intensidad (¿cuál es el grado de emoción que se expresa?) y la subjetividad (¿cómo de parcial o de imparcial es la fuente que expresa las opiniones?). Un ejemplo claro sería la preponderancia de adjetivos como signo de subjetividad…”

En fin… sea como sea, más allá de lo descriptivo, creo que este tipo de instrumentos serán los que ayuden a definir cuestiones como el ROI (retorno de la inversión), cuando nos planteamos iniciativas de intervención en la reputación digital de nuestros clientes.

Creación y gestión de canales de identidad corporativa en los Social Media e incluso la creación de comunidades, son acercamientos actuales al tema y ámbitos en los que creo que florecerá la aplicación de este tipo de análisis como forma de evaluación o mejora.