Posts Tagged ‘semantizacion’

Twine, futuros desarrollos (cuando la personalización total en publicidad es contenido)

dolors reig | June 2nd, 2008 | 5 Comments »

Por si no la conocéis, Twine es una de las primeras herramientas de la web3.0. Fue anunciada el pasado mes de octubre y sigue actualmente en fase beta. Uno de sus máximos exponentes, Nova Spivack, asistió recientemente a la Semantic Technologý Conference2008, de la que ya os he hablado, lugar en el que concretó algunos detalles curiosamente anticipados en el artículo publicado anteriormente: Twine, tejido social de ovillos semánticos.

Su lectura os proporcionará ideas sobre la web semántica y su futuro, incluso, como estrategia de comercialización de contenidos bajo la lógica que empieza a aparece en el ámbito del márketing en internet: la publicidad, orientada a intereses y totalmente personalizada puede llegar a ser considerada como “contenido”.

Pasemos a ver un resumen de la presentación de Nova:

-El foco de Twine está en los intereses: Si Facebook sirve para las relaciones y LinkedIn presta soporte al desarrollo de nuestra arrera profesional, Twine sería una red de intereses, más que una red social. Las palabras clave son organizar, compartir y descubrir.

-Los ovillos semánticos, los distintos Twines que podemos crear o a los que podemos aportar distintos contenidos, son una metáfora o expresión de lo que se entiende por ontología (formulación de un exhaustivo y riguroso esquema conceptual dentro de un dominio dado, con la finalidad de facilitar la comunicación y la compartición de la información entre diferentes sistemas)

Así, además de integrar las existentes, la propia evolución de la herramienta incluye preparar otras ontologías e integrarlas en twine. Después, en una fase posterior de desarrollo, permitirá a la gente crear ontologías propias.

-Twine procesa de forma natural texto, proveyendo autotagging con capacidades semánticas. Tiene una ontología subyacente con un millon de instancias de miles de conceptos para generar esas etiquetas (por ahora solo se exponen algunas de ellas). Radar está trabajando en el análisis estadístico de clusters de contenido relacionado, la mayoría de los cuales serán lanzados en otoño (qué personas, items e intereses están interrelacionados). Twine usa inteligencia artificilal para crear esos clusters.

-La búsqueda dentro de Twine posee capacidades semánticas. Podemos filtrar bookmarks según las compañías con las que estén relacionados, o según el lugar del que provienen.

-Twine pretende popularizar entre el público general la web semántica. Para ello, recoge durante este período de prueba algunas críticas respecto a la necesidad de simplificar la interface, haciéndola usable incluso para gente que no sabe nada sobre datos estructurados o autotagging (actualmente podemos tardar unos días en “captar” su funcionamiento)

-Cuando los grupos empiecen a usar Twine, la inteligencia colectiva dará un salto adelante. Se trata de bases de conocimiento común similares a Wikia o Freebase. Pero a diferencia de otras bases de datos, en Twine, más de la mitad de los datos y actividades son privados (60%). La privacidad y el control de permisos es importante en los datos de Twine.

-Twine utiliza 8 conceptos clave: sujeto, objeto, predicado, fecha, confianza, valor, procedencia, y otros datos estadísticos sobre el item en sí mismo. Pueden hacerse inferencias de predicado a través de cuentas, control de acceso, etc…

-Se habló, por último, del estado beta en que se encuentra Twine. Ha habido 20000 usuarios de prueba, 9000 twines creados, 150000 items añadidos, 60% de twines privados, etc…y cada pocas semanas se añaden nuevas funcionalidades (importación de marcadores, interoperabilidad con otras aplicaciones y la habilidad de usar ontologías)

-El nivel ontológico supone que seremos capaces de extraer los datos propios fuera de Twine en formato RDF, FOAF, SIOC o Dublin Core, los lenguajes principales de la web semántica.

-Se trabaja actualmente en la posibilidad de importar los marcadores en del.icio.us, Digg, marcadores de escritorio, contactos de Outlook y muchos más. Será en otoño cuando todos estos desarrollos salgan a la luz. Primero será la interoperabilidad con Freebase y otras aplicaciones semánticas. También, tema importante para la rentabilización de la herramienta, con Amazon.

DBpedia está ya integrada de forma parcial en Twine. Como las URI de Wikipedia, que están siendo ya utilizadas en la identificación de tags y cuya integración irá también en aumento.

-Sobre la rentabilización, clave para que todos estos desarrrollos sean posibles, el perfil semántico que Twine establece sobre usuarios y grupos hace que pueda acercarse de forma bastante precisa a sus intereses. Twine empezará a mostrar contenido esponsorizado basado en estos intereses. Cosas que pueden ser muy relevantes en cuanto a intereses pueden ser consideradas casi como contenidos, incluso si son esponsorizados. Pronto veremos pruebas de este tipo de publicidad en Twine.



Calais, nuevas herramientas semánticas (de etiquetado) para nuestros blogs

dolors reig | May 20th, 2008 | 5 Comments »

Iba a presentaros los plugins “no oficiales” de Calais, Auto-tagger y Archive-tagger para wordpress (autoalojado) cuando leo que Reuters ha presentado la segunda versión de su API, o toolkit de herramientas semánticas, Calais 2.0, con herramientas similares a las primeras pero que prometen funcionar de forma efectiva con contenidos más genéricos.

En el caso de los dos primeros, que sigo recomendando para quienes alojéis un blog en wordpress (que corra en un servidor con PHP5), se trata de extensiones que auto etiquetan los contenidos del blog. Parece que funcionan mejor con contenidos sobre tecnología o negocios.
Archive tagger, en mi caso, aplicado a semanticaweb.info ha generado muy buenos resultados de la ejecución del etiquetado automático, en menos de 5 minutos, de unos 200 posts.

Probadlo…no os defraudará.

Hoy mismo, la misma empresa, ha lanzado Calais 2.0 como marca que incluye una docena de nuevas “entidades” o grupos temáticos semánticos. Reuters, la empresa responsable quiere ampliar sus servicios para bloggers y similares que traten sobre temáticas como la música, el entretenimiento general o los deportes, la medicina, productos farmacéuticos, etc…

Podéis encontrar en el sitio web de Calais una galería de aplicaciones desarrolladas que podemos usar, como plugins para Firefox, analizadores de contenidos en los feeds, visores de documentos, etc., todo ello basado en el API de Calais, capaz, no sólo de trabajar con los típicos documentos RDF de la web semántica sino también con folksonomías, tags o metadatos.

  • Calais Marmoset es una herramienta que permite a los desarrolladores crear metadatos de forma automática. Está especialmente adaptada a los resultados que lee la plataforma open search de Yahoo y Search Monkey(similar a triplify, de la que también hablamos)
  • Tagaroo, un plugin para Wordpress que permite etiquetar de forma automática personas, lugares y cosas en cada post, así como realizar sugerencias sobre imágenes semánticamente relevantes en Flickr.
  • Plugin de Calais para Drupal, un gestor de contenidos bastante popilar desarrollado por Phase2Technology.
  • Gnosis, un complemento para firefox, similar a Zemanta, herramienta de la que hablamos extensamente hace un par de meses.

No he tenido tiempo de probarlo todo…pero en el caso de Taggaroo, plugin para wordpress, la instalación es fácil y sólo puede despistaros al requerir, como Akismet o WpStats, un código API que obtendremos registrándonos en Calais para su funcionamiento (compatible con versiones 2.3 o superiores)

Está apoyando la redacción de este artículo y me ha gustado especialmente en cuanto al apoyo de imagen. Os dejo algunos de los resultados o sugerencias seleccionadas de las 429 imágenes de Flickr asociadas a etiquetas que ha devuelto, escalables a distintos tamaños:

(Escribiendo en español lo ideal es entrar los tags manualmente para después buscar entre las fotografías de Flickr que el sistema, en base a estos, propone)

En cuanto la sugerencia a tags o etiquetas, quizás por la temática de este blog y su asociación con los tópicos en los que se especializaba Autotagger, lo prefiero. Los resultados que arrojó para semanticaweb fueron espectaculares.

Repetir por último que, como en el caso de Zemanta, los resultados en español aún son pobres. Si escribís sobre fuentes en inglés os recomiendo trabajar en el editor de posts con estos en versión original antes de la traducción (uno de mis “trucos” o dinámicas de trabajo).

Hablaremos en próximos posts, por su compatibilidad con Blogger y cualquier otro tipo de sistema que utilicéis, de Gnosis y similares, complementos para el navegador que son útiles también a la hora de hacer más “semánticos” nuestros posts.



Nova Spivack: Entender (ahora sí) la web semántica (presentación)

dolors reig | April 29th, 2008 | 6 Comments »

Es un tema frecuente en este blog. Incluso, en cuanto pueda, le dedicaré un espacio específico en el wiki.

Llevo un tiempo intentando encontrar definiciones claras para algo tan complejo como la web semántica (en este post sobre herramientas de semantificación, por ejemplo), como otros blogs a nivel nacional e internacional (ReadWriteWeb), que incluso han planteado concursos que buscan una definición asequible sobre la esencia de eso que ya denominamos web 3.0 (en la presentación se habla incluso de 4.0).

Y es así porque, como veréis también en la presentación, el nivel de complejidad que unos 10.000.000 de bloggers en el mundo hemos aportado a la web es inmanejable (una aguja en un pajar, como también nos comenta Spivack) siguiendo los sistemas estadísticos (Google) actuales. Me he quedado con ganas (lo haré si me llega la “ansiada” invitación) de probar Twine, la herramienta que centra esta presentación. Si queréis entender de una vez por todas hacia dónde nos dirigimos y os pasa como a mi mientras realizaba esta traducción, esta presentación es ahora vuestro lugar.

A pesar de la licencia libre del documento he solicitado permiso a Spivack para subir a Slideshare la traducción. Espero que no haya problema y que nos permita disfrutar de su trabajo.