Archive for the ‘buscadores alternativos’ Category

Los nuevos entornos de información personalizada

| April 10th, 2009 | 6 Comments »

Sobreinformados, cierto. Abrumados de nuevas aplicaciones que prometen mejorar lo que, hasta cierto punto, ya nos funciona.

Creíamos que la etapa de consolidación de la web 2.0 iba a ser la de reducción, por selección natural, de servicios y fuentes, pero quizás no esté siendo así.

Trabajo en una presentación acerca de lo que es, será o debería ser (tenemos el privilegio de que está por construir y por tanto, como prosumidores, cierto poder sobre la dirección que tomará) la web 3.0

Y creo que incluiré, como tema fundamental además del semántico, las nuevas aplicaciones de personalización de la experiencia en la web.

A ese objetivo, el de crear entornos personales de filtrado de la información que creemos relevante se dirigen aplicaciones de “mashup” de distintas fuentes o lectores de feeds más o menos sofisticados, como Netvibes, Pageflakes,  Igoogle, Yahoo Pipes o mi hasta ahora insustituible Feedly o el resto de lectores de noticias personalizados que quiero presentaros hoy.

Si nos aproximamos a ellos con calma, sin vivirlos como nuevas aplicaciones que vengan a colmar el vaso repleto de lo 2.0 sinó como meta-herramientas de filtro y optimización de lo que ya tenemos, si dedicamos algún tiempo a configurarlas, a apropiárnosla, creo que terminaremos viviéndolas como rentables.

Establezco antes de empezar a describir algunas de las más relevantes entre las novedades, una diferencia que creo importante. El primer bloque tratará sobre herramientas de filtrado “ajeno” de la información, algo así como planetas de las noticias más populares que contienen múltiples temáticas y pueden ser personalizados sólo hasta cierto punto. Van más allá de los portales genéricos de los periódicos o la prensa digital pero siguen sirviendo a objetivos publicitarios además de informativos y nos ofrecen  aún un nivel medio de personalización:

1. Agregados de noticias de los medios más populares (predefinidos):

  • Kosmix, supuesto Google Killer de forma, en mi opinión, exagerada: Aunque lo máximo que podemos personalizar es la disposición de las distintas ventanas (al estilo Netvibes), puede ser una buena forma de acercarnos al concepto de entorno personal o una puerta de entrada adecuada para personas con poca experiencia como consumidores de información en la web.

kosmix-the-web-organized-for-you_1239380457424

  • Shyftr añade la posibilidad de añadir fuentes propias y desde hace unas horas, el concepto de filtros personalizados. Me ha recordado alguna lectura sobre el futuro, vinculado a la web semántica, de los PLE, EVA o entornos personales – virtuales de aprendizaje,  que consistirán, más que en agregados de fuentes, en agregados de resultados de búsqueda según términos de interés.No es el tema de este post y seguro que lo vemos con más calma, pero de momento, tenéis una buena revisión de las posibilidades que abre Shyftr en el blog de Louis Gray. He solicitado invitaciones y quedo a la espera de poder profundizar más:

shyftr_1239381358248

¿Evangelización de la autonomía informativa? Creo que ambos son, como leíamos para Facebook en el ámbito de las redes sociales, una buena forma de empezar a crear entornos personalizados sin dejar que el caos nos abrume.

2. Agregados de noticias personalizados (con algunas fuentes predefinidas  pero que permiten añadir fuentes de elección propia (más similares a lectores de feeds):

meehive-daily-hive_1239381637996

Resultan parecidos incluyendo (como no) búsquedas en twitter y responden al segundo modelo del que os hablaba, que permite, para usuarios avanzados, más autónomos, probablemente productores además de consumidores de información,  personalizar al máximo los contenidos que queremos leer.

Si añadimos, además, feeds de etiquetas en delicious o de twines de interés, podemos satisfacer necesidades exigentes como las que podemos tener si trabajamos, investigamos o estudiamos en la red.

Relacionados:

Usabilidad y ontologías: Nuevo paso en la evolución de la semweb de la mano de Twine

| March 19th, 2009 | No Comments »

Me entrevistaban el otro día acerca de la web 3.0, la web semántica y me resultaba difícil, a pesar de la experiencia en varios talleres sobre el tema, acercarla al usuario sin mencionar la primera aplicación que se ha encargado de ello: Twine.

Quería dejaros, además de la noticia sobre este nuevo e importante desarrollo, algunas de las cosas que les comentaba:

Sobre si hay empresas trabajando hoy en la construcción o desarrollo de la web 3.0….

“Muchas empresas trabajan para la web semántica y pueden forzar a Google (elemento imprescindile para convertirla en “mainstream”) a reconocer que la adopta o adoptarla en algunos puntos.  Twine, una aplicación que está haciendo de algún modo de puente hacia esta (ya es casi tan popular como delicious), está a punto de lanzar un servicio para hacer más fácil la escritura de datos semánticos (ontologías). Otras empresas como Hakia o Yahoo llevan ya tiempo incorporando todo esto a su buscador…. y Kumo, el nuevo buscador que lanzará este año Microsoft y que puede suponer una seria competencia para Google, adoptará, además de mecanismos propios de la búsqueda vertical y sintáctica, elementos de la semweb.”

Sobre si la web semántica sustituye a la actual….

“La web semántica es una capa añadida a la web actual, no la sustituye. Añade significado visible a los buscadores que mejora la eficiencia, la experiencia de usuario de la web, pero en cuanto a lo formal, el diseño de lo que vemos actualmente no va a cambiar demasiado.”

Sobre el porqué de la no adopción o la adopción partcial por parte de algunos buscadores, de la semweb:

“La construcción de ontologías (lenguajes, algoritmos que dirían a los ordenadores cuándo una cosa es un lugar, una persona, un evento, una organización, qué relaciones tiene con otras cosas, qué componentes la integran, etc…) es compleja y no existe hoy ningún buscador que pueda ser demasiado preciso en todos los ámbitos de conocimiento. Mientras no estén desarrolladas todas las ontologías, tendrán que combinar, como lo hará Microsoft, distintos sistemas.”

Como idea general, es una web más eficiente, más adaptada a nuestro lenguaje natural como humanos, más independiente de nosotros. (Tenéis en Presentación: Construyendo entre todos la web semántica. un buen tutorial básico para su comprensión)


Pero vayamos a la noticia que ha motivado este post: Twine, que parece que está creciendo hasta el punto de aproximarse a la popularidad de delicious, prepara una herramienta “usable” para la creación de ontologías, base para asegurar la eficiencia de la web semántica.

Hemos escrito mucho aquí acerca de Twine. Su bookmarklet, que acaba de mejorar, quizás sea su característica más popular. Con un solo click en páginas con microformatos adecuados (u otros marcadores semánticos) se etiquetan de forma automática los contenidos, clasificando Twine cada concepto clave según sean personas, lugares y otros tipos de información para mejorar su eficiencia como portal de búsquedas y recomendaciones afines a nuestros intereses.

El ahorro de tiempo y la precisión (en inglés) suponen, respecto a Delicious, una importante ventaja y así parecemos haberlo valorado los usuarios:

Según Nova Spivack en RWW, Twine, si sigue creciendo al ritmo actual, habrá sobrepasado a Delicious, una de las herramientas fundamentales de la web 2.0 en verano de este mismo 2009.

Sobre la nueva aplicación, que será lanzada, previsiblemente, este año, es destacable que se lanzará con licencia Open Source, así como que las ontologías creadas no trabajarán únicamente en Twine sinó que podrán ser utilizadas por cualquier aplicación.


ontologysite

La complejidad, el trabajo que supone crear ontologías (según Wikipedia son la formulación de exhaustivos y rigurosos esquemas conceptuales dentro de uno o varios dominios dados con la finalidad de facilitar la comunicación y la compartición de la información entre diferentes sistemas y entidades), hace que a día de hoy sean aún pocas las creadas, la mayoría en temas de tecnología)

La dificultad de semantización de los contenidos es, como veíamos, uno de los principales argumentos de Google para la no implantación de tecnologías semánticas en su buscador. Así, herramientas usables para crearlas podrian cambiar de forma radical este escenario, suponiendo un paso importante en la evolución de la web semántica.

No será la primera en ese sentido: Protege o CmapTools Ontology editor, que parte de la idea de los mapas conceptuales para ayudar a la edición de ontologías llevan tiempo trabajando. También Microsoft, que parece que apuesta desde hace tiempo como ventaja estratégica por la web semántica, anunciaba hace poco un nuevo complemento de semantización para Word 2007 que permite a los autores anotar palabras o frases con términos definidos en ontologías externas.

Pero si esta promesa de Twine es capaz de trabajar de forma tan intensa por la usabilidad como lo ha hecho la firma hasta hora con su aplicación para redes de interés, creo que puede acelerar de forma significativa la evolución de la web.

Os dejo, para finalizar, el usuario de El caparazón en Twine.

Twitter y la “real time web”: Extensión para búsquedas google-twitter desde Firefox

| March 3rd, 2009 | 8 Comments »

Web en tiempo real, búsqueda sincrónica, hablábamos hace poco de que el futuro de twitter podría pasar precisamente por aquí, por ser el protagonista de la “segunda caja de búsqueda”, independiente o integrada en google, en tiempo real de contenidos relevantes por actualidad.

Veíamos también una atractiva aplicación, mezcla de Twitter, Digg y web contextual social que recopilaba los enlaces de nuestros contactos (following) en twitter en un solo lugar (Microplaza)

Pues bien, ,solo días después ya podemos ver, de la mano de un script para Greasemonkey, las primeras implementaciones de la idea de Twiter en el mercado de las búsquedas.

Realtime Twitter Search Results on Google es una extensión para Firefox (necesita la instalación de Greasemonkey) que muestra los 5 twitts más recientes para el término de búsqueda que introducimos en la caja de Google:

el-caparazon-buscar-con-google_1236068481893

Para obtener resultados como los de la imagen deberemos, en este orden:

1 Instalar el Script Greasemonkey.

2 Instalar la extensión Resultados de twitter para búsquedas en Google (pulsad el botón Install en negro a la derecha de la página)

3 Probarlo, acudiendo al buscador e introduciendo un término.

Simple, pero podría serlo todavía más si pudiéramos obtener, como vemos a la derecha de la imagen, resultados similares instalando el plugin de WebMynd oneriot, con funciones parecidas.


Simple y sorprendente, al estilo de Twitter, herramienta que marcábamos como la que podría experiementar un crecimiento más espectacular durante el año en curso. No nos equivocábamos

En fin… sirva hoy de despedida la cuenta de El caparazón en Twitter.

Relacionados

La fiebre de twitter “incluso amenaza a google”

MicroPlaza: microblogging contextual social o el Techmeme personalizado de Twitter

Headup, navegación social contextual – semántica

| January 13th, 2009 | 4 Comments »
Headup es una muestra de la Web contextual social. Tenemos pendiente la segunda parte del post, sobre aplicaciones prácticas de esta y merecerá sin duda un espacio. Me ha recordado a Glue, la extensión semántica de Adaptive Blue para Firefox que asocia determinados contenidos mientras navegamos a items en Amazon, Librarything y otros servicios. También a Juice, que ya revisamos.

En el caso de Headup, ha sido otra de tantas de las aplicaciones que encuentro a veces, instalo en la barra de Firefox y compruebo antes de presentarla. Y os la presento porque en muy poco tiempo, me han sorprendido muy positivamente sus resultados en cuanto a relevancia.

home_logo
La idea es la identificación y marcado de ciertos items de las páginas que visitamos. Situando el cursor sobre ellos se abrirá una nueva ventana con resultados sobre contenidos afines en servicios web populares.

El criterio, el filtro que guía los resultados es social: Aportando nuestros nicks y contraseñas en Twitter, Friendfeed, Facebook, cuentas de correo de las que extraerá nuestros contactos, etc…podremos acceder a información relevante acerca de los items detectados. En especial me ha resultado especialmente atractiva la pestaña “Web activities” en la que se reflejan las actividades en la web (Twitter, Friendfeed, Facebook) de nuestros contactos al respecto de determinado item, una característica nueva y que  creo que, entre otras, convierte a la herramienta en bastante útil y distinta a las arriba mencionadas.

Os dejo vídeo explicativo de sus creadores:

¿Google se está abriendo algo a la web semántica?

| January 7th, 2009 | No Comments »

Resultaba extraño que después de la adquisición de Powerset por parte de Microsoft, y a pesar de las múltiples manifestaciones de desconfianza hacia esa nueva forma de entender y codificar la web, Google se auto situara al margen de la evolución.

Fue una de las preguntas y reflexiones más interesantes de las que surgieron durante el último taller sobre web semántica que realicé:

-¿Y Google no está incorporando algoritmos semánticos? Mi respuesta se ve confirmada por lo datos que nos reportan hoy desde RWW. Quizás no de forma manifiesta pero difícilmente no existan en Google experimentos ni equipos de trabajo trabajando al respecto, digan lo que digan en comunicados oficiales.

Así, parece que los ejemplos comparativos que utilizábamos al comparar la vieja y la “nueva” forma de entender la web, la web semántica, van a dejar de sernos útiles: Desde hace poco, las búsquedas sobre fechas de nacimiento, conexiones familiares y otros tipos de información relacionada obtienen resultados en información estructrurada de forma explícitamente semántica. Preguntas como Who is Bill Clinton’s wife? What’s the capital city of France? obtienen resultados en forma de sujeto-predicado-objeto, o “tripletes” en términos semánticos.

Y las respuestas no están estructuradas de ese modo en las páginas de las que provienen. Parece, más bien, que Google crea estructura semántica desde datos semiestructurados o no estructurados (no marcados semánticamente) en absoluto. Dicho de otro modo, los resultados no son sólo de Freebase o Wikipedia, que los presentan estructrados, sinó de otros sitios que no trabajan con “tripletes” (sujeto-predicado-objeto, lenguaje RDF)

what-is-the-city-capital-of-france-buscar-con-google_1231356042557

Parece que los resultados son similares a los que devolvía hace unos tres años un viejo programa de Google, Direct Answers, aunque sus resultados eran mucho menos precisos.

No está claro que Google esté creando datos estructurados en páginas que no los contenían. Sería un error concluir en que se están realizando análisis semánticos sólo porque algunos de los resultados reportados aparecen en la forma sujeto-predicado-objeto (base del lenguaje semántico RDF), pero está claro que aparecen, son extraídos de páginas que a priori no siempre los contienen.

A la espera de tener más información, deciros que no llega a la precisión de Yahoo, que lleva tiempo trabajando con algoritmos semánticos. Además, el hecho de que Google no aporte datos RDF sobre las páginas, resta utilidad a la supuesta mejora en términos de su posible aprovechamiento por parte de terceras aplicaciones.

No es fácil la creación de datos estructurados a partir de cero, a pesar de que supondría una base común que permitiría innovar en mayor medida que la web común actual.

Terminar este artículo planteando un posible escenario. ¿Y si Microsoft adquiriera finalmente a Yahoo? La tecnología de Powerset y la de Yahoo juntas, por no hablar de la potencia de la imagen de una unión de marcas como esa….¿No sería quizás entonces el tema semántico un posible valor diferencial lo suficientemente fuerte como para resultar competencia para quien parece estar decidiendo a espaldas de estándares y del interés común la web del futuro?

Me gustaría dejaros algunas reflexiones más, derivadas de la discusión surgida entorno a este dato:  resulta extraño, de entrada, que una compañía que se auto define como abierta y transparente no responda claramente sobre este tipo de cuestiones. Es posible, como argumentan algunos, que Google esté experimentando cosas de forma contínua, llevando a cabo unos 50 a 200 experimentos a la vez, lo cual explicaría la “¿imposibilidad?” de hablar públicamente de todos ellos.

En fin… os mantendré informados.

Relacionados:

Llega con fuerza la Web Contextual (1)

| December 25th, 2008 | 7 Comments »

Decíamos al final del artículo sobre tendencias en la web para 2009 que se aventura un futuro en el que el objetivo será combatir la sobreinformación, que a pesar de la progresión creciente en nuestras habilidades cognitivas para procesarla adecuadamente, nos llevará a ser mucho más selectivos, a filtrar bajo criterios sociales o (otra vez) semánticos, cada vez más y con herramientas más eficientes, nuestras fuentes de información en la red

La idea es poderosa y parece ir un paso  más allá de los estrictos criterios que parece exigir cualquier aplicación para poder ser considerada semántica: La web contextual pretenderá que navegadores y páginas reconozcan con mayor precisión lo que el usuario realmente quiere encontrar. Menos opciones y más significado, menos búsquedas en Google y más contexto, persiguiendo las siguiente mejoras en la experiencia de usuario:

  • Relevancia: entender mejor el contexto conlleva mayor relevancia de los contenidos para el usuario.
  • Eficiencia – Atajos: Los atajos contextuales facilitarían las búsquedas.
  • Personalización: El contexto está basado en las intenciones y la historia de navegación del usuario.
  • RemezclaMashups: en entornos abiertos, puede devolvernos información relevante e interoperable entre servicios de la web (Ubiquity puede insertar un mapa en un correo electrónico de forma muy fácil).

Este  tipo de tecnologías contextuales tienen en muchas ocasiones como base lenguajes propios de la web semántica. Se basan también en la filosofía de las APIs abiertas (que permiten la interacción entre distintas aplicaciones de la web).

El html plano, sin marcas semánticas, xml, rdf o microformatos, entre otros lenguajes de marcado semántico (metadatos), no permitía la interacción con el navegador a los niveles actuales. Hoy, cuando el navegador puede inferir ideas acerca de las páginas que visitamos, es capaz de devolvernos información relativa y/o relevante.

Tal y como decíamos al hablar de la web semántica, la web contextual entiende  mayor medida el comportamiento del usuario. La combinación de la información sobre la página con el comportamiento del usuario es lo que crea el contexto y por tanto, una web más inteligente.

No creo que como afirma Alex Iskold, de quien extraigo algunas de las  ideas en este post, la web contextual vaya a sobrepasar, a superar en cuanto a su frecuencia de uso, la costumbre de hoy de aproximarnos a la información a partir de resultados en el buscador. No en un primer momento, desde la premisa lógica de que no hay contexto sin información previa (información+comportamiento=contexto) y por tanto la primera aproximación a lo que buscamos deberá pasar casi siempre por buscadores, pero sí después, evitándonos muchos clicks innecesarios  y haciendo por tanto mucho más eficiente nuestra navegación posterior.

Creo, además, más allá de la idea original, que el tema debe incluir algunas cosas más, que también deben ser consideradas contextuales:

-La geolocalización, o oferta de contenidos según el lugar desde el que esté físicamente el usuario

-Los contenidos de relevancia “social”, aquellos que preferimos porque son los que prefieren nuestros contactos en redes sociales.

-También aprendería de nuestro comportamiento como usuarios, evitándo que nos encontremos una y otra vez con resultados que consideramos irrelevantes (Google está poniendo en práctica ya un sistema de filtrado de resultados personalizados según nuestras valoraciones previas, Google SearchWiki)

Una de las formas de aportar metadatos a las páginas que escribimos son los microformatos:

Presento siempre los microformatos como precursores, de fácil comprensión, de la web semántica.  Ofrecen una forma compatible con los estándares XHTML de embeber metadatos sobre diversas cosas, diciéndole al navegador que son gente, lugares, eventos, revisiones, etc…

Los Web Slices, introducidos por Internet Explorer 8, por ejemplo, entienden el microformato hAtom. Los Web Slices permiten a los que publicamos contenidos notificar a los usuarios de IE8 cualquier cambio en la información de nuestras páginas web. Weather.com podría, por ejemplo, crear un Web Slice que que notificara al usuario cualquier actualización en el clima local. El concepto es similar a lo que hacen los sistemas de sindicación de contenidos (feeds), pero de forma más focalizada en partes de la página y permitiendo al usuario la interacción con el sitio de forma directa, a través del navegador en la página.

XML realiza, en aplicaciones como Cooliris, un trabajo similar, señalando al navegador si una página contiene o no imágenes para que el visitante pueda verlas en 3D. AdaptiveBlue trabaja la web contextual mediante ABMeta, formato que permite anotar páginas que contienen información sobre libros, música, películas, productos, restaurantes, etc…

Todas estas aproximaciones se basan en el marcado de las páginas. Y a pesar de que algunos, preocupados por la web semántica, dedican tiempo a hacerlo, la mayoría de las páginas siguen estando escritas en HTML plano.

La web contextual en navegadores

Tanto Internet Explorer como Firefox, han incorporado potencialidades de la experiencia contextual, mediante distintos tipos de atajo: Internet Explorer 8 incorpora una nueva tecnología al respecto con sus Accelerators.

Según Microsoft, Accelerators ofrece acceso a servicios online comunes, desde cualquier página que visitemos. Son pequeños trozos de variables predefinidas en XML por el propio navegador: la URL activa, el dominio activo y el texto seleccionado. La acción más común de Accelerator es la búsqueda de información contextual en base a las selecciones del usuario. Otor ejemplo típico es la búsqueda de mapas a partir de direcciones.

No se trata, en ese caso, de semántica. Los accelerators resultan aún pesados de manejar y requieren bastante tiempo e intervención del usuario. Firefox mejora el tema, con una aproximación basada en menús, ofreciendo la tecnología contextual mediante texto. Su extensión es Ubiquity, hoy sólo una extensión pero muy posiblemente característica crucial en próximas actualizaciones.

He estado probándolo esta tarde y la veremos con mayor profundidad en un próximo post, pero resumiendo, podríamos decir que devuelve mashups generados por el usuario, basándose en el lenguaje. Funciona de forma similar a los accelerators: el usuario puede seleccionar un fragmento de texto, invocar Ubiquity y escribir un comando. Existen cientos de ellos ya implementados.


Veremos en la segunda parte de esta entrada los Widgets para blogs y complementos para navegadores (Firefox). En fin…que ya os debo dos entradas ;)

¿Os he deseado ya Feliz Navidad?

Adobe y su nuevo Zoetrope: mejorar la experiencia de navegación web

| November 21st, 2008 | 1 Comment »

Algunos quizás recordéis la triste historia de Cuil. Ex-trabajadores de Google intentaban crear una alternativa mejor.

Pues bien…sigue mostrándonos una pantalla negra, sigue en activo, pero en mi caso, como me temo que en el vuestro, esta ha sido la segunda vez que lo he utilizado.

Y no es que se trate, ni de falta de calidad ni de la fuerza o la confianza que nos genere determinada marca.

Chrome vivió en mi ordenador un tiempo, pero no sobrevivió a un cambio reciente de equipo. Y eso a pesar de que valoré muy positivamente su velocidad…pero volví a Firefox.

¿Algún motivo para nuestra reticencia a los cambios? Pues podría elaborar muchos…y a veces dejarme llevar por algunos de tipo ideológico, pero la verdad es que creo que estaréis conmigo en que, en el fondo,  Internet reafirma lo que ya sabíamos sobre nosotros mismos: somos animales de costumbres.

Quería presentaros hoy una iniciativa de Adobe que dicen que amenaza (yo no lo creo) el monopolio de Google. Desarrollada por expertos investigadores de la Universidad de Washington, se trata de en un buscador que va un paso más allá de Google, mostrando resultados de la web en distintos períodos de tiempo:

Patrones en la nube de datos, historia de la información, me ha recordado la caducidad de los documentos digitales en su intento de parecerse en mayor medida a las ya olvidadas por muchos, bibliotecas de papel.

Su nombre, curioso si lo buscamos en wikipedia: Zoetrope: … “Un dispositivo que produce una ilusión de acción en base a la sucesión rápida de imágenes estáticas”. Algo así como los primeros dibujos animados.



Como the Internet Archive, los datos de Zoetrope proceden de un backup de toda la web, incluyendo páginas que han ido cambiando con el tiempo. Pero a diferencia del primero, parece que la forma de presentarnos esos contenidos será excepcional: cajas con cada contenido, conexión de datos entre sitios y gráficos de datos relevantes, todo presentado con un scroll en el que podemos avanzar o retroceder a través del tiempo. Y todo ello, como podéis ve ren el vídeo, con especial atención a una experiencia de usuario simple:



Recuerda la nueva API de visualización de Google, que permite a los desarrolladores la misma elaboración de gráficos, tablas, widgets…pero está pensada para los usuarios e investigadores casuales.

Como ejemplos de uso se propone, desde la búsqueda de ránkings históricos de equipos o jugadores en cualquier deporte hasta la evolución de la polución en el aire de Beiking.

Hacer que los navegadores sean una ventana a la web de todos los tiempos y no sólo a la actual, añadir la dimensión temporal a la experiencia de navegación…

En fin…que creo que si olvidamos titulares grandilocuentes sobre si desbancará o no al “monstruo” de la web, puede constituir un avance o una buena alternativa. Más si complementa su dimensión temporal con una mejora de la calidad en las búsquedas actuales o pasadas mediante la incorporación de ontololgías y demás mejoras que proporciona un acercamiento semántico al tema.

Saldrá al mercado web, libre, el próximo verano. Y no sé si por su calidad o por la marca que le sustenta pero creo que en esta ocasión sí valoraremos la calidad y cambiaremos de costumbres.

Noticia en: RRW

BOSS: La diferencia entre Google y Yahoo

| November 20th, 2008 | No Comments »

La verdad es que temas como el que os presento hoy dan que pensar. De todos es sabida la potencia innovadora de Google, su monopolio “benevolente”. Y no es que quiera aportar con este post nada al debate “Google Evil” o “Google dios benefactor”.

De hecho, os confieso que empiezan a agotarme las visiones catastrofistas, maniqueístas o “de todo o nada” tan populares en la blogosfera (creo que en ningún otro ámbito había leído o escuchado tantas veces hablar de aplicaciones, tendencias o sistemas “muertos”).

Me limito, simplemente, a presentaros algunos datos:

Yahoo anunciaba recientemente una nueva herramienta  para aportar keywords describiendo resultados de búsqueda que han hecho disponible a los desarrolladores usando su API pública.

BOSS (Build your Own Search Service, “construye tu propio motor de búsqueda”) es el motor de búsqueda abierto a terceros de Yahoo. Su objetivo: la innovación en el mercado de las búsquedas, apoyo a las start- ups mediante la puesta a disposición de sus bases de datos.

Algunas empresas ya están haciendo uso de BOSS: Como ejemplo privilegiado, Hakia, importante actor en el escenario semántico cuya efectividad revisábamos hace poco, lo utiliza para acelerar su análisis.

Google, casi a la vez,  anunciaba una nueva herrramienta para decirnos cuáles son los keywords por los que tendríamos que pagar en campañas de Adwords anunciando nuestro sitio.

No dedicaré demasiado espacio al tema pero sí os dejo el anuncio: Google lanzará una herramienta de uso libre pero orientada especialmente a anunciantes, basada en este nuevo sistema, para que puedan ganar más dinero.

La tecnología detrás de ambas herramientas no parece demasiado diferente pero ambas informaciones muestran la actitud de ambas empresas: mientras Yahoo sigue haciendo amigos entre investigadores, Google lo hace entre empresarios.

En cuanto a Google, confirma la decepción que me provocó hace poco, cuando me enteré (llamadme ilusa) de que aplica reglas distintas a la publicidad de los grandes blogs o medios. Si bien sus reglas para la publicación de anuncios de forma no engañosa, evitando que se confundan con el contenido trabajado por el autor del medio, me parecían correctas, dejan de parecérmelo cuando no se aplican a algunos, que pueden hacer exactamente lo que quieren con sus opciones de publicación.

¿La larga cola? ¿El poder de la unión de los pequeños? No nos engañemos…hay cosas que no han cambiado.

Sobre Yahoo….creo que es un buen ejemplo de supervivencia, en base al trabajo constante, en condiciones adversas.

Quizás ese sea el tema…la benevolencia de los débiles. Y todos los poderosos tiendan, tarde o temprano, a priorizar sus beneficios económicos sobre ese espíritu, ya malmetido que inauguró la web.

Mi apoyo, desde aquí, por cierto, a los informáticos en huelga. Sobran los motivos…

Inspiración: The noisy channel

Buscadores académicos: Deepdyve, Refseek, más allá de Google Scholar

| November 12th, 2008 | 2 Comments »

Ya Google Académico nos ofrecía la posibilidad de mejorar, de pulir los resultados de nuestras búsquedas a bases de datos académicas y publicaciones científicas. DeepDyve, un nuevo buscador para estudiantes, académicos y trabajadores del conocimiento se reformula a sí mismo con un objetivo similar: explorar la ‘web profunda’ que se esconde tras tasas de acceso y suscripción. Anteriormente llamado Infovell en su versión de pago, ahora lanzan esta versión, algo más limitada pero libre.

Es una buena herramienta pero no demasiado distinta a las típicas bases de datos en la materia: Academic Search Premier, Lexis-Nexis, PubMed, o Science Direct, que además de ofrecer más opciones de búsqueda, proporcionan en ocasiones acceso a los textos completos.

deepdyve, busquedas academicas

RefSeek (rĕf-sēk) hace algo parecido y busca entre más de un billón de documentos, incluyendo páginas web, libros, enciclopedias, revistas y periódicos. Se trata, como en los casos anteriores, no de ofrecer más resultados que Google (general) sinó de eliminar cualquier resultado no relativo a ciencia e investigación.

En la práctica, lo que prometen son resultados no comerciales, sinó de sitios .edu y .org, así como de distintas enciclopedias online, como Wikipedia y Answers.com.

Si queréis ver un ejemplo, probad la búsqueda que ellos mismos recomiendan, tanto en Google como en RefSeek: Para “flowers”, Google nos devuelve, casi exclusivamente, enlaces a floristas. RefSeek lo hace sobre botánica.

En fin…que teniendo en cuenta que en todos los casos limitan su efectividad a encontrar documentos y no a liberar sus contenidos, tema mucho más complejo y que escapa del control de cualquiera de las herramientas, creo que sigo quedándome con Academics, que sobre flores, también parece tener cosas interesantes que decir.

Eso, habiendo probado RefSeek y la versión de Google. Si me llega la confirmación como usuaria de Deepdyve y descubro algo realmente nuevo, aquí estaré para dar el oportuno parte ;) Buenos días.

Imindi: Inteligencia colectiva, conectivismo, singularidad.

| November 6th, 2008 | 7 Comments »

En la línea de la singularidad, una corriente de pensamiento sobre la evolución de la inteligencia colectiva hacia una “supermente” global y casi consciente (Kevin Kelly, Nova Spivack), de la que hablaremos durante los próximos días, está a punto de salir al mercado web, en versión beta, IMINDI, el primer motor de búsqueda que promete expandir el pensamiento individual, avanzando hacia la construcción de una red (o diversas) de “mentes similares” en la web.

Finalista de la Techcrunch 50 (según muchos, merecedora de un premio que terminó en manos de la aplicación más rentable), creo que la novedad que aportará será similar complementar lo que viene haciendo Twine:

Los objetivos, tanto de la web semántica como de la inteligencia artificial son enseñar a los ordenadores a pensar (o a procesar mejor). IMINDI intentará que seamos nosotros los que, auxiliados por las máquinas,  mejoremos nuestras habilidades cognitivas en un sentido individual (creatividad, subjetividad) como colectivo.

Fantástica, en este sentido, la reformulación posmoderna de la cita de Descartes:

Del pienso luego existo a un futuro en el que las nuevas tecnologías nos sigan siendo útiles para poder concluir en que “Pensamos, luego somos”, o mejor (incluyendo un matiz de optimismo tecnológico): Pensamos, luego seremos”

Dicho en terminología de usuarios de la web: Mientras los motores de búsqueda clásicos ayudan a encontrar información o respuestas a ideas predeterminadas, Imindi ayuda a descubrir nuevas ideas y cuestiones, creando nuevo conocimiento basado en conexiones con personas cuya corriente de pensamiento es similar a la nuestra.

Parecida a Twine como red de intereses pero tal vez más orientada y eficiente como herramienta de construcción de la propia red social (de conocimiento), su objetivo es convertir las ideas en agentes activos de conocimiento:

Buscar información acerca de una idea en Google nos devolverá, simplemente, un listado de resultados. Trasladarla a Imindi, en relación a determinado ámbito temático hará que esta se nutra de forma permanente de información relacionada, devolviéndonos resultados, así como orientaciones sobre personas que puedan expandirla.

IMINDI es el resultado de los 60 años de investigación en el aumento de la inteligencia humana mediante las computadoras que iniciaron, entre otros, Vannever Bush y Douglas Englebart. A partir del estado del arte actual, IMINDI va un paso más allá, añadiendo a estas bases neurocientíficas y de la psicología cognitiva una nueva tecnología.

Así, parece que está basada en una plataforma pendiente de patente que combina una capa de pensamiento individual, con características típicas de las redes sociales y una base de datos de fondo, the “Mindex” o el índice de la mente.

Web 3.0, inteligencia colectiva, mente global son los términos sobre los que ya podemos leer y a los que el próximo lanzamiento de esta prometedora herramienta aportará relevancia.



Se habla también del potencial de Imindi en Knowledge Management, como medio de conocer y potenciar el “pensamiento”, uno de los capitales intangibles más importantes en la organización.

Imindi promete, en este sentido, facilitar la construcción de redes mentales privadas en organizaciones o comunidades de práctica orientadas al conocimiento, evidenciando las conexiones entre las corrientes de pensamiento de sus integrantes para un trabajo colaborativo más eficiente.

Por último, algunos especulamos sobre su futura integración con Twine. ¿Serán interoperables, portables, los datos de la web semántica? Los resultados, sin duda, serían espectaculares.

Esperemos que intereses corporativos no frenen, como está pasando en la actualidad en el contexto de las grandes redes 2.0 en lucha permanente por la propiedad de nuestros perfiles, la evolución de la web.

Interesante y simple: Juice, complemento “semántico” para Firefox

| November 4th, 2008 | 4 Comments »

JuiceLo presentan como una forma fácil de evitar el caos en las búsquedas. Y realmente, y a pesar de que su autodefinición como herramienta semántica no es del todo exacta, si estamos seguros de lo que vamos a buscar y no queremos dejarnos llevar por la a veces dulce serendipia (el azar), puede ayudarnos.

Juice es un nuevo plugin para Firefox 3, actualmente en Beta, de la empresa Linkool Labs, que hace de la búsqueda en la web algo tan simple como seleccionar y arrastrar a una ventana lateral.

Si arrastramos texto, imágenes, vídeos o links a su ventana, veremos de forma casi inmediata más información en Google, Wikipedia, YouTube, Google Blogsearch y otros servicios (curiosamente, no se sabe a ciencia cierta cuántos ni cuáles)

Imágenes y vídeo (no texto, lo cual en mi opinión es una debilidad), pueden almacenarse en la ventana que Juice incorpora al navegador, por si los necesitamos más tarde..

¿Su secreto?  El mejor guardado ;) :  “descubrimientos inteligentes”:

La herramienta es capaz de comprender lenguaje natural. Junto a un sistema de manejo de diccionarios, ayuda a la web semántica, conectando keywords con los contenidos más relevantes y ricos de terceras partes.

Coincido con RRW en la opinión de que lo semántico es, en muchos casos (y en este también), una palabra “Buzz” o una simple estrategia de márketing. Podríamos decir, en ese sentido, que Juice adopta un enfoque de lectura de ciertas marcas semánticas, pero no devuelve nada en lenguaje RDF a la red (enfoque de arriba abajo)

Como punto negativo destacaría que no permite personalizar su posición en el navegador.  Molesta un poco, en mi opinión, en la barra derecha, lugar en el que permanece sino lo desactivamos.

Hemos hablado aquí de alternativas, quizás menos simples pero en mi opinión más completas. Las revisiones sobre Mashlogic, Hyperwords, entre otras, quizás puedan resultaros útiles.

Y de todos modos, vale la pena probarlo.

Tenéis en la página de Juice un videotutorial sobre su uso. Os dejo aquí captura de pantalla de los resultados desplegados para un artículo de hoy mismo en El caparazón:

Web semántica y redes sociales. Más allá de los buscadores “Google Killer”

| October 28th, 2008 | 7 Comments »

Cuando hablamos de web semántica, uno de los ejemplos típicos se refiere a los buscadores “Google Killer” y la mayor precisión que alcanzarán si combinan algoritmos perfeccionados (semánticos) con bases de datos amplias (como la que tiene Google en la actualidad). Me he levantado hoy con dolor de cabeza, así que si introduzco en Hakia “what drug treats a headache?” obtendré una respuesta satisfactoria.

Pensamos, además, en la web, cuando su potencia permitiría también mejorar la eficiencia de nuestras herramientas de escritorio, cuya interoperabilidad con los datos de cualquier tipo de servidor podría hacernos también la vida más fácil.

Un ejemplo de aplicación de las tecnologías semánticas está en la mejora de las redes sociales:

Vivimos la eclosión de las redes sociales verticales, especializadas, ya sean temáticas o territoriales, “Glocalizadas” o de nicho. La larga cola de la web 2.0 incluye ya aplicaciones y comunidades de personas, redes formales en empresas 2.0, independientes de los circuitos de networking social generalista (Facebook, Myspace como ejemplos paradigmáticos).

Lo decíamos, en otras palabras, al presentar Twine como red de intereses redentora del colapso 2.0. Lo importante aquí no es a quien conoces sinó la calidad de la relación, lo que compartes (conversaciones, intereses, Twines, Rooms, tópicos, tags) con tus contactos.

La socialización a través de los objetos es también la idea de Mark O’Neill,: “…organizando las redes de forma centrífuga alrededor de objetos, las redes sociales adquieren significado, incluso sin tener 200 milliones de usuarios y estar centradas en intereses minoritarios”.

En este contexto, la interoperabilidad, la portabilidad de los datos en redes sociales, el DNI universal, la huella dactilar de nuestra identidad digital se convierten en necesidad.

Icon for the FOAF (Friend of a Friend) project...

Image via Wikipedia

Como la OpenID, FOAF (Friend of a Friend), con mecanismos de representación de nuestros perfiles y SIOC (Semantically-Interlinked Online Communities) son desarrollos semánticos que pueden crear un login único y vinculado a nuestros intereses, automáticamente conectados a items de contenido en diversas comunidades.

¿Imagináis el potencial de poder rellenar registros completos de nuestros intereses y contactos de forma automática utilizando este tipo de archivos?

Con SIOC podríamos por ejemplo buscar en Facebook sobre un término y obtener resultados que podrían incluir personas, páginas de perfiles personales, pero también entradas de blogs desde Technorati, comentarios en Flickr y vídeos de YouTube. Un tag en delicious podría llevarnos, igualmente a resultados en muchas otras redes sociales.

Yahoo!, mediante su SearchMonkey, incorpora SIOC como vocabulario recomendado. La Google SocialGraph API (como base de Google Friend Connect) también tiene ese objetivo: permitir a las aplicaciones reutilizar la información sobre Grafos sociales en toda la web, mediante formatos abiertos como XFN y FOAF.

Ese sería el objetivo principal de la web semántica cuando sea realmente la web de las personas: que todo esté interconectado a pesar de que no nos demos cuenta de ello.

Existen hoy ya, herramientas de visualización, de humanización de todo ello. SIOC exporters para distintos sistemas y aplciaciones, como Twitter o Semantic radar, un fantástico complemento para Firefox que nos permitirá ver los contenidos RDF de cualquier página que los contenga.

Os hablaré en un próximo post de la implementación fácil de SIOC y FOAF en nuestros blogs y perfiles sociales a través de estas herramientas.

ACTUALIZACIÓN 29/10Web semántica y redes sociales (2), complementos, plugins semánticos, ya publicado.

Artículos relacionados / recomendados:

Mashlogic, extensión para firefox que mejora la experiencia en la web

| October 14th, 2008 | No Comments »

Así que los intereses comerciales han viciado la visión de una red interconectada, global, nacida del hipertexto útil y no de enlaces internos y ocultos a publicidad…

Mashlogic, una nueva extensión para Firefox promete devolvérnosla o por lo menos mejorar la experiencia de usuario de este navegador.

Una vez instalado y a partir de nuestra selección de intereses (noticias, titulares sobre tecnología, idioma inglés, deportes. música o cualquier otro mashup que ahora o en un futuro no muy lejano soporte), marcará los términos que puedan sernos de interés y nos devolverá descripciones, titulares, eventos, o cualquier cosa relacionada.

También puede eliminar todos los enlaces en las páginas para mostrarnos sólo los que nos interesen, filtrar los dominios sobre los que preferimos no saber nada (listas negras), reproducir vídeos o sonidos relacionados, traducir términos, etc… con sólo situar el puntero del ratón en los enlaces de Mashlogic que nos interesen.

Navegación interactiva, más objetiva y ajustada a nuestros intereses que a los de la persona que redactó el artículo por el que navegamos. Interesante…

Dice nacer con intenciones y usos de la web semántica, tema que irán mejorando con el tiempo.

Mencionan en su blog un concepto que me parece interesante y que cobrará importancia en un futuro próximo, La internet de las cosas: frente al grafo social centrado en los documentos propuesto por la web 2.0, entre personas, el Grafo Global Gigante (GGG) propuesto por Tim Berners-Lee sitúa la importancia de la web en las cosas, en los contenidos, independientemente de la fuente.

Está en beta aún, pero he solicitado invitaciones a las que podéis acceder desde este enlace. No son demasiados aún los tópicos de interés que podemos seleccionar, menos en español, pero prometen hacerla abierta a todos en breve.

Tenéis más información en el artículo extendido que he redactado sobre el tema en La Brújula verde.

Evri, el blogging relacional semantizado

| September 29th, 2008 | No Comments »

Evri supone un nuevo acercamiento a la web semántica, en el ámbito de las búsquedas y el blogging.

Su slogan, Search less, understand more (busca menos, entiende más), intenta definir lo que podrá ofrecernos cuando salga de las fase beta. en que se encuentra.

¿Qué hace? Evri crea un mapa de conexiones entre personas, lugares y cosas en la web. Sobre este mapa podremos encontrar las cosas en las que estamos interesados. En lugar de buscar a partir de keywords y resultados relevantes,  Evri nos llevará a artículos, imágenes y vídeos relevantes basados en nuestras lecturas.

¿De dónde extrae la información? Evri busca en la WWW y recopila contenido de tantos sitios como puede. Su base de datos crece día a día”

Quizás lo más atractivo no sean sus búsquedas sinó los widgets para blogs que, al estilo Sphere related content (una herramienta similar) despliega una ventana (pop-up) sobre contenidos relacionados con el artículo o página en cuestión como la que podéis ver en la siguiente imagen:

evri, widget semántico

Su instalación es sencilla si lo añadimos al footer de cualquier blog autoalojado con wordpress como cms. También para blogger o cualquier página en html.

Personalmente, conociendo las dificultades de herramientas similares para contenidos en español,  lo he instalado en el espacio que utilizo para los posts o miniposts en inglés, The Shell. Si pulsáis un icono como el de la imagen superior  en un artículo sobre Facilitación de comunidades que publiqué hace un tiempo, podréis verlo funcionar.

Material libre para SEO-SEM (Máster online en buscadores UPF)

| September 15th, 2008 | 2 Comments »

Os presento hoy un documento excepcional. Se trata de una selección del los contenidos de 6 unidades didácticas del Master Online en Buscadores impartido durante el curso 2007/2008 en la Universidad Pompeu Fabra (UPF).

Es un documento excepcional para aprender sobre SEO – SEM (Posicionamiento – Márketing en buscadores) y poder profundizar en los conceptos que nos interesen especialmente. Consta de los siguientes módulos:

● Módulo F: Fundamentos en buscadores
● Módulo P: Posicionamiento en Buscadores (SEO)
● Módulo M: Márketing en buscadores (SEM)
● Módulo V: Vigilancia tecnológica
● Módulo R: Recuperación de la información
● Módulo E: Buscadores especializados

Y contiene el texto completo de una unidad didáctica representativa de cada módulo, a menudo la unidad inicial, en la cual se ofrece una panorámica general de todos los contenidos del módulo que posteriormente serán desarrollados por otras unidades. Los textos fueron actualizados por última vez en junio del 2008.

Os dejo también, para que podáis valorar la conveniencia o no de su descarga, su sumario:  

Unidad F092 Estructura y funciones de un buscador, Lluís Codina

1 Introducción………………………………………………………………………………..F092-2
2 Sistemas de información documental……………………………………………..F092-2
3 Estructura de un motor de búsqueda……………………………………………..F092-3
4 Rastreador del motor de búsqueda………………………………………………..F092-4
5 Sistema de recuperación de información………………………………………..F092-4
5.1 Sistema de indización…………………………………………………………….F092-4
5.1.1 Índices directos……………………………………………………………….F092-5
5.1.2 Índices invertidos…………………………………………………………….F092-6
6 Interfaz de consulta……………………………………………………………………..F092-7
6.1 Cálculo de relevancia……………………………………………………………..F092-8
6.1.1 Criterios intrínsecos…………………………………………………………F092-9
6.1.2 Criterios externos…………………………………………………………….F092-9
7 Página de resultados……………………………………………………………………F092-9
8 Conclusiones…………………………………………………………………………….F092-10
9 Bibliografía………………………………………………………………………………..F092-10

Unidad P235 El ciclo de vida de una campaña de posicionamiento, Lluís Codina

1 Introducción………………………………………………………………………………..P235-2
2 Las fases de la campaña………………………………………………………………P235-2
3 Fase de análisis…………………………………………………………………………..P235-2
3.1 Palabras Clave………………………………………………………………………P235-2
3.2 Fase de diseño………………………………………………………………………P235-5
3.3 Fase de implantación……………………………………………………………..P235-6
4 Fase de seguimiento…………………………………………………………………….P235-7
4.1 Calendario……………………………………………………………………………P235-7
4.2 Herramientas………………………………………………………………………..P235-7
5 Conclusiones………………………………………………………………………………P235-9
6 Bibliografía………………………………………………………………………………….P235-9

Unidad M519 Fundamentos del marketing en buscadores, Cristòfol Rovira

1 Introducción……………………………………………………………………………….M519-2
2 Márqueting en Internet………………………………………………………………..M519-2
3 Modelos y formas de pago……………………………………………………………M519-4
4 Resultados orgánicos, resultados patrocinados……………………………….M519-5
5 El mercado de márqueting en buscadores……………………………………..M519-6
6 Funcionamiento de una cuenta de publicidad en buscadores……………M519-7
6.1 Estructura……………………………………………………………………………M519-7
6.2 Pago por clic…………………………………………………………………………M519-8
6.3 Palabras clave…………………………………………………………………….M519-10
7 Conclusiones…………………………………………………………………………….M519-11
8 Bibliografía……………………………………………………………………………….M519-12

Unidad V446 Vigilancia tecnológica e inteligencia competitiva para SEM-SEO, Cristòfol Rovira

1 Introducción……………………………………………………………………………….V446-2
2 Definiciones………………………………………………………………………………..V446-2
3 El proceso de vigilancia tecnológica……………………………………………….V446-4
4 Necesidades de información y factores críticos de vigilancia…………….V446-5
5 Buscar la información necesaria para el seguimiento de los FCV……….V446-7
6 Análisis de la información…………………………………………………………….V446-8
7 Conclusiones………………………………………………………………………………V446-9
8 Bibliografía……………………………………………………………………………….V446-10

Unidad R707 Buscadores y presentación de resultados en agrupación, Mari-Carmen Marcos

1 Introducción……………………………………………………………………………….R707-2
2 De los listados sin orden al orden por relevancia……………………………..R707-2
3 De los listados por relevancia a los clusters…………………………………….R707-4
4 Buscadores que presentan los resultados en clusters……………………….R707-7
5 Conclusiones………………………………………………………………………………R707-8
6 Bibliografía…………………………………………………………………………………R707-9

Unidad E665 Buscadores de mapas, Rafael Pedraza

1 Introducción……………………………………………………………………………….E665-2
2 Google Maps……………………………………………………………………………….E665-2
2.1 Mis mapas…………………………………………………………………………….E665-7
3 Yahoo! Mapas……………………………………………………………………………..E665-9
4 Otras opciones para la búsqueda de mapas………………………………….E665-12
4.1 Microsoft Virtual Earth………………………………………………………….E665-12
4.2 Vía Michelín………………………………………………………………………..E665-13
5 Conclusiones…………………………………………………………………………….E665-15

 

Podéis descargarlo desde este enlace.