Posts Tagged ‘microsoft_powerset’

Bing: trucos, curiosidades, potencial

| June 2nd, 2009 | 13 Comments »

Nada demasiado nuevo, decía ayer en twitter al probar Bing (“Bing is not Google”) en Español. Pero lo cierto es que me precipitaba, sobre todo teniendo en cuenta que estaba usando una versión local.

Pronto me avisaban:

-Sobre imágenes, con opciones de tamaño y de diseño (cuadradas, anchas, altas), color (o blanco y negro), estilo (fotografías, ilustraciones) o la búsqueda concreta de personas, supera de momento lo que puede ofrecernos Google.

-El servicio de Mapas también parece ser algo mejor. Preciso, además del mapa en 2D, Bing presenta una versión en 3D. Mediante Virtual Earth 3D y previa instalación de un plugin.

-Sorprende también la opción de previsualizar vídeos o ampliar fotos desde la página principal del buscador:

6a00d8341c53e553ef01156fbfb961970c

Como punto negativo, parece que no supera a Google en cuanto a la actualidad de los resultados.

En este sentido ya sabéis que el complemento de Twitter search es, en mi opinión, la mejor alternativa actual de búsqueda en tiempo real. Tanto que aparecen ya tips sobre su instalación en Bing.

Pero si queréis analizar el buscador semántico de Microsoft en profundidad, trabajad con la versión completa, aún en inglés: Podéis acceder a ella desde esta página eligiendo English – US como región por defecto. Estas son las cosas más relevantes:

-La interface interactiva: Una curiosidad en la que vale la pena perder el tiempo (y que puede generar ingresos publicitarios extraordinarios a Microsoft, cuando empiece a ser un espacio patrocinado).

Cambiando a diario (hoy ofrece 8 opciones desde los botones adelante-atrás en la parte inferior izquierda de la pantalla principal), si exploráis la imagen con el cursor veréis informaciones explicativas:

bing1

bing

-Ofrece la posibilidad de ver previsualizaciones de vídeos no basados en IPs Estadounidenses. Es el caso de los vídeos de Hulu.

-Permite guardar y enviar por email (o publicar en Facebook) resultados de búsqueda.

-Genera Feeds RSS de resultados de búsqueda (una interesante opción en la creación de entornos personalizados de información, investigación, aprendizaje, etc… que parece que ya cubría Yahoo y en parte, mediante Google Alerts, Google)

-Busca páginas que enlazan archivos mp3, documentos, etc… si buscamos, por ejemplo, muse contains:mp3 accederemos a las páginas con enlaces a archivos de audio del grupo (lo mismo con doc, pdf, etc…)

En cuanto a la eficacia de Bing es pronto para sacar conclusiones, pero resulta curioso hacer algunas pruebas con esta sencilla aplicación que compara los resultados de Bing con los de Google.

A nivel de algoritmos semánticos parece que funciona de forma correcta (recordemos su integración con Powerset, el valor añadido semántico que ofrece el nuevo buscador de microsoft), aunque Google parece haber trabajado en paralelo para no quedarse atrás.

En fin…aunque sigo pensando que es pronto para opinar, la verdad es que sí creo que, a diferencia de Cuil, conseguirá lo que pretende: romper el casi monopolio de Google en el mercado de las búsquedas.

Actualización: Gracias, Héctor, Ismael, por el comment sobre Google Alerts.

Referencias, informaciones adicionales:

¿Google se está abriendo algo a la web semántica?

| January 7th, 2009 | No Comments »

Resultaba extraño que después de la adquisición de Powerset por parte de Microsoft, y a pesar de las múltiples manifestaciones de desconfianza hacia esa nueva forma de entender y codificar la web, Google se auto situara al margen de la evolución.

Fue una de las preguntas y reflexiones más interesantes de las que surgieron durante el último taller sobre web semántica que realicé:

-¿Y Google no está incorporando algoritmos semánticos? Mi respuesta se ve confirmada por lo datos que nos reportan hoy desde RWW. Quizás no de forma manifiesta pero difícilmente no existan en Google experimentos ni equipos de trabajo trabajando al respecto, digan lo que digan en comunicados oficiales.

Así, parece que los ejemplos comparativos que utilizábamos al comparar la vieja y la “nueva” forma de entender la web, la web semántica, van a dejar de sernos útiles: Desde hace poco, las búsquedas sobre fechas de nacimiento, conexiones familiares y otros tipos de información relacionada obtienen resultados en información estructrurada de forma explícitamente semántica. Preguntas como Who is Bill Clinton’s wife? What’s the capital city of France? obtienen resultados en forma de sujeto-predicado-objeto, o “tripletes” en términos semánticos.

Y las respuestas no están estructuradas de ese modo en las páginas de las que provienen. Parece, más bien, que Google crea estructura semántica desde datos semiestructurados o no estructurados (no marcados semánticamente) en absoluto. Dicho de otro modo, los resultados no son sólo de Freebase o Wikipedia, que los presentan estructrados, sinó de otros sitios que no trabajan con “tripletes” (sujeto-predicado-objeto, lenguaje RDF)

what-is-the-city-capital-of-france-buscar-con-google_1231356042557

Parece que los resultados son similares a los que devolvía hace unos tres años un viejo programa de Google, Direct Answers, aunque sus resultados eran mucho menos precisos.

No está claro que Google esté creando datos estructurados en páginas que no los contenían. Sería un error concluir en que se están realizando análisis semánticos sólo porque algunos de los resultados reportados aparecen en la forma sujeto-predicado-objeto (base del lenguaje semántico RDF), pero está claro que aparecen, son extraídos de páginas que a priori no siempre los contienen.

A la espera de tener más información, deciros que no llega a la precisión de Yahoo, que lleva tiempo trabajando con algoritmos semánticos. Además, el hecho de que Google no aporte datos RDF sobre las páginas, resta utilidad a la supuesta mejora en términos de su posible aprovechamiento por parte de terceras aplicaciones.

No es fácil la creación de datos estructurados a partir de cero, a pesar de que supondría una base común que permitiría innovar en mayor medida que la web común actual.

Terminar este artículo planteando un posible escenario. ¿Y si Microsoft adquiriera finalmente a Yahoo? La tecnología de Powerset y la de Yahoo juntas, por no hablar de la potencia de la imagen de una unión de marcas como esa….¿No sería quizás entonces el tema semántico un posible valor diferencial lo suficientemente fuerte como para resultar competencia para quien parece estar decidiendo a espaldas de estándares y del interés común la web del futuro?

Me gustaría dejaros algunas reflexiones más, derivadas de la discusión surgida entorno a este dato:  resulta extraño, de entrada, que una compañía que se auto define como abierta y transparente no responda claramente sobre este tipo de cuestiones. Es posible, como argumentan algunos, que Google esté experimentando cosas de forma contínua, llevando a cabo unos 50 a 200 experimentos a la vez, lo cual explicaría la “¿imposibilidad?” de hablar públicamente de todos ellos.

En fin… os mantendré informados.

Relacionados:

El inicio “real” de la web 3.0: Microsoft adquiere Powerset y Mobicomp

| June 28th, 2008 | 3 Comments »

googlebot

Se aventuraba en el siguiente gráfico la importancia económica de una supuesta unión google-amazon, que convertiría al nuevo gigante en el mercado mundial más importante. La clave de todo ello: La web semántica y las posibilidades de optimización de la cadena de márketing y venta que ofrecen sus tecnologías.

Nos decían en el último gran evento sobre la web semántica, que revisamos en Tetherless world: La ciencia de la web algunas cosas que en aquel momento (hace pocos días) eran teoría, especulaciones, en términos capitalistas, si ninguna empresa de entre las punteras en la web2.0 se decidía a invertir en ellas.

La necesidad de que esta nueva forma de entender la web se convirtiera en “mainstream”, en algo popular y de uso común requería, además de la simplificación de su mensaje para el público general y aunque no se decía de forma explícita, que se completase el proceso de innovación, desarrollo, inversión y rentabilización:

Después de su nacimiento e inicial desarrollo en el ámbito universitario, diversos inversores han trabajado para que las startups y empresas en beta que han surgido durante los últimos tiempos al respecto: Triplify, Twine, diversos buscadores, etc…alcanzarán un grado de maduración suficiente como para ser atractivas o convertirse en puntales de valor añadido y diferencial para grandes empresas:

Llegó ese momento para las tecnologías de búsqueda y Microsoft, que lucha desesperadamente por reconvertirse a una empresa puntera (o 2.0, como también se ha dicho), está a punto de comprar Powerset, tecnología de búsqueda que ya incorpora Wikipedia.

También Tim Berners Lee mencionaba recientemente que la movilidad sería otra de las características de la nueva web3.0. El propio término Tetherless world que titulaba el último evento del que os hablaba, se refiere a la aplicación de lo semántico a lo móvi. Así, también Microsoft, ha adquirido recientemente MobiComp una compañía puntera en el mercado móvil. El objetivo, el que manifestaba Todd Peters, Vice presidente corporativo de Microsoft: Extender la capacidad de  Windows Mobile y Windows Live para lograr formas más innovadoras de estar siempre conectados.

Se trata de la lucha de titanes, de dos pasos adelante de Microsoft, que no ha terminado de implantarse como alternativa a los servicios de Google en lo 2.0, hacia la web ubicua y semántica, la web3.0.

Mientras tanto, Google, que en nuestra foto inicial y hace unos años parecía ser el candidato ideal para monopolizar esta nueva web, sigue sembrando afirmaciones contradictorias sobre la no necesidad de semantizar la web, con distintos argumentos y actuaciones:

-Sus tags o etiquetas, palabras clave, etc.. hicieron que los responsables de contenidos de las webs hicieran sus webs más humanas, que se adelantaran a las distintas formas en las que un usuario puede plantear una búsqueda para llegar y navegar en su sitio web.

-A pesar de ello, su mecanismo rankista es la perfecta antítesis del ideal semántico, restando importancia a los metadatos del documento, a sus contenidos, en favor de datos que provienen de terceras partes, como los enlaces entrantes.

-Algunos de sus responsables han manifestado que la web semántica, en su actual aproximación RDF/metadatos es simplemente utópica.

-De momento, sigue en su línea, intentando cosas como ser el repositorio de datos más grande que hay sobre nuestra vida online. El Behavioral Targeting,  una técnica de segmentación en base al comportamiento o navegación de los usuarios” sería muestra de su apuesta por el inmovilismo, un nuevo intento de rentabilización de la estructura de la web actual en lugar de una apuesta por lo semántico.

Y creo que lo hace, simplemente, por abaratar o evitar los costes de transición. Estoy segura de que cambiará su postura tras la noticia con la que iniciábamos este post, de que relativamente pronto conoceremos su contraofensiva de adquisición de alguna de las startups de las que hablábamos (¿Twine, Hakia?) y de que serán varios y semánticos los bots que, junto al de google, controlarán la tierra, quizás no en 2009, pero sí no mucho más allá.

Empezábamos diciendo que podría verse la adquisión de Powerset como el principio de la web3.0, con inversiones suficientes para sobrevivir.

Pero un escenario alternativo sería aquel en el que Google se posicione fuertemente al otro lado, siga negando la utilidad de este tipo de herramientas en su actual estado de desarrollo y de lugar a una lucha, durante los próximos años entre sus tecnologías poco inteligentes pero con inmensas bases de datos y las nuevas opciones, tecnológicamente superiores pero con muy pocos años de desarrollo como para devolvernos y devolver a las empresas interesadas en vender sus productos, infomaciones útiles.

Quizás lo que vivamos cuando se confirme la “semantificación” de microsoft” sea precisamente el declive de las expectativas sobre una web con significado….

Se verá.