viernes, 22 de mayo de 2009

La Importancia del Contexto de Ricardo Baeza-Yates



Durante el Primer Congreso Latinoamericano de la Web (LA-WEB 2003: la-web.org) nos visitó Knut Magne Risvik, actualmente el arquitecto jefe de Yahoo!, después de la compra de Fast por Overture y de Overture por Yahoo!. En su charla habló del exitoso concepto de publicidad dirigida por las palabras que la gente busca y como sería esto en el futuro. En esta columna quiero ir un poco más lejos y explorar dónde fallan los buscadores actualmente y qué podemos hacer para mejorarlos. Una de las claves es el contexto, el que podemos motivar con el siguiente chiste gallego: Mira tío, me compré un reloj. ¿Qué marca? La hora ¿que otra cosa podría marcar?.

El Proceso de Búsqueda

En el diagrama adjunto tenemos el proceso de búsqueda: una persona tiene una necesidad y la transforma en una consulta, luego el buscador usando un índice previamente construido de la Web, genera la respuesta. Esta respuesta tiene tres partes: algo de lo que queremos, lo que falta de lo que queremos (y nunca lo sabremos) y lo que sobra. En base a la respuesta, este proceso se repite o se comienza a navegar. ¿Dónde están los problemas? Los tres principales son:Proceso de Busqueda

* La inexperiencia del usuario en convertir su necesidad en una pregunta simple de varias palabras y otras veces en no entender la interfaz misma, tanto la de consulta, como la de respuesta. Este problema se resuelve enseñando técnicas de búsqueda o con la misma práctica.
* La completa ignorancia del buscador del contexto en que se hace la búsqueda. Por ejemplo, varios estudios muestran que aproximadamente la mitad de la gente busca información, mientras que la otra mitad quiere encontrar un sitio para navegar o realizar una transacción. En el primer caso la respuesta correcta es una página, en el segundo es un sitio o una lista de sitios. Más adelante nos extendemos en este problema.
* Los documentos que nos interesan y que faltan porque no tienen las palabras que consultamos (o las tienen mal escritas), están en otro lenguaje o el concepto está expresado en otro medio y no como texto (por ejemplo, una imagen). Este problema se puede resolver parcialmente usando mejores técnicas de análisis de lenguaje natural, ontologías de conceptos, etc. De paso esto también disminuye el número de documentos que sobran en la respuesta.

El Contexto de la Búsqueda

La palabra contexto viene de las raíces latinas cum (con) y texere (tejer, fabricar), sugiriendo un entretejido. De hecho, el contexto modela el contenido de un documento y, análogamente, el contenido implica un contexto. La raíz texere es también el origen de las palabras texto y tecnología. Citando como en marzo pasado a Brown y Duguid (La Vida Social de la Información, Harvard University Press, 2000), el diseño de un documento nos da las pistas para leerlo. No hay información sin contexto, pero tanto escritores como editores siempre tienen el desafío de qué contexto y qué contenido dejar fuera. Muchas veces, la fascinación por la forma del contenido, sesga este equilibrio hacia el lado de la información, pero sin necesariamente aumentarla. En la práctica, cuando hay problemas de información, tenemos que agregar más información. Sin embargo, según Brown y Duguid, la historia de la documentación y de la humanidad misma se ha desarrollado en la dirección contraria, menos información y más contexto.

Esto implica que el contexto es cada vez más importante, más en una Web cada día más grande y más diversa. Agregar lenguaje natural a la consulta no sirve de mucho, pues la diferencia entre Santiago y ¿Quiero información sobre Santiago? es nula. Hasta para la mejor pregunta, el contexto hace la diferencia. Por ejemplo, si el buscador supiera que la persona viajará a Chile, que es católica, que tiene familia en Argentina, que vive en Cuba, que está en Santo Domingo, que es un arquitecto, que es fanático del cine español o que le gusta el baseball, la respuesta será muy distinta. Así que el problema principal es determinar el contexto, que puede incluir quién es la persona, su edad, sexo y profesión, la hora, qué ha hecho recientemente y qué dispositivo está usando, el lugar, su velocidad y dirección, restricciones físicas y temporales, etc. Algunas de estas preguntas son más fáciles de determinar que otras y algunas necesitan de la colaboración de la persona. Ése es el desafío: determinar el contexto, exactamente lo que hace que nuestras vidas tengan sentido. ¿Ideas?."

Fuente: http://www.dcc.uchile.cl/~rbaeza/inf/contexto.html