Búsqueda de Información:
Técnicas Avanzadas de Búsquedas Web

 

El entendimiento de cómo realizar búsquedas exhaustivas de información en línea, incrementará considerablemente sus oportunidades de encontrar lo que desea. La mayoría de los motores de búsqueda le permiten definir sus criterios de búsqueda de formas muy específicas, pero no todos funcionan de la misma manera.

Sensibilidad a las mayúsculas

Si una palabra clave para buscar está en mayúscula, el motor de búsqueda sólo presentará los documentos que tengan esa palabra en mayúscula. Por ejemplo, si usted desea buscar documentos acerca del país China, poner la palabra en mayúscula y usar un motor que tenga susceptibilidad a las mayúsculas reduciría el número de resultados obtenidos y eliminaría los documentos relacionados con porcelana china o culinaria. Tenga en cuenta, sin embargo, que muchas veces es mejor dejar las palabras clave sin mayúsculas para permitir que el motor presente resultados de documentos que contengan la palabra clave en cualquiera de las dos formas.

Búsqueda de frases

Al usar términos de búsqueda que contengan más de una palabra en orden específico, si encierra las palabras entre comillas, el motor sólo mostrará los documentos que contengan todas las palabras y en ese orden específico. Ejemplo: Al buscar información sobre control de armas, usar "control de armas" eliminará aquellos documentos que podrían contener las palabras arma y control, pero no en ese orden, posiblemente en párrafos distintos y sin ninguna relación con el control de armas.

Truncamiento

Si usted estuviera buscando información sobre jardinería, podría usarla como palabra clave. Sin embargo, si sus resultados estuvieran limitados en número (pero probablemente no fueran de jardinería) y usted quisiera ampliar su búsqueda para obtener más resultados, podría usar la raíz de la palabra y abreviarla con un asterisco (jardín*). De esta forma, el motor mostrará resultados de documentos que contengan las palabras jardines, jardín, jardinero, jardineros, etc.

Lógica buliana

Los operadores bulianos, quizá la característica más útil para definir criterios de búsqueda, puede ofrecer un poderoso control sobre la lógica del motor de búsqueda. Los operadores bulianos AND, OR, NOT (o AND NOT en algunos motores), NEAR y los paréntesis son análogos, de muchas maneras, a los operadores matemáticos por la forma como moldean la ejecución de una ecuación compleja. Esto es lo que los operadores bulianos pueden hacer por usted:

  • AND (Y)

Si está buscando un documento que debería contener todas sus palabras clave, podría usar la palabra en mayúsculas AND (Y) entre las palabras clave para que el motor sólo muestre los documentos que tengan ambas palabras. Por ejemplo, usar los criterios de búsqueda Juventus AND horarios mostrará todos los documentos que contengan ambas palabras. Asegúrese de poner en mayúsculas la palabra AND, de otro modo el motor la considerará una palabra clave y no un operador.

Diagrama de 2 óvalos con su intersección de color verde

Si el óvalo izquierdo representara todos los documentos que contienen la palabra Juventus y el óvalo derecho representara todos los documentos que contienen la palabra horario, la intersección de dichos óvalos, el área verde, representa todos los documentos que contienen ambas palabras. Usted puede ver lo útil que este operador puede ser para reducir el número de resultados.

  • OR

Si quiere ampliar su búsqueda para encontrar documentos que contengan cualquiera de las palabras claves, puede usar el operador OR (O) entre palabras. Esto es muy útil cuando esté buscando términos que tengan sinónimos que podrían ser utilizados alternativamente en distintos documentos. Un ejemplo de esto es chicos OR niños, que mostraría cualquier documento que contenga cualquiera de las dos palabras.

Diagrama de 2 óvalos de color verde

Si el óvalo de la izquierda representa todos los documentos que contienen la palabra niños y el óvalo de la derecha representa todos los documentos que contienen la palabra chicos, el área verde representaría los documentos que contienen cualquiera de las dos palabras o ambas. Usted puede ver cómo este operador ampliará su búsqueda y mostrará más resultados.

  • NEAR

Este operador es una forma más específica del operador AND. Se asegura que el documento contenga ambos términos y que además estén cerca uno del otro. En muchos documentos largos, usar sólo el operador AND quizá no produzca resultados útiles, pues las dos palabras claves pueden estar localizadas en distintos lugares del documento y puede que no tengan ninguna relación.

  • NOT o AND NOT

El uso del AND NOT en mayúsculas antes del término de búsqueda eliminará los documentos que contengan ese término. ¿Para qué querría usted hacer esto? Si quisiera información sobre el "Pibe" Valderrama y no quisiera documentos en los que apareciera información sobre la selección colombiana de fútbol, escribiría "Selección Colombia" AND NOT "Pibe Valderrama".

  • Los paréntesis

Los operadores AND, NEAR, OR y AND NOT son poderosos en sí, pero, al ser usados en conjunto con los paréntesis, ofrecen control sustancial sobre la lógica de búsqueda ejecutada por el motor. Los paréntesis se utilizan en la lógica buliana de la misma forma en que se utilizan en una ecuación matemática, limitando y ordenando las relaciones entre variables.

He aquí un ejemplo: si quisiera hallar un tutorial de la Internet basado en la Red, podría usar los criterios de búsqueda Internet AND (tutorial OR lección). Los documentos encontrados podrían contener ambas palabras; Internet y tutorial o Internet y lección. Esencialmente, los paréntesis se utilizan como para la propiedad distributiva en la matemática, para distribuir la palabra clave Interneta cualquiera de las dos palabras con "OR" entre paréntesis.

El uso más común del paréntesis es para encerrar dos posibles palabras claves separadas por un operador OR y luego enlazando aquellas palabras incluidas / posibles con otro criterio usando AND. Sin embargo, hay momentos y oportunidades en que una disposición inversa puede ser útil. Por ejemplo, si está buscando información sobre control de armas, quizá utilizará "control de armas" OR (legislación AND armas) que mostraría documentos con las palabras"control de armas" (ver búsqueda de frases) o documentos que contengan las palabras armas y la palabra legislación.

Usted podría refinar aún más la búsqueda. Como la palabra ley es sinónimo de legislación, puede hasta anidar un grupo de paréntesis dentro de otro para distribuir arma tanto para legislación como para ley y al hacerlo, truncar ley con un asterisco para distribuir armas con la variación - leyes.

Así es como se vería "control de armas" OR (arma AND ley* OR legislación). Observe que cada paréntesis del lado izquierdo debe corresponder con uno del lado derecho en algún lugar de la expresión buliana, de lo contrario el motor de búsqueda se confundiría (¡así son de estúpidos!).

+requerido y -excluido

Algunos motores ofrecen una variación de los operadores bulianos AND y NOT. El signo + antes de una palabra (sin espacio) requerirá que esa palabra esté presente en todos los documentos. El signo - antes de una palabra clave garantizará que esa palabra no esté presente en los documentos que presente el navegador. Nótese que todas las palabras que deban aparecer en el documento deberían estar precedidas del signo +, incluyendo la primera. Ejemplo: +fraude +elecciones garantiza que fraude esté en todos los documentos.

Opciones bulianas limitadas

Algunos buscadores ofrecen lógica buliana limitada con botones de elección o menús desplegables, como:

  • Los documentos deben incluir "Todos los términos" (equivalente a usar el operador AND entre todos los términos).
  • Los documentos deben incluir "Cualquier término" (equivalente a usar OR entre todos los términos).

Capacidad de fechas

Muchos motores de búsqueda ofrecen la capacidad de limitar búsquedas según la fecha de creación de las páginas Web. Esto es muy útil para quienes hacen investigaciones permanentes sobre un tema específico, lo que les permite limitar los resultados a las páginas creadas desde la última búsqueda. También es útil para buscar temas de actualidad.

Tenga en cuenta que la implementación de esta característica varía entre buscadores. Algunos, como Yahoo ofrecen botones de selección o menús desplegables, mientras que AltaVista y Hotbot ofrecen la posibilidad de especificar fechas o marcos de tiempo. También, la sensibilidad a las fechas se relaciona con la fecha de creación de la página Web, no a un marco de tiempo histórico. Por ejemplo, no sería útil usar esta capacidad para buscar 1907 e información relacionada con los hermanos Wright, pues no existían páginas Web en 1907 (de hecho, la Red sólo apareció en la forma como la conocemos en 1991).

Restricción de búsquedas a partes específicas del documento

Algunos buscadores pueden limitar las búsquedas a áreas específicas, de las que las más comunes son título y URL. El siguiente es un ejemplo de una búsqueda de título. Si está buscando información sobre medicina alternativa y cree que hay páginas Web enteras dedicadas a este tema que tengan las palabras clave en sus títulos, podrá usar la sintaxis: title: alternativa AND medicina.

Un ejemplo de búsqueda de URL sería buscar las páginas de Apple Computer. Podría usar: url: apple que probablemente mostrará palabras creadas por el fabricante Apple (y otros).

Restricción de las búsquedas a áreas específicas de la Web

Algunos motores de búsquedas permiten limitar las búsquedas a "sólo la Red" o sólo "grupos de noticias".

Restricción de las búsquedas a medios específicos

Both Hotbot y AltaVistaofrecen la posibilidad de buscar distintos tipos de medios; audio, vídeo, imágenes, Java y VRML.

La biblioteca de la Universidad de California en Berkeley tiene una excelente tabla (en inglés) que detalla qué posibilidades de búsqueda se ofrecen en los motores de búsqueda más poderosos, así como enlaces a instrucciones que detallan cómo usar un motor específico (los enlaces están en la parte superior de la tabla).

 

 

 

 

Localice Información:
Cómo buscar en Bases de Datos

 

Gopher, FTP, WAIS, Archie, Verónica, Torombolo. ¿Qué son todos estos extraños términos que aparecen a veces? Básicamente, se trata de viejas herramientas que representan diferentes maneras de buscar y recuperar archivos en la Internet. Con el desarrollo de la Red Global de la Información, usted ya no necesita conocer realmente los minuciosos detalles sobre la operación de la mayoría de estos servicios. Claro que, si le interesa, siga leyendo.

Gopher es una aplicación que organiza el acceso a recursos de la Internet a partir de un sistema de búsqueda y recuperación basado en menúes. Realiza índices de muchas bases de datos, catálogos en línea de bibliotecas, carteleras electrónicas y servicios de información para toda una universidad que están disponibles en Internet por tema, tipo de servicios o ubicación geográfica. A medida que usted está "husmeando" en el Gopherespacio, en realidad está haciendo cosas que no son obviamente visibles para usted, tales como transferir archivos, conectarse a computadoras y buscar en servidores de todo el mundo.

El Gopher se ocupa automáticamente de localizar cualquier información que usted desee, sin importar su ubicación. Puede usar una docena o más de servidores Gopher en una misma sesión, pero difícilmente se dará cuenta. Necesita un cliente gopher para operar el Gopher, pero si no lo tiene, existen sitios gopher públicos a los que se puede hacer telnet. Cuando usted llega ahí, debe identificarse como tal para luego operar el cliente gopher y hacer una búsqueda con él.

FTP significa File Transfer Protocol, (protocolo de transferencia de archivos), que es un método muy utilizado en la Internet para copiar archivos de un sistema a otro. Con el FTP, puede pedir una lista de archivos en un directorio para cargar o descargar estos archivos al y del directorio.

La transferencia de información que está públicamente disponible es una de las capacidades de transferencia más utilizadas en la Internet. Muchas organizaciones que se conectan a la Internet proveen sitios para transferencia de archivos con información a la que se puede acceder abiertamente. Estos archivos se almacenan en áreas abiertas de computadoras. Son accesibles mediante el uso de FTP para conectarse a esos sistemas. Estos son los llamados sitios FTP anónimos porque para ingresar es necesario identificarse como anonymous (anónimo), y usar su dirección de correo electrónico como contraseña. Si no está utilizando un navegador con una función de FTP incluida, o si quiere cargar archivos a un servidor remoto, necesita un cliente FTP.

Si se dirige a uno de los sitios de software en Internet, como Download.com (en inglés), puede encontrar muchos programas FTP. Nos gusta el WSFTP para Windows 95/NT y Fetch para el Mac. Si utiliza alguno de estos programas, debería enviar una pequeña cantidad de dinero para registrarse. Los programas Shareware (compartidos) ofrecen muy buenas herramientas a muy bajos precios y funcionan conforme a un código de honor. FTP también hace parte de diversas aplicaciones, como herramientas de manejo Web, procesadores de texto y demás.

Para conocer más sobre FTP, lea las FTP FAQ (en inglés) o preguntas frecuentes sobre el FTP del equipo de desarrollo NCSA de la Universidad de Illinois.

Veronica es el acrónimo deVery Easy Rodent-Oriented Internet-wide Index to Computerized Archives, haga una pausa para respirar y lea la traducción (índice de archivos computarizados para toda la Internet orientado a roedores y muy fácil). Se trata de una aplicación que ofrece búsquedas de palabras claves para la mayoría de títulos de menú de servidores gopher. Una búsqueda en Veronica produce un menú de elementos Gopher, cada uno de los cuales conduce directamente a una fuente de datos Gopher. Jughead (Torombolo) es otra herramienta para Gopher, aunque menos poderosa.

Archie, de otro lado, es a FTP lo que Veronica es a Gopher. Le permite buscar en todos los sitios FTP disponibles que contengan archivos con la palabra clave que usted busque. Para usarlo, debe ingresar a un servidor Archie y escribir algunos comandos. Realice una búsqueda y presentará una lista de todos los sitios que contienen lo que usted busca.

El porqué estas aplicaciones tienen nombres de personajes de caricaturas es un misterio para nosotros, pero si quiere saber más sobre ellos, lea las preguntas frecuentes sobre los FTP Anónimos (en inglés).

WAIS es el acrónimo deWide Area Information Servers (Servidores de información de área amplia). Es un sistema de recuperación de información en redes. A diferencia del Gopher, que busca archivos por sus títulos, los servidores WAIS buscan el texto completo de los archivos y despliegan una lista de documentos que contengan la palabra clave que esté buscando. El método WAIS de búsqueda y recuperación funciona igual que la mayoría de buscadores de la Internet.