Porque hay un campo de resultados más allá de Google y sus arañas, te presentamos algunos buscadores alternativos a Google que aunque no puedan reemplazarlo, sí abren las parcelas…
No se trata de encontrar un sustituto de Google, ya que hoy no lo hay, sino de simplemente enriquecer sus resultados y/o dar con otros impensados.
La idea es no restringirse solo a los SERP (Search engine results page – Página de resultados del buscador) de Google, sobre todo para ciertas búsquedas y, en especial, para quienes buscan recuperar esa magia de descubrir rincones y rarezas ocultas de Internet, tal como se hacía antes.
Si no está en Google no existe…
Una creencia errada y común: pensar que todo está en Google. Una impresión tan equivocada como suponer que todo está en Internet.
Hay cosas de Internet aún no indexadas en Google, como ser todo lo que está en la web profunda.
Otras sí están, pero es casi como si no estuvieran.
Google es una herramienta indispensable de nuestros días y su utilidad es indiscutible.
Pero uno de sus puntos en contra es que margina gran cantidad de resultados, que quedan sepultados por otros bajo los parámetros comerciales utilizados por el buscador.
O excluye muchos otros resultados en función a la ubicación, hábitos de navegación, intereses del usuario y otros factores de personalización. Filtros no necesariamente siempre convenientes para nuestras búsquedas.
¿Cuáles son los mejores buscadores alternativos a Google?
Como Google, no hay. Para muchas búsquedas cotidianas, Google es lo mejor y no puede reemplazarse.
Sin embargo, si buscas un buscador más privado, o encontrar otra clase de resultados que el gigante relega, tal vez te sirva alguno de los siguientes buscadores alternativos a Google:
Wayback Machine – Archive.org
Un verdadero tesoro en Internet, que permite acceder a una inmensa cantidad de sitios web ya inexistentes, al almacenarlos y archivarlos en su base de acceso público y libre.
La función de búsqueda de Wayback Machine utiliza un índice basado en “cientos de miles de millones de enlaces” a las páginas de inicio de más de 350 millones de sitios web.
A la vez, permite buscar sitios web viejos en específico hoy desaparecidos, ingresando la URL específica. No están todos, obviamente, pero hay muchísimos.
Es muy útil para citar fuentes de información ahora inaccesibles, entrar a páginas que hoy dan error, descubrir sitios e investigar sobre variados asuntos.
Resulta ideal, por ejemplo, para corroborar que tal cosa se dijo o hizo o pasó, aunque el enlace ya no esté disponible. Wayback Machine lo recupera para su acceso al público. Un recurso indispensable para periodistas, generadores de opinión, investigadores y redactores.
Proyecto que forma parte de Internet Archive, biblioteca digital sin fines de lucro que busca preservar y dar acceso a software, sitios web, música y más.
Wiby.me
Buscador más privado, independiente y con su propio index, que devuelve resultados de viejos e interesantes sitios web. Si quieres explorar la Internet de otras épocas, cumple y mucho.
La política de privacidad de Wiby es cortita y clara: mantiene registros durante 48 horas. Luego de ese tiempo, asegura eliminarlos:
“Los registros de acceso sin procesar se guardan hasta 48 horas y se eliminan automáticamente más allá de ese tiempo. Los registros de acceso sin procesar existentes dentro del período de 48 horas son privados; no se comparten con terceros.”
No comparte información con terceros y su página de inicio es tan transparente como parece, evocando de primeras la vieja web de antes.
Es uno de los mejores buscadores alternativos a Google.
Primero, porque es uno de los pocos con su propio motor de búsqueda.
Y principalmente, porque más allá de tus gustos e intereses, aparecen resultados que en Google mueren allá abajo y seguramente no encuentres googleando.
Para navegar la web moderna, tienen wibi.org.
DuckDuckGo
Buscador con sede en USA, que se promociona como un aliado de la privacidad.
La experiencia de búsqueda y también sus resultados son mejores que otros buscadores alternativos a Google.
Además, ofrece una versión .onion y es el motor de búsqueda por defecto del navegador Tor.
Ver: DuckDuckGo VS Google
Una parte de sus resultados se basan en su propio índice (Web crawler), llamado DuckDuckBot, mientras que el resto los obtiene de otros buscadores, como Yahoo!, Bing y otros.
Tiene una opción llamada ‘Bangs’ para buscar cosas directo en otros sitios web, como IMDB, eBay, etc, que viene muy bien.
Searsx
Para dar sus resultados, el metabuscador Searx utiliza más de 70 proveedores de buscadores -entre ellos, está integrado con Wayback Machine-. Aseguran no rastrear ni perfilar a sus usuarios.
Consiste en un proxy de código abierto para motores de búsqueda, que permite seleccionar qué buscadores usar, sin enviarles las solicitudes a ellos directamente.
No todas las instancias funcionan por igual ni tienen las mismas condiciones de privacidad. Una recomendada es la instancia de Snopyta.
También es posible que cada usuario y grupos de usuarios ejecuten su propia instancia.
Yacy
Motor de búsqueda descentralizado, nacido en 2004, que se presenta como un buscador más privado y al servicio del usuario.
Al ejecutarse en una red peer-to-peer, a través de varias computadoras que no están bajo el control de ninguna empresa o persona, no hay un servidor central que pueda intervenirse.
Para usarlo, hay que descargar su software gratuito.
Tiene 3 modalidades.
En el modo P2P, la red no almacena las solicitudes de búsqueda del usuario, todos pueden usarlo y nadie puede censurar el contenido indexado del índice compartido.
Además de unirse a una comunidad de motores de búsqueda, permite crear tu plataforma de búsqueda, mediante una instalación independiente de otros pares.
También está el servicio de búsqueda para tu intranet o páginas web.
Buscadores para la deep web
En la deep web no solo hay oscuridad, estafas, delincuentes y aberraciones varias, sino también bases de datos académicas, curiosidades, información muy interesante, gran cantidad de datos, cosas de todo tipo y color.
Para acceder a estos buscadores aquí listados, descarga el navegador Tor.
Agrega .onion al nombre raro que aparece al lado del nombre de cada buscador y pulsa enter desde Tor.
DeepLink – deeplinkdeatbml7
Buscador desarrollado por los creadores de DeepPaste, que permite buscar sitios .onions por título y descripción. Y tienen una opción para aburridos: caer a un sitio .onion en modo random.
Otros buscadores para la Deep Web
Onion link list – donionsixbjtiohce24abfgsffo2l4tk26qx464zylumgejukfq2vead
The Hidden Wiki – zqktlwi4fecvo6ri
HD Wiki – hdwikicorldcisiy
Not Evil – hss3uro2hsxfogfq
Ahmia – msydqstlz2kzerdg
VisiTor – visitorfi5kl7q7i
Tordex – tordex7iie7z2wcg
Torch -xmh57jrknzkhv6y3ls3ubitzfqnkrwxhopf5aygthi7d6rplyvk3noyd
OnionLand Search – 3bbaaaccczcbdddz
*Recuerda agregar .onion a cada uno para poder acceder desde el navegador Tor.
6 Buscadores Alternativos a Google para otra clase de búsquedas
Existen muchos otros buscadores alternativos a Google, dependiendo de qué busques literalmente, como ser:
- Project Gutenberg – Biblioteca gratuita de ebooks epub y Kindle prontos para descargar o leer en línea -en inglés- sin necesidad de registro, sobre todo de libros antiguos sin problemas de derecho de autor.
- Elephind – Buscador de diarios / periódicos históricos y digitalizados de Estados Unidos y Australia, siendo un recurso útil para historiadores e investigadores.
- Pipl – Buscador de personas que trata de facilitar la ubicación de contactos, información laboral, datos de identidad personal, profesional y perfil de redes sociales, con más de 3 mil millones de perfiles de identidad. Herramienta usada por analistas e investigadores.
- WebCrawler – El primer motor de búsqueda en ofrecer búsqueda de texto completo, lanzado en 1994 por Brian Pinkerton, un estudiante de la Universidad de Washington. Luego, incorporó anuncios, pero separados de los resultados.
- WorldWideScience – Buscador de portales y bases de datos científicas de varias partes del mundo.
- ResearchGate – Red social dirigida a científicos, que tiene un motor de búsqueda con resultados de PubMed, la base del Institute of Electrical and Electronics Engineers, el buscador académico CiteSeer, la Biblioteca de la NASA y otras fuentes.
- Curlie – Directorio editado por humanos, desarrollado y mantenido por una comunidad global de voluntarios. Antes conocido como Open Directory Project (ODP), DMOZ y con otros nombres.
Buscar sitios Neocities buenos
Neocities.org provee alojamiento web estático y gratuito, contando con más de 32.500 sitios web, “que están recuperando la creatividad perdida de la web”. Varios de ellos realmente muy interesantes.
En estos dos directorios puedes explorar rarezas existentes en la web y sitios con apariencia de otras épocas y contenido muy vigente, a los cuales difícilmente llegues vía Google:
Ver: ¿Cómo crear una cuenta en Neocities?
Otros buscadores más privados
Además de Wiby.me, Searx, DuckDuckGo y Yacy, hay varios otros buscadores que se presentan como más privados, entre ellos:
Mojeek – Motor de búsqueda independiente creado en Reino Unido con su propio índice de resultados, que no almacena las direcciones IP ni comparte datos con terceros. Sus resultados son aún un poco débiles.
Qwant – Buscador de origen francés, que se presenta como un “motor de búsqueda que respeta su privacidad“. Como complemento de su index propio, utilizan los resultados de Bing.
Ecosia – Buscador con sede en Alemania, que promete plantar árboles por cada cierto número de búsquedas. Obtiene sus resultados (y muestra anuncios) de Bing.
Y existen muchos otros buscadores alternativos a Google y que juran ser más privados, como:
- SwissCows
- Exalead
- MetaGer
- Oscobo
- Discrete Search
- Peekier
- Gibiru
- StartPage
- Gigablast
- Carrot2
- ActiveSearchResults
- OneSearch
- Yippy
Aquí puedes ver un mapa de motores de búsqueda.
Problemas de los buscadores más privados
La balanza privacidad – utilidad
De poco sirve un buscador ultra privado con resultados de búsqueda pobres. Este es uno de los retos que afrontan los buscadores alternativos a Google, balancear privacidad y resultados de calidad.
La dependencia
La mayoría de los motores de búsqueda que se presentan como más privados comparten un problema de base: depender de Google, Bing y otros grandes para dar sus resultados.
El asunto es que los datos ingresados en los buscadores en teoría más privados pasan y se almacenan en servidores de grandes proveedores, conocidos por ser poco o nada respetuosos con la privacidad.
La recopilación de datos podría estar incluida en el acuerdo entre el buscador más pequeño y el buscador más grande, sin nadie enterarse y sin nada que pueda hacerse.
Como señala DigDepper en su análisis de buscadores en teoría más privados:
“El problema principal es que todos ellos carecen de su propio índice, lo que significa que dependen completamente de los infractores. Los que usan su propio índice tienen resultados débiles”.
A pesar de que aún falte una pulida para ofrecer mejores resultados, el experto exhorta usar Wiby.me y Mojeek, debido a ser de los pocos buscadores independientes con sus propios motores de búsqueda.
Más allá de la política de privacidad del buscador presentado como más privado, si depende de proveedores no aliados con la privacidad, las consultas de búsqueda y otros datos aún pasarán y se almacenarán en sus servidores. Y cabe pensar que decidirán con ellos lo que más les interese.
¿Qué problema hay con el buscador de Google?
A primera vista, ninguno. Los algoritmos del motor de búsqueda avanzan en forma constante, el crecimiento de su escala e infraestructura es anormal y los resultados devueltos suelen coincidir con nuestras consultas.
La utilidad y eficacia de Google es innegable, sobre todo para búsquedas del día a día, consultas rápidas y encontrar cierta información, pero también presenta estos y otros problemas:
Privacidad
Si buscas un buscador más privado, Google no es la opción, dada la cantidad de datos que recaba en masa automáticamente de cada uno de nosotros.
El buscador más usado en el mundo registra las búsquedas de sus usuarios, creando un perfil de sus intereses, utilizado para personalizar sus resultados y también venderlos a anunciantes.
Y al buscar con la sesión iniciada, todos los servicios integrados a cada cuenta también recopilan información personal.
Los historiales de búsqueda revelan mucha información indeseada, incluyendo a menudo datos confidenciales de los usuarios.
Parcelas de resultados
La excesiva personalización y geolocalización son algunos de los filtros que usa Google, basados en nuestros supuestos intereses y ubicación, para dar sus resultados (y anuncios).
Esto limita el campo de búsqueda del usuario.
Invisibilizando o censurando contenido valioso si no cumple con sus parámetros, el buscador a menudo privilegia contenido comercial, sitios web populares, resultados de las grandes corporaciones y muchas veces de gigantes SEOs vacíos de valor real.
Resultados que no necesariamente son lo que uno busca.
¿Qué deberían aportar los buenos buscadores alternativos a Google?
Mayores condiciones de privacidad y control al usuario, además de recuperar cierta imparcialidad a la hora de dar los resultados.
Sería bueno librarse de las cadenas de la personalización y la publicidad dirigida para reencontrar otra clase de resultados. Otra parte de Internet que aún está por ahí.
Hace ya varios años, el experto italiano en ingeniería inversa, Francesco Vianello -alias Fravia-, alertaba del abuso que hacían “los SEO spammer” de la ambigüedad semántica y variedad de contextos asociados a las palabras “para empujar su basura“.
Para evitar los “algoritmos anti-spam” de los motores de búsqueda, el ingeniero italiano incluso sugería tácticas de ingeniería inversa para excluir los términos no deseados.
Vianello exhortaba a no cerrarse a uno y usar más de un motor de búsqueda para complementar los resultados y ampliar el espectro.
Hace ya más de una década, el italiano indicaba:
“El material útil puede ser casi invisible para aquellos que solo usan las herramientas de búsqueda ‘principales’ para buscar.
Además, cualquiera que use Google regularmente (por ejemplo, pero otros motores de búsqueda no son tan diferentes) habrá notado lo contaminantes que son los resultados de los sitios comerciales hoy en día.
Si un motor de búsqueda introdujera una nueva y simple opción “por favor, oculte todos los sitios comerciales de sus SERPs” (páginas de resultados de motores de búsqueda), o cambie o deslice, probablemente se convertiría en el rey de la colina en un par de meses.”
Instructions & Caveats (Why should anyone use a “not google” search engine at all?) – Fravia – Recuperado vía Wayback Machine).
A modo de ejemplo, el sitio web de Vianello (hoy solo accesible desde WaybackMachine), así como otros aquí mencionados, no se encontraron precisamente en Google, aunque sí estén indexados por el gigante.
¿Cuánto hay indexado en Google?
Difícil de tener una cifra precisa, debido a que en primer lugar no se sabe a ciencia cierta cuánto hay indexado en la web e Internet en general.
Tampoco cuánto existe realmente en ese campo enorme llamado “deep web”.
El primer índice de Google, en el año 1998, poseía 26 millones de páginas. Dos años después, unas 100 millones de páginas.
Para mediados de 2008, Google “tenía conocimiento” de más de “1 billón de URL únicas en la web a la vez“. En esa época salió CUIL, un buscador hoy desaparecido creado por ex empleados de Google e IBM, que aseguraba tener un índice 3 veces mayor que Google, además de comprometerse a no registrar historiales de búsqueda, cookies ni otros datos del usuario.
En 2013 el buscador reportó unas 30 billones de páginas y en 2016 Google decía conocer 130 billones de páginas web.
Ese número, sin embargo, no significa cantidad de páginas indexadas por Google, sino descubiertas / conocidas por el motor de búsqueda.
Ahora el buscador dice:
“En una fracción de segundo, los algoritmos de búsqueda de Google revisan cientos de miles de millones de páginas web en nuestro índice de búsqueda para encontrar los resultados más relevantes y útiles para lo que está buscando”.
Respecto a la deep web, se sabe que sería mucho más grande que la web indexada, aunque es muy difícil llegar a un número.
Un estudio realizado en el año 2000 llegó a señalar que la web profunda era 400-550 veces más grande que la World Wide Web, “con casi 550 mil millones de documentos individuales en comparación con los mil millones de la web superficial” y una estimación a la baja de “más de 200.000 sitios web profundos” en esa época.
Fuentes: