Según veo en Search Engine LowDown Yahoo! no está usando Inktomi en sus resultados. Al parecer algún trabajador (según Andy Beal: Tim Mayer) de Yahoo! lo ha confirmado en los foros de WebMasterWorld, diciendo que Yahoo! está usando una nueva tecnología de búsqueda que no es Inktomi.
Los resultados de búsqueda deben estar basados en Inktomi dadas las grandes similitudes, pero son claramente diferentes a los resultados que da Hotbot o MSN. En cualquier caso, los resultados parecen muy relevantes, y dignos de un gran competidor para Google, sea una tecnología propia o no, basada en Inktomi, Altavista y/o AlltheWeb, Yahoo! está dando mucho que hablar.
Vía Serge Thibodeau Weblog me entero que Aaron Swartz finaliza su Google Weblog, el más conocido. Se puede leer The End of Google Blog, donde dice algo así como: Google no es relevante a día de hoy, fue el mejor y el más popular; Overture está ganando adeptos y la “élite” ya usa Overture como su página de inicio.
Lo que no acabo de entender es porqué ese post es del 31 de Marzo.
Búsqueda avanzada en Google con Soople. Se puede hacer prácticamente de todo sin necesidad de conocer todos los comandos de Google.
Visto en Search Engine Watch.
Tal vez a mucha gente no le guste Google, es indudable que tiene algunos puntos flojos: Spam Report, Páginas Dinámicas… Cada uno tendrá alguna queja en especial. Pero, sin duda, hay un detalle que me encanta de este buscador: ayer subí una página a las tantas de la madrugada (hace menos de 20 horas) y Google ya la tiene indexada con su actualización del día 18. Esa rapidez y facilidad para indexar webs ojalá la consiga Yahoo! para ser todavía un mejor competidor.
Conseguir que Google nos recorra una web y la muestre lo antes posible, es tan fácil como ponerle un enlace en una página que GoogleBot recorra a diario. Suelen ser aquellas páginas que modifican su contenido diariamente, Google las premia actualizando la caché de la página principal de la web todos los días. Al recorrer esa página ve que algo ha cambiando, que hay un enlace nuevo, recorre la nueva página y la indexa. Casi nunca falla.
Esta noche se pasó por aquí un spammer (o intento de…) dejando un par de firmas, supongo que con la esperanza de conseguir algunos enlaces para su web, o bien, con la idea de subir PageRank. Hace un par de semanas una empresa de Posicionamiento Web (basada en firmar blogs, libros y demás) dejaba su rastro en este blog. De momento, esos son los que han pasado, y los voy apuntando, con el anchor text que dejan, el día, la IP, y la web; un día, cuando vengan más, la colgaré para que se pueda descargar (procuraré cerciorarme de que todos los publicados se dedican al Spam).
Después de borrar los mensajes del spammer (o intento de…), me puse a buscar enlaces relevantes para el blog. Este proceso del posicionamiento web es sencillo, y aburrido, una de las mejores opciones es buscar los links de la competencia en google (link:www.dominio.com), como nos da (normalmente) enlaces de PageRank 4 o más, la mayoría de ellos serán relevantes (si están relacionados con el tema), pero como muchas veces, no he podido encontrar casi ninguno. La mayoría de ellos no están ni visibles, hay que desactivar el JavaScript del navegador para ver la mayoría de los inventos que se hacen para posicionar webs, o bien mirar el código, o en los casos más complejos mirar la caché de google a ver si hay algún tipo de cloaking.
Creo que en el blog nunca hablé de cloaking, para el que no esté muy familiarizado con esto, se basa en servir una web al usuario, y otra distinta al robot del buscador. La página que se muestra al buscador estaría optimizada todo lo posible y más, total, no la va a ver el usuario -una repetición sin sentido de palabras clave, por ejemplo-. Hay muchos métodos de cloaking y algunos no es incluso posible verlos con la caché que guardan los buscadores.
Todas estas técnicas, en principio, están penalizadas por los buscadores, pero como no las pueden detectar de una forma automática, a no ser que sean revisadas manualmente por algún empleado de Google, las posibilidades de que una web que utiliza una técnica penalizada sea baneada, penalizada o sancionada de alguna forma, son prácticamente nulas. Podemos usar el Spam Report de Google (no voy ni a buscar la página dónde está porque no merece la pena), pero creo que es algo así como el Add Url que está ahí, pero no le hacen ni caso. Desconozco la forma de denuncia de técnicas penalizables en otros buscadores, pero desde luego espero que sean mejores. Google es un desastre en este sentido.
Desactivar el JavaScript del navegador y buscar los enlaces de la competencia de una búsqueda competitiva es algo de lo que realmente se aprenden cosas, no sé si útiles, pero se aprenden. ¿Cómo Fujitsu España (PageRank 7) puede tener una Zona NoScript llena de texto? No voy a dar nombres de más páginas, pero este me parece un caso digno de mencionar - de meternos, meternos con los más grandes -. La Zona NoScript está bien para algunas cosas, pero desde luego que no son estas. Es una de las técnicas más utilizadas cuando nuestra página está llena de imágenes, animaciones o carece de texto por algún motivo, o bien está en JavaScript, pues entonces vamos a poner palabras sin sentido en la zona NoScript, qué total, no las ve nadie.
La zona NoScript puede estar bien para ayudar al navegador a seguir enlaces, para decirle al usuario que no puede visualizar bien los contenidos.
Las capas ocultas en CSS, o no visibles de alguna manera, están muy de moda. Es fácil encontrar webs que hagan esto (o incluso empresas que te hacen estos arreglos).
Otra técnica, de la que se puede hasta ser profesional de ello, es el Spamming Guestbook. Recientemente he encontrado una web muy bien posicionada que tendrá entre blogs, libros de visitas y otro tipo de páginas firmadas, unos 1000 backlinks y más de 3000 referencias; eso sí, hay que saber idiomas, enlaces de páginas francesas, alemanas, inglesas, españolas, japonesas… Unos fenómenos del tema. Esta es la forma más rápida de posicionarnos en Google. Porque mucho filtro, mucha modificación del algoritmo, pero este tipo de páginas siguen ahí.
Antes decía que a veces se aprende algo mirando el posicionamiento de estas páginas. Hoy me he encontrado con enlaces de este tipo en una web:
¿¡Ah!? ¡Qué no se ve nada! Pues pone esto…
<a href=”http://www.xeoweb.info”></a>
¡Sin anchor text!, queda la duda de si Google y compañía seguirán este tipo de enlaces, parece bastante claro que sí.
Vía Search Engine LowDown me encuentro con este artículo de Danny Sullivan, los gráficos hablan por sí solos.
Otro artículo interesante lo encontramos en Search Engine Journal.
¿Se aproxima el final del liderazgo de Google? Con unos pocos más que se pasen a Yahoo!…
Austin, Brandy y Florida toman la recta final. Google.com empieza a mostrar los resultados de los datacenters 64.* tal y como el pasado fin de semana anunciara GoogleGuy, queda esperar a que se actualicen el resto de los datacenters y ver si google continuará sus actualizaciones como en el pasado, o también cambiará esto, de momento, sigue sin mostrarse PageRank para muchas de las páginas a las que hace una semana se les actualizasen los Backlinks.