Algunas reflexiones sobre el algoritmo de Google después de Florida y Austin, ¿qué es el sandbox effect?, ¿Por qué afecta a unos y a otros no?, ¿Cómo podemos recuperar las posiciones perdidas en Google?
A raíz de los comentarios (Julián y Sergio) del post The SandBox Effect se me han ocurrido algunas cosas sobre el algoritmo de Google después de Florida y Austin, que escribo a continuación. Aunque ahora contamos con la ventaja de haber pasado unos meses para realizar este análisis, no representan más que especulaciones sin valor alguno, pero que tal vez puedan ayudar a comprender el nuevo posicionamiento en google.
Florida resultó duro y complicado para el mundo SEO. Las variaciones de posiciones tan drásticas que se produjeron en muchas de las búsquedas afectadas convirtieron el algoritmo de Google en incomprensible, o al menos, mucho más complicado que el anterior. Fueron muchos los cambios, y muy complejos de analizar de un día para otro. Ahora, pasados unos meses, contamos con una mejor situación para realizar cualquier tipo de análisis.
Olvidándome de Florida, y pensando sólo en eso que llaman SandBox Effect, se me ha ocurrido lo siguiente, que no deja de ser una evidencia:
Si intentamos posicionar - en el google actual - cualquier página nueva, independientemente de lo competitiva que sea, y contamos con los factores y enlaces suficientes para que esa página debiese ser considerada primera, por una búsqueda determinada en el viejo algoritmo de google, lo más probable es que esa página no alcance la primera posición hasta pasado un tiempo X.
Mejor o peor, es una forma de definir el Sandbox Effect, pero como es algo personal la definición voy a explicar algunas cosas para que no queden dudas.
Cuando digo Google actual o nuevo posicionamiento en Google me refiero al período que comienza en Florida (16 de noviembre de 2003) para las búsquedas inglesas, o Austin (Enero, 2004), para el resto de idiomas. El posicionamiento en el viejo google sería el anterior a esas dos fechas.
Con página nueva me refiero a un dominio nuevo, desde 0, a una página que nunca haya estado en las bases de datos de Google.
El tiempo X es relativo, hay gente que lo establece en 90 días (algo que me parece falso), otra en 2 meses y algunos entre 2 y 4 meses. Creo que ninguno de esos períodos de tiempo es muy fiable. La gran cantidad de datos de las páginas web de los que dispone Google, podría utilizarlos para implementar un algoritmo sólo para este caso, de forma que el tiempo X fuese calculado en función del resto de páginas de esa búsqueda. Pero ese tiempo X podría ser simplemente consecuencia de una sobrecarga del algoritmo de Google, provocada por un análisis semántico en función del que se establecería un conjunto de temas para una web, además de analizar otros factores que conllevarían sobrecarga, circuitos de enlaces cerrados, antigüedad de enlaces para poder establecer enlaces más válidos que otros, semántica de las webs enlazadas, etc.
Explicado de otra forma: Tenemos una web nueva que habla de calamares y ofrece la información más completa y útil del sector. Pero por si fuese poco, la tenemos completamente optimizada, en función de algunos de los factores que Google considera más importantes, y además, disponemos de un gran número de enlaces entrantes en pocos días, que nos apuntan con el anchor text de la búsqueda que nos interesa: calamares, que es la misma palabra para la que hemos optimizado todos los factores on the page.
¿Por qué no pasamos de la posición 50 (o de la 100, o de la 500)? Google se hace la pregunta, ¿Qué nos cuenta esta web? Pero a diferencia de como actuaba hace un año, parece no mirar el texto. Sólo analiza las páginas que ya tienen un significado (para Google) que apuntan hacia esa web, o bien, a las que apunta esa web. Lo que cuenta es tener una semántica definida, y este factor es uno de los que puede llevar a Google varios meses para ser establecido de forma aceptable. Y esta semántica, mientras no esté definida para nuestra web, hará que nuestros resultados no mejoren por cientos de enlaces que consigamos.
¿Qué sentido tiene esto? En teoría (es discutible, claro) produce resultados más relevantes. Aquellas páginas enlazadas por webs de la misma semántica, posiblemente serán más relevantes. Pero además, también lucha contra el Spam interno. Sí, sé que el texto oculto sigue en muchas webs que tienen muy buenos resultados. Pero si ahora optimizamos una web nueva utilizando texto oculto, no obtendremos buenos resultados rápidamente, tendremos que esperar a que nuestra semántica sea definida. Y no será nada fácil que webs del sector nos enlacen cuando estamos utilizando texto oculto, llevaría mucho más tiempo posicionar una web nueva con spam interno. Esas webs que siguen en los primeros puestos y tienen texto oculto, suelen llevar mucho tiempo y disponer de una buena estructura de enlaces.
¿Dónde nos sitúa Google durante el tiempo que no tenemos semántica definida?
Posiblemente en aquellos lugares donde están otras webs en la misma situación y que tienen alguna relación con la búsqueda. No será difícil encontrar nuestra página optimizada por detrás de otra página que sólo tiene una repetición de la keyword de la búsqueda. Desconozco que factores utiliza google para ordenar estos resultados, pero los factores on the page no valen de nada. No tiene más peso una keyword por ir en el título o repetirse muchas veces. Lo más probable es que esos puestos sean establecidos por estructuras de enlaces.
¿Por qué creo que no cuentan los factores on the page antes de ser aplicada la semántica?
Además de lo dicho anteriormente, he probado a hacer 14 páginas que hablen del mismo tema (todas diferentes), unas más y otras menos optimizadas, hacer una estructura de arbol binario para enlazarlas. 8 apuntan a 4 (cada 2 a 1), 4 apuntan a 2 (cada 2 a 1), y un mapa web apuntaba a las 8 primeras. Para mi sorpresa, aunque unas estaban más optimizadas que otras (on the page), las posiciones alcanzadas fueron de la 415 a la 428, todas seguidas. Google no había mirado los factores on the page. 11 de las páginas tenían la misma IP y las otras no. Que todas las páginas apareciesen seguidas, descarta la aleatoriedad, y da que pensar que Google consideraba que todas esas páginas colgaban de una raíz (el mapa web), por lo que ninguna merecía mejor posición que otra.
¿Qué hay que hacer para posicionar una página?
Conseguir enlaces relevantes, cuantos más mejor, cuanto más se aproxime la temática mejor, y tener paciencia. Dejar pasar un período de tiempo X, tras el que se pueda definir nuestra semántica y los factores on the page empiecen a contar.
¿Qué pasó en Florida y Austin?
Seguramente influyeron muchos factores. Hasta hace un año (aproximadamente) Google actualizaba una vez al mes el PageRank y las posiciones realizando un baile de unos días. Durante unos meses realizó esto de forma irregular y en Agosto, el PageRank y los enlaces se empezaron a actualizar de forma separada al movimiento en las SERPs. Tiene sentido (Agosto) que fuese ese el momento en el que Google empezase a probar su nuevo algoritmo, a dar un significado a las webs. Entre 3 y 4 meses después, comenzarían con su nuevo algoritmo, sería el tiempo suficiente para que las webs más antiguas tuviesen su semántica definida. En octubre creo recordar se empezó a hablar de stemming y google dijo que empezaba a usarlo, aunque sin evidencia del mismo en las búsquedas, podría estar hablando de un stemming semántico, sobre todo a la hora de clasificar las webs.
Un mes después llegaba el 16 de noviembre, Florida.
La actualización de PageRank deja de tener sentido, pero se mantiene por motivos de marketing. La actualización de los enlaces se empieza a realizar a destiempo, cuando a Google le cuadra, 2, 3, 4 o hasta 5 semanas fueron períodos de tiempo habituales. Google podría actualizar cuando le apeteciese, su filosofía de trabajo, cada uno en lo que quiera y alguna sorprendentemente rápida actualización de PageRank parecen reforzar esto. (Este párrafo son todo especulaciones mías).
En enero de 2004 llegaba Austin, una extensión de Florida a otros idiomas que no fuesen el inglés. Se empezó a hablar de pérdida de valor del anchor text, de sanción a los nombres de dominio con keywords, de pérdida de valor de muchos enlaces desde un mismo dominio, etc. A la larga ninguna de estas teorías ha podido ser realmente consistente, aunque nadie puede descartar ninguno de los factores.
Muchas webs pudieron caer por motivos sencillos, llevaban poco tiempo y Google no tenía los datos suficientes para darles significado, este tipo de webs caían y desaparecían del top1000 en las búsquedas más competidas. Otras, simplemente no tendrían una semántica todo lo definida que deberían para una determinada búsqueda, y perdían algunas posiciones. Hacer cambios era inútil, era cuestión de tiempo, google tenía que hacer ajustes y jugaría con varias versiones de su algoritmo.
Los directorios alcanzan buenas posiciones, cobran importancia los hubs y las authorities. El motivo de la buena posición de una categoría de un directorio web estaría basado en sus enlaces a páginas de temáticas similares. Estar en cuantos más directorios mejor, en la categoría adecuada, parece de lo más importante. Esto refuerza toda esta teoría, Google utilizó alguna versión más dura de su nuevo algoritmo (que la actual) en algunas búsquedas, en las que los directorios conseguían unas posiciones excesivamente buenas, y tuvo que rectificar esto. Sin embargo, muchos (entre los que me incluyo) perdemos la esperanza, por más enlaces que conseguimos no logramos recuperar posiciones perdidas.
Pero hay páginas nuevas que no cayeron. Hay muchos factores a los que se puede deber esto. ¿Por qué este blog que se creo con Austin tuvo buenas posiciones desde el principio? Sospecho que esté relacionado con el hecho de ser un subdominio y google considerase en realidad la antigüedad del dominio www.bitacoras.com. Aunque el tema no es el mismo, factores on the page tal vez puedan ayudar a definirlo una vez pasado el Sandbox Effect. Los subdominios contarían con esta ventaja.
Todo lo escrito son cosas que se me han pasado por la cabeza en un corto período de tiempo, y que no me he parado a reflexionarlas detenidamente, en consecuencia: seguro que hay algún disparate.
Y escribiendo esto se me ocurrió la respuésta a una pregunta sobre el post anterior y que, en lo que acabo de probar, me parece que funciona.
¿Cómo diferenciamos si al efectuar el truco (keyword -dakdjk….) los resultados se deben al sandbox o bien a Florida/Austin?
Cuando al usar allinanchor:keyword, la página afectada por el Sandbox Effect sale en un lugar cercano al que le correspondería, sería una posición igual o semejante que en la que salimos listados por keyword -akjdkjdakd …...


Mayo 6th, 2004 at 4:10 am
Interesante teoría y muy completo post. No he encontrado ningún disparate
Para darle un caso de ejemplo a tu teoría, te comento que se discutió recientemente en SEOChat el caso de 3 webs de no muy alto PageRank (un PR0 entre ellas) rankeadas en los primeros lugares para un término muy competitivo y por delante de otras con PageRank superior, que quizás responde a tu explicación. El término es “Online Casinos” y el thread puedes verlo aquí: http://forums.seochat.com/t10183/s.html
Saludos
Mayo 6th, 2004 at 4:14 am
ups, olvidé poner mis datos xD
Eso pasa por escribir a altas horas…
Mayo 6th, 2004 at 12:07 pm
“Muchas webs pudieron caer por motivos sencillos, llevaban poco tiempo y Google no tenía los datos suficientes para darles significado”
Tiene sentido. Badabit estaba bastante bien posicionado para “Badalona” en enero y a finales de enero (o principios de febrero, no lo recuerdo) desapareció de la búsqueda. Ahora vuelve aparecer y después de una temporada de ir remontando posiciones poco a poco, se encuentra en la posición 35, eso sí, detrás de webs que hace tiempo que se dejaron de actualizar…
Mayo 6th, 2004 at 3:33 pm
De Search Engine RoundTable a Cre8asite forums. Parece que lo del SandBox va a ser realmente importante, y que se empieza a conocer qué hace Google. John Scott habla en ese hilo de cre8aiste forums de antigüedad de enlaces no de webs (Antigüedad de enlaces en Google). De todas las teorías que se hablaron en Florida, esta creo que es la única que podría responder por si sola a todos los cambios.
Mayo 6th, 2004 at 4:08 pm
Cada vez me gusta más esto.
Habría un motivo por el que Google no puede aplicar el algoritmo nuevo a una búsqueda desde 0 como Telendro. No entiende el significado, no hay una semántica relacionada. Tal vez tarde meses en comprender “Telendro”, y luego tarde más meses dar sifnificado a las Telendro Webs.
Habría otro motivo por el que Google no utiliza su nuevo algoritmo en todas las búsquedas, ni lo utilizará nunca. Si lo hiciese, habría búsquedas no competitivas o muy refinadas que darían resultados sin sentido, al no tener significado para Google ninguna de las webs que se devuelven, por no recibir enlaces semánticos.
Las authorities, hubs y todas aquellas páginas más antiguas serían aquellas que darían una semántica inicial a otras webs, por eso ahora mismo serían intocables.
Mayo 6th, 2004 at 6:51 pm
Pues pese a que hay webs que se refieren al telendro como un hotel, aparato científico, etc., creo que Google, en los 5 meses del concurso, terminará asociándolo con el Posicionamiento en Buscadores. Allí, webs como XeoWebLog que tocan ambos temas saldrán favorecidas.
Mayo 7th, 2004 at 8:37 pm
En base a que teoria se usan esas exlcusiones keyword -dakdjk….?
Gracias
Mayo 8th, 2004 at 6:20 pm
Martin, eso viene de noviembre y enero, de florida, busca algún post de este blog de entonces (enero - febrero, sobre florida/austin). Al poner eso -kajdakjd…., google volvía a resultados anteriores antes de los cambios.
Sobre el tema este, mi dominio www.xeoweb.com, está regresando después de perder todos los puestos que tenía. El tema coincide bastante, lo registré en diciembre, así que era un dominio muy nuevo, que subió posiciones muy rápido y las perdió de vez en Austin. Han pasado más de 4 meses y vuelve. Y vuelve con todas las búsquedas que perdió a la vez.
Mayo 9th, 2004 at 5:23 am
Gracias Fran
Otra pregunta, si le aplicas a la consulta dichas exclusiones se podria suponer que los resultados obtenidos podrian acercarse a la realidad luego de que Google considere todos links, pasado ese tiempo x?
Saludos
Martin
Mayo 9th, 2004 at 7:39 pm
Martin, eso es algo que todavía no sabemos. Tiempo al tiempo. Saludos.
Mayo 30th, 2004 at 6:20 pm
wow, por fin encuentro una web en castellano que saben realmente de lo que hablan. Felicidades