Viernes, Septiembre 3rd 2004


Filetype
posted @ 5:31 pm in [ Google ]

Filetype es un comando de Google muy útil para limitar la búsqueda a un tipo de archivo específico.
Por ejemplo, la siguiente búsqueda:

filetype:pdf posicionamiento

Es como buscar posicionamiento limitando la búsqueda para archivos pdf.

En métodos de búsqueda podemos encontrar hoy una entrada donde nos muestra todas las extensiones que permite el comando filetype, o lo que es lo mismo: ¿Qué tipo de archivos indexa Google?.




Miércoles, Septiembre 1st 2004


Quiero ser GoogleBot
posted @ 6:31 pm in [ Recursos SEO - Google ]

En los foros de Search Engine Watch me he encontrado un plugin para Firefox muy interesante. La idea es que nuestro “User-Agent” sea el mismo que Googlebot.

Podemos seguir los pasos de SEW para instalarlo:

  1. Bajarse Firefox
  2. Instalarlo (hasta aquí ya estamos la mayoría)
  3. Descargar/Instalar User Agent Switcher for Firefox/Mozilla
  4. Restaurar (Cerrar/Abrir) el navegador
  5. En el menú nos vamos a Tools -> UserAgent Switcher -> Options -> Options
  6. Vamos al apartado User Agents y le damos a añadir (Add)
  7. En la Descripción ponemos Googlebot y en el User Agent Googlebot/2.1 (+http://www.googlebot.com/bot.html)
  8. Podemos repetir el proceso para todos los robots de los buscadores que queramos (aquí tenéis una lista)
  9. Ahora vamos a Tools -> User Agent Switcher -> Seleccionamos Googlebot

Ahora no hay más que navegar. ¿Qué utilidad tiene? Hay páginas que para posicionarse utilizan cloaking.
El cloaking es devolver una página diferente a los robots de los busadores de la que le devuelves a los usuarios. Se hace con una simple condición a nivel de servidor. Si la condición se realiza en función de un rango de IPs del buscador este método falla (no se nos mostrará la misma página que a Google), pero si se realiza en función del User Agent ahora podemos utilizar este truco para saber que webs utilizan este tipo de cloaking.

El cloaking suele utilizar páginas con mucho texto para que sean más valoradas por los buscadores, páginas que a los usuarios no les resultarían atractivas, frente a las páginas que se le devuelven a los usuarios que no serían bien valoradas por los buscadores.

No voy a dar ejemplos para no delatar a nadie, pero muchos primeros resultados en buscadores utilizan esta técnica.

Editado: Un ejemplo curioso de cloaking: Nedstat.

http://www.nedstatbasic.net/s?tab=1&link=4&id=2765484

Dos resultados diferentes en función de si somos Googlebot o no.




Martes, Agosto 31st 2004


Actualización de Enlaces
posted @ 11:50 am in [ PageRank - Google ]

Nueva actualización de enlaces en Google. Sigue sin verse ningún movimiento de PageRank, y ya van 2 meses y 8 días, 3 actualizaciones de enlaces. Esto no había sucedido nunca hasta ahora, por lo que cabe pensar que el PageRank haya llegado a su fin.

Este blog sigue su trayectoria descendente de número de enlaces en google, esta vez 218. Por otra lado, Yahoo!, que siempre es más fiable para contar enlaces, dice que 2.950. Las actualizaciones de enlaces de Google y sus variaciones de PageRank ya no son lo que eran, además de no ser nada fiables.




Lunes, Agosto 30th 2004


Cosas que sabe Google sobre ti
posted @ 10:30 pm in [ Google ]

Vía John Battelle’s SearchBlog hasta Hublog.

¿Qué sabe Google sobre ti?

  1. Todo lo que buscas
  2. Cada página que visitas que tiene Adsense
  3. De qué país eres
  4. Cada página de blogger que visitas y de dónde vienes

Si tienes una cuenta Adsense:

  1. Tu nombre, dirección y detalles de tu cuenta bancaria
  2. La IP de todos los que visitan las páginas donde tienes Adsense colocado
  3. El número de visitantes de cada página con Adsense

Si usas GMail:

  1. Quién te escribe
  2. A quién escribes
  3. Los contenidos de los emails
  4. Los contenidos de los emails recibidos y de las listas de correo de las que eres miembro, incluso si son grupos privados

Si no usas GMail:

  1. El contenido de tus emails dirigidos a cualquier cuenta Gmail
  2. El contenido de lo que envías a cualquier lista de correo en la que un miembro use una cuenta GMail

Si formas parte de Orkut

  1. Tus intereses, tu red social, participaciones, tus grupos, tus amigos…

Inquietante…




Martes, Agosto 24th 2004


¿Quién te plagia?
posted @ 1:57 pm in [ General - Internet en General - Google - Bitácoras ]

Encontrar qué webs toman prestados nuestros contenidos es fácil. Los buscadores son la mejor herramienta para ello. Por ejemplo, si seleccionamos cualquier frase que posiblemente sea única en algo que hayamos escrito, lo más probable es que sólo se devuelva la página donde esté escrita esa frase. Si se devuelven más páginas posiblemente sean copias. La siguiente frase, si la buscamos usando las comillas (búsqueda exacta de la frase) en google:

“El texto descriptivo en los enlaces internos ayuda a mejorar las posiciones”

Encontramos tres páginas que usan esa frase exacta: la primera es la original, la segunda una copia sin autorización usada con fines fraudulentos (de cara a los buscadores) y la otra una copia con permiso.

Seleccionar frases únicas es una buena manera de saber quién nos plagia. Pero el día 9 del mes de Julio encontramos esta herramienta: CopyScape. Está basada en Google y es realmente efectiva a la hora de encontrar contenidos duplicados a partir de las páginas que le indiquemos. Tiende a fallar en muchas ocasiones cuando hay textos que se repiten por la naturaleza de los mismos (canciones, versos, refranes) y los identifica como duplicados. Pero sin duda - sin ser infalible - facilita mucho la tarea de encontrar contenidos duplicados. Aunque sólo nos copien una frase del texto, CopyScape puede detectarlo.

Tener una frase única - de forma intencionada o no - en cualquier artículo que escribamos es como asignarle un identificador único. Los errores ortográficos, sintácticos, etc. ayudan a identificar duplicados. Nadie va a escribir mal con intención, pero a veces pasa… y cuando sucede lo tenemos más fácil para saber si alguien nos está utilizando el contenido. Es triste, pero si alguien se toma la molestia de copiarnos por no molestarse en crear sus propios contenidos, claro está que no se va a molestar en corregir los errores. Esa es la tónica habitual.

En un escrito sobre el PageRank cometí el error de escribir:

se convierte entonces, en una factor muy importante

Nos vamos a Google y buscamos: “se convierte entonces, en una factor muy importante”.

Google es muy bueno diferenciando entre copias y originales, a veces falla, pero si Google tiene conocimiento del original antes que de la copia, no suele equivocarse, a no ser que sea por el número de enlaces superior que pueda recibir una copia, algo que raramente sucede. Relacionado con esto hay un artículo completo en alzado que trata el tema de las copias en el diseño.

Queriendo escribir:

La popularidad no es algo sencillo

en esta página puse:

la popularidad no es algo es sencillo

Y nos vamos a google y hacemos la búsqueda, o simplemente usamos CopyScape para este caso. La página que encontramos ha copiado el contenido de la original.

CopyScape va más allá, es realmente efectivo en algunas ocasiones, en las que el copiador se molesta en modificar los contenidos y copia párrafos de varias webs diferentes. Viendo el último caso CopyScape nos marca algunas coincidencias. En principio no parece copia, no es más que una coincidencia, ahora veamos…

El original:

En consecuencia, nuestro objetivo es que nos linken otras páginas. Añadir la página a todos los buscadores y directorios que conozcamos, tanto pequeños como grandes, añadir nuestro enlace en páginas que permitan agregar enlaces, ya sea por categorías o temática, la red está llena de sitios web que nos permiten añadir nuestro link.

La copia modificada (en negrita el texto exacto que coincide):

En consecuencia, nuestro objetivo es que enlacen su página web a otras sitios donde debemos tener muy presente los pagerank. Añadimos también su sitio en páginas que permitan agregar enlaces, ya sea por categorías o temática.

Nuestros errores, Google y CopyScape, son la mejor manera de encontrar contenidos duplicados.

Mucha gente que copia contenidos lo hace para mejorar el posicionamiento (incluso profesionales). Existe la extraña creencia a pensar (entre novatos) que si copias la web de alguien que está bien posicionado en Google, entonces tendrás buena posición en Google. Los contenidos duplicados están claramente penalizados por los buscadores, muy especialmente por Google, de forma que cada vez que copiamos algo para mejorar posiciones, lo único que estamos haciendo es añadir contenidos a la web, y empeorar nuestro valor para el buscador de cara al posicionamiento (a no ser que lo hagamos bien, que no suele ser el caso). En SeoHome tenéis un artículo sobre Contenido Duplicado y Google.




Lunes, Agosto 23rd 2004


SEOMaker
posted @ 11:59 am in [ Noticias SEO - Google ]

SEOMaker: Un nombre digno de una empresa de posicionamiento anglosajona es el término escogido para el nuevo concurso de posicionamiento en google. Según las bases, parte de un término (SeoMaker) que a día 11 de Agosto no tenía ningún resultado en Google (en el momento que escribo esto hay un solo resultado). Comenzará oficialmente el día 21 de septiembre y finalizará el 18 de Enero de 2005. En principio, y como mínimo, hay premios a los tres primeros clasificados basados en alojamiento gratuito de alta calidad durante un período de un año.

El sistema de puntuación es lo más novedoso, se valorarán las 10 primeras páginas por puntuaciones y con la interfaz en inglés y en español (Ver las bases).




Lunes, Agosto 16th 2004


Noticias Google-Buscadores
posted @ 4:32 pm in [ Noticias SEO - Google ]

Buscadores: más de 100 millones de clientes satisfechos (Vía Andy).

Google no registró GMail y puede perderlo.

La entrevista a Playboy viola la ley.

Cristiano Ronaldo: El futbolista más buscado en Yahoo! ;) .




Lunes, Agosto 16th 2004


Enlaces
posted @ 3:14 pm in [ General - Recursos SEO - Google ]

Bots, Blogs y News Aggregators (Pdf, 1.5 Megas. Vía).

Intercambios a de enlaces a 3 bandas (GOOG).

Estrategias de Conectividad Semántica y otras historias.

¿Es Yahoo! efectivo? - No, no lo es.

Construyendo popularidad web: 1 - 2 - 3.

Serge Thibodeau y las 7 preguntas SEO más frecuentes.




« Previous Posts
Next Posts »