todo sobre google

No hace mucho tiempo existía un conocido "Documento de PageRank al detalle", el cual era utilizado por la mayoría de gente interesada en entender la manera en la que PageRank funciona. De hecho, yo mismo lo usé. Pero cuando estuve escribiendo la Calculadora de PageRank, me di cuenta de que el documento original era incorrecto en la forma de hacer los cálculos. Usa su propia forma de PageRank, llamada mini-rank por su autor. Mini-rank cambia la ecuación del PageRank de Google por razones desconocidas, haciendo los resultados de los cálculos realmente incorrectos.
Aunque creo que el autor abandonó el mini-rank a causa de este y otro documento, el documento original sigue disponible en la web. Por eso, si usted proviene de un documento sobre PageRank basado en mini-rank, éste ha quedado obsoleto y es mejor que lo ignore.
¿Qué es PageRank?
PageRank es un valor numérico que representa lo importante que es una página en la web. Para Google, cuando una página enlaza a otra, es como si la página que tiene el enlace, votara a la página enlazada. Mientras más votos tenga una página, más importante será la página. También, la importancia de la página que vota determina lo importante que es el voto. Google calcula la importancia de una página a partir de los votos que obtiene. En el cálculo del PageRank de una página se tiene en cuenta lo importante que es cada voto.
PageRank es, para Google, la manera de decidir la importancia de una página. Tiene importancia ya que es uno de los factores que determina la posición de una página en los resultados. No es el único factor que Google usa para posicionar las paginas, pero es uno muy importante.
De ahora en adelante, nos refereriremos a PageRank como "PR".
Notas:No todos los links son contados por Google. Por ejemplo, filtra todos los enlaces de granjas de enlaces conocidas. Algunos enlaces pueden causar que un sitio sea penalizado por Google. Saben que los webmasters no pueden controlar que sitios les enlazan, pero pueden controlar los enlaces de su propia página. Por esa razón, los enlaces hacia un sitio web no pueden herirlo, pero enlaces desde un sitio web pueden ser dañinos si enlazan a sitios penalizados. Por eso hay que ser cuidadoso con los enlaces que hay en nuestra página. Si una web tiene PR0, es, normalmente, una web penalizada y se desaconseja realmente enlazar hacia ella.
Como se calcula el PageRank?
Para calcular el PageRank de una página, todos sus enlaces entrantes se tienen en cuenta. Estos son enlaces dentro de la página y enlaces fuera de la página.
PR(A) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C(tn))
Esta es la ecuación que calcula el PageRank de una página. Es el original que fue publicado cuando PageRank estaba siendo desarrollado, y es probable que Google use una variación de él pero no nos dicen cual exactamente. De todas formas, no es problema, ya que esta ecuación es suficientemente buena.
En la ecuación, 't1 - tn' son páginas enlazando a la página A, 'C' es el número de enlaces salientes que tiene una página y 'd' es un factor de amortiguación, que normalmente vale 0.85.
Podemos pensarlo de una forma más simple:
El PageRank de una página = 0.15 + 0.85 * (una "porción" del PageRank de cada página que la enlaza)
"porción" = El PageRank de la página enlazante dividido por el número de links salientes.
Una página "vota" una cantidad de PageRank en cada página que enlaza. La cantidad de PageRank que tiene para votar es algo más pequeña que su propio valor de Pagerank (su propio valor * 0.85). Este valor se comparte equitativamente entre todas las páginas a las que enlaza.
A partir de aquí, podemos concluir que un enlace desde una página con PR4 y 5 enlaces salientes vale más la pena que un enlace desde una página con PR8 y 100 enlaces salientes. El PageRank de una página que enlaza a la suya es importante pero el número de enlaces en esa página también es importante. Mientras más links haya en una página, menos valor de PageRank recibirá tu página de esta.
Si las diferencias del valor de PageRank entre PR1, PR2, ... PR10 fueran iguales, entonces esta conclusión se sostiene, pero mucha gente cree que los valores entre PR1 y PR10 (el máximo) son fijados en una escala logarítmica, y existen muy buenas razones para creerlo. Nadie fuera de Google conoce con seguridad una manera u otra, pero las posibilidades de que la escala sea logarítmica son altas, o similares. Si es así, significa que se necesita mucho más PageRank para que una página pase al siguiente nivel de PageRank que el que hizo falta para pasar el nivel anterior. Este resultado invierte la conclusión anterior, un enlace de una página con PR8 que tiene muchos enlaces salientes es bastante más importante que un link de una página con PR4 que tenga unos pocos enlaces salientes.
Sea cual sea la escala que usa Google, podemos estar seguros de una cosa. Un enlace de sitio incrementa el PageRank de nuestra página. Simplemente, no olvides evitar enlaces de granjas de enlaces.
Hay que tener en cuenta que cuando una página vota su valor de PageRank a otras páginas, su propio PageRank no se reduce por el valor que está votando. La página que vota no pierde su PageRank y se queda con nada. No es una transferencia de PageRank. Es simplemente un voto de acuerdo con el valor de PageRank de la página. Es como una reunión de accionistas, donde cada accionista vota de acuerdo con el número de acciones que posea, pero las acciones en sí no las pierde. Aún así, las páginas pierden algo de PageRank indirectamente, como veremos más tarde.
Ok hasta ahora? Bien. Ahora veremos como se hacen realmente los cálculos
Para el cálculo de una página, su PageRank existente (si tiene alguno) es abandonado completamente y un nuevo cálculo es realizado donde la página se basa solamente en el PageRank "votado" para ello por sus enlaces entrantes actuales, los cuales pueden haber cambiando desde la última vez que se calculó el PageRank.
La ecuación muestra claramente como llega el PageRank de una página. Pero lo que no es inmediatamente obvio es que no puede funcionar si el cálculo se hace una sola vez. Supongamos que tenemos 2 páginas, A y B, cada una enlazada a la otra, y ninguna de las dos tienen enlaces de otro tipo. Esto es lo que ocurre:
Paso 1: Calcular el PageRank de la página A con el valor de sus enlaces entrantes.
La página A ahora tiene un nuevo valor de PageRank. En el cálculo se usó el valor del enlace entrante de la página B. Pero la página B tiene un enlace entrante (de la página A) y su nuevo valor de PageRank no ha sido trabajado todavía, por eso el nuevo valor de PageRank de la página A está basado en datos imprecisos y por lo tanto no puede ser preciso.
Paso2: Calcular el PageRank de la página B con el valor de sus enlaces entrantes.
La página B tiene ahora un nuevo valor de PageRank, pero no puede ser preciso ya que el cálculo usó el nuevo valor de PageRank del enlace entrante desde la página A, el cual es impreciso.
Es una situación "Cogidos 2 a 2". No podemos concluir con el PageRank de A hasta que conozcamos el PageRank de B, y tampoco podemos concluir con el PageRank de B hasta que conozcamos el PageRank de A.
Ahora que ambas páginas tienen nuevos valores de PageRank calculados, no podríamos rehacer los cálculos para llegar a los valores precisos? No. Podemos rehacer los cálculos usando los nuevos valores y conseguir resultados más precisos, pero siempre estaremos usando valores imprecisos para los cálculos, por lo que los resultados serán siempre imprecisos.
El problema se soluciona repitiendo los cálculos muchas veces. En cada repetición se consiguen resultados ligeramente más precisos. De hecho, es imposible conseguir una precisión total ya que los cálculos siempre estarán basados en valores imprecisos. Cuarenta o cincuenta iteraciones son suficientes para alcanzar un punto donde más iteraciones no alterarían de manera notable el resultado. Esto es precisamente lo que hace Google en cada actualización y esa es la razón por la que tarda tanto.
Una cosa a tener en cuenta es que los resultados que obtenemos de los cálculos son proporcionales. Los números obtenidos deben ser puestos en una escala (conocida solo por Google) para conocer el PageRank real de cada página. Aún así, no podemos usar los cálculos para canalizar el PageRank dentro de un sitio alrededor de sus páginas ya que algunas páginas reciben una proporción mayor de PageRank que otras.
Nota: Probablemente usted venga de otras explicaciones del PageRank donde se utiliza la misma ecuación pero el resultado de cada iteración del cálculo es añadido al PageRank existente de la página. El nuevo valor (resultado + PageRank existente) es entonces usado cuando se comparte PageRank con otras páginas. Estas explicaciones son incorrectas por las siguientes razones:
1. Citan la misma ecuación publicada, pero la cambian.
de PR(A) = (1-d) + d(.....) a PR(A) + (1-d) + d(.....)
Es incorrecto e innecesario.
2. Estaremos mirando como organizar enlaces tal que ciertas páginas acaben con mayor proporción de PageRank que otras. Añadiendo el PageRank existe de la página en cada iteración produce distintas proporciones que cuando la ecuación es usada tal como se publicó. Sabiendo que la suma no es parte de la ecuación publicada, los resultados son incorrectos y la proporción imprecisa.
De acuerdo con la ecuación publicada, la página que esté siendo calculada empieza desde cero en cada iteración. Se basa solamente en sus enlaces entrantes. La idea de añadir el PageRank existente no hace eso, por lo tanto los resultados son incorrectos.
Enlazando Internamente.
Hecho: Un sitio web tiene una cantidad máxima de PageRank que es distribuida entre sus páginas a través de enlaces internos.
El máximo PageRank en un sitio es equivalente al número de páginas en el sitio * 1. El valor máximo es incrementado por enlaces entrantes desde otros sitios web y decrementado por enlaces salientes a otros sitios web. Estamos hablando sobre el PageRank global en el sitio web, no del PageRank de cada página individual. Usted no necesita creer en mi palabra para esto. Puede alcanzar la misma conclusión usando lápiz, papel y la ecuación.
Hecho: El valor máximo de PageRank en un sitio incrementa a la par que el número de páginas en el sitio web incrementa.
Mientras más páginas tenga un sitio web, más PageRank tendrá ese sitio. Una vez más, usando papel, lápiz y la ecuación, puede llegar a la misma conclusión. Tenga en cuenta que las únicas páginas que cuentan son las que Google conoce.
Hecho: Enlazando de forma pobre, es posible fracasar en alcanzar el máximo PageRank del sitio web, pero no es posible excederlo.
Enlaces paupérrimos pueden causar que un sitio no llegue a su máximo pero ningún tipo de estructura de enlaces internos causará que el sito se exceda de su máximo. La única manera de incrementar el máximo es añadiendo más enlaces entrantes y/o incrementando el número de páginas en el sitio web.
Precaución: Mientras que yo recomiendo cuidadosamente crear y añadir nuevas páginas para incrementar el PageRank total de un sitio para que puedan ser canalizadas a ciertas páginas, existen algunos tipos de páginas que no deberían ser añadidas. Estas son páginas idénticas o muy parecidas y son conocidas como "cookie-cutters" (cortadoras de galletas). Google las considera como spam y pueden activar una alarma que cause que las páginas, y posiblemente el sitio web entero, sea penalizado. Páginas llenas de buen contenido son lo ideal.
¿Que podemos hacer con este PageRank 'global'?
Vamos a mirar algunos ejemplos de cálculos para ver como puede ser manipulado el PageRank de un sitio web , pero antes de eso, necesito apuntar que una página será incluida en Google sólo si una o más páginas de la red la enlaza. De acuerdo con Google. Si una página no está en el índice de Google, ningún enlace desde ella puede ser incluido en los cálculos.
Para los ejemplos, vamos a ignorar este hecho, principalmente porque otros documentos del tipo "PageRank al detalle" ignoran esto en los cálculos, y probablemente sería confuso al comparar documentos. La calculadora opera en dos modos: Simple y Real. En el modo Simple, se asume en los cálculos que todas las páginas estás indexadas en Google, estén enlazadas o no desde otras páginas. En el modo Real, se ignoran las páginas que no están enlazadas. Estos ejemplos muestran los resultados de cálculos en modo Simple.
Consideremos un sitio web con 3 páginas (páginas A, B y C) sin enlaces provenientes del exterior. Asignaremos a cada página un PageRank inicial e 1, aunque no hay ninguna diferencia en empezar en cada página con 1, 0 o 99. Aparte de unas pocas millonésimas de puntos de PageRank, después de muchas iteraciones el resultado final es siempre el mismo. Empezando por 1 requiere menos iteraciones para que el PageRank converja en un resultado adecuado que empezando desde 0 o cualquier otro número. Probablemente usted quiera usar lápiz y papel para seguir los cálculos, también nos puede seguir con la calculadora.
El PageRank máximo del sitio web es la cantidad de PageRank en el sitio web. En este caso, tenemos 3 páginas por lo tanto el máximo es 3.
Por ahora, ninguna de las páginas enlaza con ninguna otra. Si hace el cálculo una vez por cada página, encontrará que cada una acaba con un PageRank de 0.15. No importa cuantas iteraciones haga, cada página se quedará con 0.15 de PageRank. El PageRank total del sitio web = 0.45, cuando podría ser 3. El sitio web está gastando seriamente la mayoría de su PageRank potencial.
Ejemplo1: Empiece de nuevo asignando PR1 a cada página. Enlace la página A a la página B y ejecute los cálculos para cada página. Acabamos con:
Página A = 0.15Página B = 1Página C = 0.15
La página A ha "votado" por la página B y, como resultado, el PageRank de la página B se ha incrementado. Esto está bien para la página B, pero es solo una iteración, no hemos tenido en cuenta la situación "Cogidos 2 a 2". Observemos que les pasa a los números después de varias iteraciones:
Después de 100 iteraciones los números son:Página A = 0.15Página B = 0.2775Página C = 0.15
Sigue pintando bien para la página B pero nada parecido a lo que tenía en un principio. Estos números son mucho más realistas. El PageRank total en el sitio es ahora 0.5775, ligeramente mejor pero sigue siendo una fracción de lo que podría ser.
Nota: Técnicamente, estos resultados particulares son incorrectos a causa del tratamiento especial que da Google a los enlaces "sueltos", pero sirven para demostrar un cálculo simple.
Ejemplo2: Pruebe estos enlaces. Enlace todas las páginas a todas las páginas. Cada página empieza con PR1. Esto produce:
Página A = 1Página B = 1Página C = 1
Ahora que hemos alcanzado el máximo. NO hay que preocuparse por cuantas iteraciones hagamos, cada página acabará siempre con PR1. Los mismos resultados ocurren enlazando en un aro. Ejemplo: A con B, B con C, C con D. Ver esto en la calculadora.
Esto ha demostrado que, con enlaces pobres, es bastante fácil malgastar el PageRank y enlazando de buenas maneras podemos conseguir todo el potencial del sitio web. Pero no queremos que todas las páginas tengan la misma importancia. Queremos que una o más páginas tengan más importancia que otras. El tipo de páginas que podríamos querer que tuvieran más importancia podrían ser páginas como el índice, páginas con principales de alguna sección y páginas que estén optimizadas para algunos términos. Sólo tenemos 3 páginas, por eso, vamos a canalizar el PageRank hacia la página índice, la página A. Servirá para mostrar la idea de la canalización.
Ejemplo3: Pruebe esto. Enlace la página A hacia B y C. También enlace las páginas B y C a A. Empezando todas con PR1, después de 1 iteración los resultados son:
Página A = 1.85Página B = 0.575Página C = 0.575
Y después de 100 iteraciones, los resultados son:
Página A = 1.459459Página B = 0.7702703Página C = 0.7702703
En ambos casos el PageRank total en el sitio web es 3 (el máximo) así que no malgastamos nada. También en ambos casos puede ver que la página A tiene mucha más proporción de PageRank que las otras 2. Esto es porque las páginas B y C están pasando PageRank a A y nada a las otras páginas. Hemos canalizado buena parte del PageRank a donde hemos querido.
Ejemplo 4: Finalmente, guarde los enlaces anteriores y añada un enlace de la página C a la página B. Empiece otra vez con PR1 en cada página. Después de 1 iteración:
Página A = 1.425Página B = 1Página C = 0.575
Comparándolo con los números de la primera iteración en el ejemplo anterior, la página A ha perdido algo de PageRank, la página B ha ganado algo y la página C se ha quedado igual. La página C ahora comparte su "voto2 entre A y B. Previamente A lo recibía todo. Por eso la página A ha perdido y la página B ha ganado. Y después de 100 iteraciones:
Página A = 1.298245Página B = 0.9999999Página C = 0.7017543
Viendo este resultado, la página C ha perdido un poco de PageRank porque ahora comparte su voto entre A y B, en vez de dárselo todo a A, A tiene menos que darle a C en el A --> C link. Por esa razón, añadiendo un enlace extra en una página provoca que esa página pierda PageRank indirectamente si alguna de las páginas a las que enlaza le devuelven el enlace. Si la página que a la que enlaza no devuelve el enlace, entonces no pierde PageRank. Para hacerlo más complicado, si el enlace es devuelto incluso indirectamente (vía una página que enlaza otra página que enlaza a otra página, etc), la página perderá un poco de PageRank. Esto no es muy importante con enlaces internos, pero puede ser un problema cuando enlazamos con páginas fuera del sitio web.
Ejemplo 5: Páginas nuevas.
Añadiendo nuevas páginas a un sitio es una manera importante de incrementar el PageRank total de un sitio web porque cada nueva página añadirá una media de 1 al total. Una vez que las nuevas páginas hayan sido añadidas, su nuevo PageRank puede ser canalizado a páginas importantes. Usaremos la calculadora para demostrar esto.
Añada 3 nuevas páginas al Ejemplo 3 [ver]. Tres nuevas páginas pero no hacen nada por nosotros todavía. El pequeño incremento en el Total, y el nuevo PageRank de las páginas (0.15), no son realistas como podremos comprobar. Así que enlácelas al sitio.
Enlace cada una de las nuevas páginas a la página importante, página A [ver]. Note que el PageRank total ha sido doblado, de 3 (sin las nuevas páginas) a 6. Note también que el PageRank de la página A ha sido prácticamente doblado.
Hay algo incorrecto en este modelo. Las nuevas páginas son huérfanas. No pueden ser indexadas en Google, así que no añadirán ningún PageRank al sitio y no pasarán ningún PageRank a la página A. Cada una necesita ser enlazada desde al menos otra página. Si la página A es la página importante, la mejor página donde poner los links es, sorprendentemente, la página A [ver]. Puede hacer pruebas con los links pero, desde el punto de vista de la página A, no hay mejor sitio donde poner los enlaces.
No es una buena idea para una página enlazar a un gran número de páginas, así que si usted está añadiendo muchas nuevas páginas, reparta los links por otras páginas. Probablemente haya más de una página importante en un sitio web, por ello, normalmente es adecuado repartir los links hacia y desde las nuevas páginas. Puede usar la calculadora para experimentar con los mini-modelos de un sitio para encontrar la combinación de enlaces que produzca los mejores resultados para sus páginas importantes.
Resumen de Ejemplos:
Puede ver que, organizando los enlaces internos, es posible canalizar el PageRank del sitio web hacia páginas seleccionadas. Los enlaces internos pueden ser dispuestos para adaptar el PageRank del sitio web a sus necesidades, pero sólo es útil si Google conoce las páginas, por eso mismo, asegúrese de que Google la encuentra.
Enlaces salientes y entrantes:
Se pueden dar ejemplos de esto pero probablemente es más claro leer sobre ello (debajo) y 'jugar' con ellos en la calculadora.
Preguntas:
Cuando una página tiene muchos enlaces a otra página, se cuentan todos?
Ejemplo, si la página A enlaza una vez con la página B y 3 veces con la página C, la página C recibe 3/4 del PageRank repartible de A?
El concepto de PageRank es que una página vota por una o más páginas. No se dice nada en el documento original de PageRank sobre votar más de una vez a una página. La idea parece ser contraria al concepto de PageRank y seguramente estaría abierta manipulaciones con proporciones irreales de votos. Ejemplo, si un enlace de salida, o un enlace a una página muy poco importante, es necesario, añade un montón de enlaces a la página importante para minimizar el efecto.
Ya que es muy improbable recibir una respuesta definitiva de Google, es razonable asumir que una página puede votar una sola vez por otra página, y que los votos adicionales para la misma página no se cuentan.
Cuando una página enlaza a si misma, se cuenta el enlace?
Una vez más, el concepto es que las páginas votan por otras páginas. No se indica nada en el documento original sobre páginas votándose a si mismas. La idea parece estar en contra del concepto y, también, sería una manera de manipular los resultados. Por esas razones, es razonable asumir que una página no puede votarse a si misma y que esos enlaces no son contados.
Enlaces Colgantes:
"Los enlaces colgantes son simplemente enlaces que apuntan a alguna página que no tiene enlaces salientes. Afectan al modelo porque no está claro donde debe ser distribuido su peso, y hay un gran número de ellas. A menudo estos enlaces colgantes son páginas que no hemos descargado todavía....... Porque los enlaces colgantes no afectan el ranking de ninguna otra página directamente, nosotros simplemente las borramos del sistema hasta que el PageRank de todas las páginas es calculado. Después de que todos los PageRank hayan sido calculados, las páginas pueden ser añadidas otra vez sin afectar significativamente las cosas." Extracto del documento original de PageRank por los fundadores de Google, Sergey Brin y Lawrence Page.
Un enlace colgante es un enlace hacia una página que no tiene enlaces salientes, o un link hacia una página que Google no ha indexado. En ambos casos Google elimina los enlaces justo al empezar los cálculos y los reinstaura justo después de acabar los cálculos. De esa manera, los enlaces colgantes afectan mínimamente al PageRank de otras páginas.
Los resultados mostrados en el Ejemplo1 (diagrama derecho) son incorrectos porque la página B no tiene links salientes, por so, el enlace de la página A hacia la B es colgante y será eliminado de los cálculos. Los resultados de los cálculos mostrarán las tres páginas con 0.15.
Puede que enlazar páginas que no tienen enlaces salientes sin perder PageRank se adapte a la funcionalidad de la página pero sería un malgasto de PageRank potencial. Eche un vistazo a este ejemplo. El potencial del sitio web es 5 porque tiene 5 páginas, pero sin la página E enlazada, el sitio web tiene sólo 4.15.
Enlace la página A a la página E y haga click en Calculate. Note que el total del sitio web ha bajado considerablemente. Pero, como el nuevo enlace es colgante y será eliminado de los cálculos, podemos ignorar el nuevo total y asumir 4.15 como cierto. Este es el efecto funcionalmente útil de los enlaces colgantes. No hay pérdida de PageRank.
Sin embargo, algo de potencial se sigue perdiendo, así que enlace la página E a la página A y haga click en "Calculate". Ahora tenemos el máximo PageRank que es posible con 5 páginas. Nada se malgasta.
Aunque puede ser bueno, funcionalmente hablando, enlazar páginas en el sitio web sin que estas devuelvan el enlace, es malo para el PageRank. Es una pérdida de PageRank innecesaria e injustificada, así que asegúrese siempre de que cada página tiene algún link saliente hacia otra página en el sitio web.
Enlaces entrantes:
Los enlaces entrantes (enlaces hacia el sitio web desde el exterior) son una manera de incrementar el PageRank total de un sitio web. La otra es añadir más páginas. No hay que preocuparse de donde provengan los enlaces. Google reconoce que un webmaster no tiene control sobre sitios web le enlazan, así que los sitios web no son penalizados por enlaces entrantes. Hay una excepción a esta regla pero es rara y no concierne a este artículo. No es algo que un webmaster pueda hacer accidentalmente.
El PageRank de la página que nos enlaza es importante, pero también el número de enlaces salientes de esa página. Por ejemplo, si el enlace hacia su sitio web es el único de una página que tiene un bajo PR2, usted recibirá una inyección de 0.15 + 0.85(2/1) = /1.85 e(n su sito web, mientras que un enlace desde una página con PR8 que contiene 99 enlaces incrementará su PageRank en 0.15+0.85(7/100) = 0.2095. Claramente, el enlace de la página con PR2 es mucho mejor. O es así? Mire aquí para una posible razón de que esto no es cierto.
Una vez que el PageRank es inyectado en su sitio web, los cálculos se rehacen y el PageRank de cada página cambia. Dependiendo de la estructura de enlaces interna, el PageRank de algunas páginas se incrementa y en otras permanece inalterado pero en ninguna se pierde PageRank.
Es beneficioso tener enlaces entrantes a las páginas a las que se les está canalizando PageRank. Una inyección de PageRank a cualquier página será repartida por todo el sitio web a través de enlaces internos. Las páginas importantes recibirán un incremento, pero no tanto como si estuvieran enlazadas directamente. La página que recibe el enlace entrante es la que más ganancia obtiene.
Podemos considerar nuestra web como una pequeña red autónoma de páginas. Cuando hacemos cálculos de PageRank, estamos atendiendo nuestra pequeña red. Si hacemos un enlace a otro sitio, perdemos algo de nuestro PageRank de red, y si recibimos un enlace, nuestro PageRank de red es incrementado. Pero esto no es así. Para el cálculo de PageRank, solo hay una red, cualquier página que Google tenga en su índice. Cualquier iteración del cálculo se hace en la red entera y no en sitios individuales.
La red entera está interconectada, y cada enlace de cada página juega su papel en cada iteración de los cálculos, es imposible para nosotros calcular el efecto de los enlaces entrantes a nuestro sitio web con una precisión realista.
Enlaces salientes:
Los enlaces salientes son el desagüe del PageRank total de un sitio web. Hacen "gotear" el PageRank. Para contrarrestar el efecto drenador, asegúrese de que esos enlaces son recíprocos. Por el PageRank de las páginas de cada extremo de cada link externo, y por el número de enlaces salientes de esas páginas, los enlaces recíprocos pueden hacer ganar o perder PageRank. Necesita tener cuidado cuando escoge donde intercambiar enlaces.
Cuando el PageRank se pierde en un sitio web vía un enlace a otro sitio web, todas las páginas en la estructura de enlaces internos se ven afectadas. (Esto no se muestra siempre después de 1 iteración). La página a la que enlaza hace una diferencia entre las páginas que sufren mayor pérdida. Sin un programa para realizar los cálculos en una estructura de enlaces específica, es muy difícil decidir la página correcta para enlazar, pero generalmente es la página con menos PageRank.
Muchos sitios web necesitas contener algunos enlaces salientes que no tienen nada que ver con PageRank. Desafortunadamente, todos los enlaces salientes normales, pierden PageRank. Pero hay maneras "anormales" de enlazar a otros sitios web que no resulten en pérdidas de PageRank. PageRank tiene pérdidas cuando Google reconoce un enlace a otro sitio. La respuesta es usar enlaces que Google no reconoce o cuenta. En estos se incluyen formularios y enlace contenidos en código javascript.
FormulariosEl atributo 'action' de un formulario no necesita ser una url de un procesador de formularios. Puede apuntar a una página html cualquiera en cualquier otro sitio web. Pruébelo.
Ejemplo:

Click aquí
Para ser realmente elusivo, el atributo action puede estar en algún código javascript en vez de en el tag del formulario, y el código javascript puede ser cargado desde un archivo js guardado en un directorio no permitido para el spider de Google mediante el archivo robots.txt.
JavascriptEjemplo: Click aquí
Al igual que el action de un formulario, es engañoso cargar un código javascript, que contiene las urls de un archivo js separado, y más engañoso todavía si el archivo está guardado en un directorio que está prohibido a googlebot por el archivo robots.txt
Cuanto PageRank necesitamos para incrementar la barra de PageRank de la barra de Google?
Primero, déjeme explicar en más detalle porque los valores mostrados en la barra de Google no son los números reales de PageRank. De acuerdo con la ecuación y con los creadores de Google, la mayoría de páginas en la red tiene una media de PageRank 1.0 por página. Por esa razón, el total de Pagerank en cada web es igual al número de páginas en la web * 1, que equivale a mucho reparto de PageRank por la red.
La barra de Google va desde 1 a 10. (A veces muestran 0, pero no se cree que esa cifra sea resultado de un cálculo de PageRank). Lo que hace Google es dividir el intervalo del PageRank real de la red en 10 partes, cada parte es representada por un valor tal como se muestra en la barra. Así que los valores de la barrar solo muestran parte del intervalo total del PageRank de esa página, y no el PageRank real. Los números en la barra de Google son sólo etiquetas.
Tanto si el intervalo global es dividido entre 10 como si no, es tema de debate. Google no dice nada al respecto. Pero a causa de eso es mucho más difícil mover la barra al final que al principio, mucha gente (incluyéndome) cree que las divisiones están basadas en una escala logarítmica, o algo muy similar, en vez de divisiones equivalentes o una escala lineal.
Asumamos que es logarítmica, de base 10, y cuesta 10 páginas propiamente enlazadas para mover la barra hasta el punto 1. Costaría 100 nuevas páginas moverla hacia otro punto, 1000 nuevas páginas moverla una vez más, 10000 en la próxima, y así sucesivamente. Es por esa razón que cuesta tan poco mover la barra cuando está en niveles inferiores que cuando está en niveles superiores.
En realidad, no es probable que la base sea 10. Mucha gente piensa que es alrededor de 5 o 6, e incluso menos. Aún así, sigue aumentando la dificultad de incrementar la barra a medida de que avanzamos posiciones.
Note que a la par que el número de páginas en la red incrementa, incrementa el total de PageRank en la red, y si incrementa el PageRank total, las posiciones de las divisiones de la escala deben cambiar. Como resultado, muchas páginas perderán un punto en la barra de Google sin razón aparente. Si el PageRank real de la página estaba justo por encima de la división en la escala, la adición de nuevas páginas en la red causará que la división se mueva hacia arriba haciendo que la página quede justo debajo de la división. El índice de Google crece continuamente y reevalúan cada página más o menos una vez al mes. Esto es conocido como "Google dance". Cuando la danza se acaba, algunas páginas habrán perdido un punto en la barra. Un número de nuevas páginas debería ser suficiente para volver a obtener el puesto anterior después del siguiente "Google dance".
El valor de la barra es un buen indicador del PageRank de una página pero solo indica que una página está en un cierto intervalo de la escala global. Una página con PR5 puede estar justo por encima de la división de PR5 y otra página con PR5 puede estar justo debajo de la división de PR6. Prácticamente las separa una división entera.(un punto en la barra)
Consejos:Nombres de dominio y nombres de archivo.
Para un spider, www.domain.com/, domain.com/, www.domain.com/index.html y domain.com/index.html son urls diferentes y, por consiguiente, páginas diferentes.Los navegantes llegan a la página principal del sitio web sea cual sea la url usada, pero los spiders las ven como urls individuales, y cuentan como distintas cuando se trabaja con el PageRank. Es mejor estandarizar la url a usar para la página principal del sitio web. De otra forma, cada url puede dar un resultado distinto en el PageRank, mientras que todo debería ir a la misma url.
Si piensa sobre ello, como puede un spider conocer el nombre del archivo de la página que le devuelve la petición a www.doamin.com/ ? No puede. El nombre del archivo puede ser idnex.html, index.htm, index.php, default.html, etc. El spider no lo sabe. Si usted enlaza hacia index.html desde su sitio web, el spider podría comparar las 2 páginas, pero eso es improbable. Así que hay 2 urls y cada una recibe PageRank de enlaces entrantes. Estandarizando la url de la página principal, aseguramos que el PageRank que recibe no se comparte con urls fantasma.
Ejemplo: Vaya a mi página "http://www.webtaller.com/" - que le parece ese enlace ;). Note que la url en la barra de direcciones del navegador contiene "www". Si tiene la barra de Google instala, verá que la página tiene PR5. Ahora elimine las "www." de la url y cargue la página de nuevo. Esta vez nos da que tiene PR1, y es la misma página. Realmente, el PageRank es para el frameset invisible..
Cuando este artículo fue escrito por primera vez, la url sin www tenía PR4, debido al uso de diferentes versiones de la URL de los enlaces internos. Tuvo un efecto de repartición del PageRank de la página entre 2 páginas (las 2 versiones) y, por consiguiente, entre los 2 sitios web. Esta no es la mejor manera de hacerlo. Desde entonces, he puesto en orden los enlaces internos y conseguí bajar la versión sin www a PR1 para que el PageRank del sitio web se quedara en la versión con www, pero debe haber algún sitio web en alguna parte que me enlaza sin "www." y esa es la causa del PR1.
Imagine la página, www.domain.com/index.html. La página índice contiene enlaces a muchas urls relativas, ejemplo: products.html y details.html. El spider ve esas urls como www.domain.com/productos.html y www.domain.com/details.html. Ahora añadamos una url absoluta para otra página, sólo esta vez vamos a dejarnos la parte de "www." - domain.com/anotherpage.html. Esta página enlaza hacia index.html, así que el spider ve la página de índice (index.html) como domain.com/index.html. Aunque es la misma página de índice que la primera, para el spider, es una página diferente porque está en un dominio distinto. Veamos ahora que pasa. Cada una de las urls relativas en el índice es también distinta ya que pertenece a domain.com/domain. Consecuentemente, la estructura de enlaces está malgastando mucho PageRank potencial del sitio web repartiéndolo entre páginas fantasma.
Añadiendo nuevas páginas:
Hay un posible efecto negativo provocado por añadir nuevas páginas. Coja un sitio perfectamente normal. Tiene algunos enlaces entrantes de otros sitios web y sus páginas tienen algo de PageRank. Entonces una nueva página es añadida al sitio web y es linkada desde una o más páginas existentes. El efecto es que, mientras que el total de PageRank del sitio web es incrementado, una o más de las páginas existentes sufrirá una pérdida de PageRank debido a las ganancias de la nueva página. Hasta cierto punto, mientras más páginas se añadan, mayor es la pérdida de las páginas existentes. En sitios grandes, este efecto probablemente no se note pero, en sitios web pequeños, probablemente sí.
Aún así, aunque añadiendo nuevas páginas se incrementa el PageRank total del sitio web, algunas páginas del sitio web perderán PageRank como resultado. La respuesta es añadir nuevas páginas de forma que las páginas importantes no sufran, o añadir un número suficiente de nuevas páginas para contrarrestar el efecto (que a veces significa añadir una gran cantidad de nuevas páginas), o mejor aún, conseguir más enlaces entrantes.
Miscelánea:
La barra de Google:Si tiene instalada la barra de Google en su navegador, estará acostumbrado a ver el PageRank de cada página al navegar por la red. Pero no todo es lo que parece. Muchas páginas de las que Google muestra el PageRank no han sido indexadas por Google y realmente no tienen ningún PageRank en su propiedad. Lo que ocurre es que una o más páginas en el sitio web han sido indexada y el PageRank ha sido calculado. El número de PageRank para una página que no ha sido indexada es asignado al vuelo, solo para su barra de Google. El PageRank en si no existe.
Es importante conocer esto para evitar intercambiar enlaces con páginas que realmente no tienen PageRank propio. Antes de hacer intercambios, realice una búsqueda de esa página en Google para asegurarse de que está indexada.
Sub-directorios:Hay gente que cree que Google reduce en 1 el PageRank de una página por cada nivel de sub-directorio por debajo del directorio raíz. Ejemplo: si el valor de las páginas en el directorio raíz es generalmente alrededor de 4, entonces las páginas en el siguiente nivel de directorio tendrían alrededor de 3, y así sucesivamente para los siguientes niveles. Otra gente (incluyéndome) no lo acepta del todo. De todas formas, ya que muchos spiders tienden a evitar un nivel profundo de subdirectorios, se considera generalmente beneficioso guardar una estructura de directorios poco profunda (dos o tres niveles por debajo del raíz).
ODP y Yahoo!Se solía pensar que Google otorgaba una bonificación de PageRank a los sitios web listados en los directorios Yahoo! y ODP (a.k.a. DMOZ) , pero la opinión actual es que no. Es verdad que existe una ganancia de PageRank para estos sitios web que están listados en esos directorios, pero la razón de ello se cree, actualmente, que es esta:
Google indexa los directorios igual que cualquier otro sitio y sus páginas tienen un PageRank decente por eso son buenos enlaces entrantes que tener. En el caso de ODP, el directorio de Google es una copia del directorio de ODP. Cada vez que un sitio web es añadido y quitado de ODP, este es añadido y quitado del directorio de Google cuando se actualiza. La entrada en el directorio de Google es también un buen enlace entrante que hace subir el PageRank. También, los datos de ODP se utilizan para las búsquedas en un millar de sitios web. Más enlaces entrantes!
Estar listado en ODP es gratis pero, a causa de que los sitios web son examinados a mano, puede pasar mucho tiempo hasta estar en él. Mientras más rápido se envíe un sitio web, más rápido saldrá ese sitio en el directorio. Para consejos sobre DMOZ, mire este artículo sobre DMOZ.

0 comentarios:

 
lo mejor de la red | Designed by Techtrends | © 2007-2008 All rights reserved