El poder de las redes De las naciones a las redes
« Esbozo para una introducción « Portada » La urgencia de una política lingüística europea »

Martes, 9 de Mayo de 2006

¿Vale de algo Alexa?

El que un grupo de bloggers hayamos decidido compartir servidor y hacer públicas y abiertas nuestras estadísticas permite desmitificar algunos totems de la ideología “rankista”

Alexa fue uno de los primeros sistemas globales de ranking en la web. También de los más citados. Y cómo para algo abrimos las estadísticas, se me ocurrió anoche hacer un sencillo experimento: relacionar las IPs recibidas por cada uno de los blogs con su ranking en Alexa.

Al poner en una tabla los datos, que podéis comprobar vosotros mismos, ya chirriaban, blogs poco leídos y menos actualizados, como Tetsuo tenían una posición muchísimo mejor que otros que recibían muchas más IPs al día:

Alexa y las IPs
Las celdas de primera columna contienen la suma de las IPs únicas diarias recibidas por cada blog entre el 1 de marzo y el día de ayer, la segunda columna su rank en Alexa el día de ayer

Pero claro, al representarlo gráficamente ya saltaba a la vista:

Alexa y las IPs

La correlación es bajísima, por no decir que el resultado es incoherente. Alexa no indica nada. Si cumpliera lo que promete, estimar las relaciones entre audiencias de las webs que indexa, lo mínimo sería pedir, que se viera claramente que al aumentar el número de IPs que leen la página, descenciera la posición en el ranking… pero no es así. En realidad debería poderse, cuando menos, intuir una línea… pero tampoco.

¿Por qué no funciona Alexa? Pues para empezar porque el software que usas -Firefox o Explorer- está relacionado con tus valores y tus valores a su vez orientan tus lecturas. Y claro, Alexa sólo cuenta con datos de usuarios de Explorer. En segundo lugar porque tampoco están geográficamente repartidos de forma representativa -la gran mayoría de usuarios de Alexa están en EEUU-, ni siquiera se reparten entre áreas lingüísticas de un modo interesante. De modo que… ¿a quién representa la muestra de Alexa?

Realmente no lo sé, pero lo que sí que sé es que sea quien sea a quien representa no representa al público hispanoparlante…

Las herramientas del rankismo son tan inanes como la ideología que las alimenta.

Guardado por David de Ugarte en su moleskine
a las 8:07 pm

En otros blogs este post recibió las siguientes referencias (URI de Trackback)

  1. Nuevos profesionales, ideas obsoletas , Internet Marketing Online - Desmarkt

    [...] Que Alexa es un “estadístico”, por llamarlo de alguna forma, del que todos sabemos que no sirve para nada, es una realidad que no voy a comentar por que entiendo, que sobre este tema está todo más que comentado, como en su momento reflejaron Informediario.com o deugarte.com, lo que me da una sensación de que en este país, en el que todos somos tan listos y sabemos tanto de todo, tengamos que recurrir a referencias como “En Alexa estamos…”, “estamos mejorando según el ranking de Alexa…” me da la sensación de que nos toman el pelo. [...]

  2. Desilusionado de Alianzo a tan pocos días | Blog en Serio

    [...] un PageRank incomprensible, un Technorati saboteable, un Alexa cuestionable, y ahora un Alianzo populista,… ¿En qué nos podemos [...]


Comentarios

  1. Carlos Capote el 09/05/06 a las 9:33 pm

    Interesante y revelador…

  2. José-Luis Prieto el 10/05/06 a las 3:23 am

    Bueno es saberlo …y no es un decir

  3. meneame.net el 10/05/06 a las 3:39 am

    David de Ugarte explica por que Alexa no es confiable. “El que un grupo de bloggers hayamos decidido compartir servidor y hacer públicas y abiertas nuestras estadísticas permite desmitificar algunos totems de la ideología “rankista”

  4. BGTA el 10/05/06 a las 4:24 am

    vaya ¿alguna vez escribirás algo que no tengas razón?
    me quedo con la coletilla final
    puedo poner un ejemplo personal?
    mi blog esta rankado en technorati como el Technorati Rank: 247,682
    el ultimo mono de la blogsfera
    mi post sobre lo que paso en el viñarock con ramoncin (moblogeando desde un mobil y luego la tarde siguiente desde un ciber) sale el 4 resultado cuando buscas viñarock y ramoncin en el google
    y sigo siendo el ultimo mono de la nasa
    pero mi post y visión de los hechos (bastante gamberra, lo reconozco) fue leído por mas personas de las que imagine (entre foros, webs de amigos etc)
    no es importante que un blogStar blogge algo, sino simplemente que alguien lo haga.. la propia blogsfera sabrá encontrarlo

  5. Felix el 10/05/06 a las 2:31 pm

    Un par de cosas David, si Alexa no funciona, ¿que funciona entonces? ¿De que sistema nos podemos fiar para saber el peso especifico de nuestra web en internet, y en la comunidad hispana en especial? Y segundo, a pesar de que no funcione, es posible que motores como Google utilicen esas estadísticas o las suyas propias para posicionarte en el buscador. Entonces no deja de ser importante aparecer alto en esos rankings, aunque habrá que ver como conseguirlo si tienen un comportamiento tan absurdo, por lo menos en webs hispanas.

  6. Alvy el 10/05/06 a las 3:27 pm

    Ten en cuenta que Alexa sólo calcula un rank para dominios de segundo nivel. Subdominios como estrella.lamatriz.org y tetsuo.lamatriz.org se agrupan en el principal: lamadriz.org. (En tu tabla se ve que efectivamente el dato de ranking es el mismo para ambos: 77.720).

    Es bastante conocido que para sitios con poca audiencia los datos no son muy fiables, lo dicen ellos mismos, especialmente rank por debajo de 100.000. A partir de 1.000.000 ni siquiera sacan datos ellos mismos.

    Yo diría que puede ser fiable tal vez para comparar sitios similares, de ranks por encima del 50.000 más o menos.

  7. David el 10/05/06 a las 3:29 pm

    Alvy, eso también lo he hecho con clientes y amigos míos y el resultado es similar, te lo puedo asegurar, lo que pasa es que no puedo publicar el resultado porque nadie quiere decir sus ip’s reales.

    De hecho creo que lasindias.com anduvo un tiempo por encima del 50.000… y en aquella época, comparando con PD y otros sitios cuyas tripas podía conocer, tampoco. No way.

    Y por cierto, si sumas las IPz de todos los subdominios de lamatriz.org y lo colocas como un único sitio tampoco sale nada coherente

  8. David el 10/05/06 a las 3:37 pm

    Félix, tranquilo, Google no usa Alexa :D
    Y en realidad, la cuestión creo yo es que el “rankismo” no tiene ningún sentido. Si lo que te preocupa es que una noticia tuya se difunda, seguro que se difunde independientemente de los pretendidos rankings… aunque funcionaran.

    Ni siquiera es función del número de enlaces que te hayan dado. El “centro” no emite nada, los cambios, las noticias y mensajes que estallan y traen cambio, vienen de la periferia.

    Acuérdate de lo que te pasó a ti con el Koala y el “opá voy a hacé un corrá”. Creo que tu fuiste el padre del gusano y el que difundió la historia, cuando recibí tu email aún no había según technorati nadie que lo hubiera linkado. Y mira, ya lo canta hasta ZP en el guiñol
    :D

  9. Alvy el 10/05/06 a las 5:01 pm

    #7 por si quieres hacer un estudio más amplio aquí hay una lista con cientos de weblogs con estadísticas públicas

    http://wiki.microsiervos.com/Weblogs_con_estad%C3%ADsticas_p%C3%BAblicas

    por desgracia sólo podrías usar los que tienen dominio propio, como te decía los de subdominios de tercer nivel Alexa no los calcula. Tampoco hay muchos por encima del #100.000 que son los que tienen datos más fiables (hace poco han dejado de mostrar el rearch y rank diarios para sitios por debajo de #100.000 imagino que por eso).

    En general creo que Alexa no es desde luego una ‘ciencia exacta’, pero sí que sirve como orientación de tendencias respecto a los sitios con más audiencia, siempre que compares iguales-con-iguales (ej. blogs con blogs o periódicos con periódicos o servicios-tipo-xyz con servicios-tipo-xyz, y siempre dentro del mismo país y tipo de “visitantes”). Pero por desgracia no sirve para sitios pequeños porque las desviaciones por el efecto “panelistas” son enormes.

  10. David el 10/05/06 a las 5:10 pm

    Osea, que según tú, Alexa no valdría para la blogsfera pero si para grandes sitios comerciales…

    Si el problema está en la muestra, en los usuarios que llevan la barrita de Alexa y envían la info sobre su navegación, debería ser tan poco fiable para grandes como para pequeños, Alvy.

  11. Felix el 10/05/06 a las 5:33 pm

    Si, ya se que Alexa pertenece a Amazon, si no recuerdo mal, y Google no lo utiliza. En mi caso y como empresa, mas que los rankings me interesa el posicionamiento, aunque uno y otro van ligados, claro. Al final lo mas fiable en una web son los contenidos. Y creo que esto esta siendo tenido en cuenta cada vez mas por los motores. Y la frecuencia con que se actualizan los mismos. El resto, links, rankings y otros indicadores no son mas que otros factores a tener en cuenta. También leí que un criterio que se está teniendo en cuenta en los rankings y posicionamientos es la antiguedad del dominio, cosa que no acabo de entender, bueno, algo si.

    El Koala ha sido un ejemplo fantástico del marketing viral, del que ya hace muchos años me hablaste. Ahora ya es presente y futuro.

  12. Felix el 10/05/06 a las 5:43 pm

    Sobre Google, y creo que esto entra dentro de este hilo, mirad este articulo sobre la nueva orientación del tio Bill y sus secuaces para crear alianzas y competir con Google. Han conseguido que Windows Live sea el motor del sistema A9.com de búsquedas en Amazon. Y eso es solo el principio.

    http://www.sitepronews.com/archives/2006/may/8.html

  13. Alvy el 10/05/06 a las 8:43 pm

    #10 – No es exactamente eso. Digo que Alexa muestra datos significativos y cercanos a la realidad para sitios con mucha audiencia. Y que en los sitios con poca audiencia los datos que proporciona no son tan significativos. Comercial o no-comercial es indiferente. Por poner un ejemplo para el ranking de Wikipedia o CraigsList por decir algo (no-comerciales) puede ser fiable. Para blogs como Slashdot o Boing Boing que sí tienen gran audiencia también puede ser fiable al compararlo con sitios similares en inglés. Pero para los pequeños blogs o webs en general por desgracia Alexa no es tan fiable. Son sin duda mejores otros sistemas como los contadores de visitas típicos, siempre que se usen bien.

    También sucede que tu estudio se limita a sólo ocho webs, un número realmente reducido. Tal vez con una muestra más amplia podrías obtener otros datos. En la lista que te he mencionado hay cientos por si a alguien le interesa ampliarlo.

  14. David el 10/05/06 a las 9:02 pm

    Según lo que dices entonces en España sólo valdría para algunos periódicos pero no valdría para ningún blog porque ninguno se acerca a las 200.000 ips día q declara Boing Boing, no?

    Por otro lado, los sistemas de estadísticas sólo son realmente fiables si

    1. Los programas de análisis son realmente fiables o cuando menos el mismo en todos los sitios analizados
    2. Los sitios están en el mismo servidor o en servidores iguales

    con lo que tendríamos bastante problema con la lista para que fuera realmente fiable, no crees?

  15. Alvy el 10/05/06 a las 9:25 pm

    Cierto, incluso si comparas las estadísticas reales de Microsiervos (casi 500.000 usuarios únicos o IPs únicas como tú dices) con los datos de Alexa verás grandes vaivenes inexplicables – y eso que rankea en torno al puesto 15.000-25.000 más o menos y podría decirse que por audiencia entre blogs es de los más visitados (1,5 millones de páginas servidas al mes aprox., 800.000 visitas)

    Boing Boing rankea hacia #1.500-2.000 con más de 20 millones de páginas, 200.000 únicos diarios… y eso puede ser comparable con sitios similares en inglés, sean periódicos u otro tipo de sites.

    Algunos sitios grandes españoles como periódicos y portales rankean por encima del #1.000 y eso yo diría que es bastante fiable (siempre comparando “iguales”). De todos modos no debería compararse entre países o idiomas (ej. El País vs Boing Boing por el tema de que el uso de la barra varía mucho por países/idomas.)

    Sobre tus dos apuntes:

    1. Los programas de análisis son más o menos fiables dependiendo de cuáles sean, y cómo se usen, pero en comparaciones de dos sites con mismos sistemas al menos el sesgo que tengan será parecido (ej. comparar los “statcounter” de dos blogs si ambos han puesto bien el código en todas las páginas).

    2. Los servidores o dónde estén yo diría que es indiferente, eso en principio no tiene nada que ver con la audiencia, estadísticas o ranking Alexa.

  16. David el 10/05/06 a las 9:29 pm

    Alvy, no se si he entendido bien, ¿dices que tenéis 500.000 ip’s/dia en Microsiervos? ¿Casi tres veces lo que Boing Boing declara?

  17. Alvy el 10/05/06 a las 9:31 pm

    No lo dije bien: son 500.000 al mes (según Google Analytics que es de lo más fiable para eso).

  18. Alvy el 10/05/06 a las 9:38 pm

    las stats publicas puedes verlas completas en http://www.microsiervos.com/stats/

  19. David el 10/05/06 a las 9:44 pm

    32,320 ip’s día más o menos es con todo una pasada! Felicidades!!!

    Por cierto la referencia a que el servidor fuera el mismo eran porque yo estaba pensando en un software residente, como Urchin, que es el que usamos nosotros y en el que está basado Google Analytics. Estos programas residentes son más fiables por motivos obvios y generalmente, también mucho más ratas que los basados en scripts o gráficos como nedtstad, etc.

  20. Alvy el 10/05/06 a las 10:04 pm

    Gracias …

    Ese dato de 32.000 son en realidad “visitas” (no IPs ni visitantes) (statcounter tiene una nomenclatura un tanto extraña, y “unique visitors” se refiere a lo que tradicionalmente en castellano son “visitas”). Y además no están desdobladas, es decir 30.000 hoy y 32.000 mañana no suman 62.000 sino tal vez 40.000 porque muchos repiten… (eso statcounter no lo calcula)… Ese dato desdoblado que es considerado generalmente el mejor, es un dato que sí consiguen Urchin o Google Analytics, ciertamente.

    Boing Boing debe tener unos x10 ó x15 veces más visitas, páginas vistas etc. que Microsiervos, por si te sirve para comparar.

    Lo que he visto de Urchin es bastante fiable, mucho más que Webalizer por ejemplo que infla demasiado a nivel páginas sobre todo.

    En cualquier caso es mejor comparar iguales a iguales, es decir urchin-con-urchin o nedstat-con-nedstat cuando es posible, para evitar comparaciones erróneas. En ese sentido Alexa es igual para todos, siempre que compares sitios similares y como decía en los mismos países e idiomas.

    A la larga alguno tipo Google Analytics puede que sea el más fiable de cara a comparaciones, los datos que ofrece son muy buenos y fiables por lo que hemos probado hasta ahora.

  21. Jose del Moral el 10/05/06 a las 10:48 pm

    Como bien ha dicho Alvy, Alexa sólo es fiable a partir del 50.000 (de ese para abajo). Y también hay que tomar en cuenta que Alexa sobrepondera a los medios de comunicación ya que es habitual que los periodistas tengan (por obligación de su empresa) el software en sus ordenadores. Por eso, El País, El Mundo y otros tienen muy buen ranking en Alexa.

  22. David el 10/05/06 a las 11:06 pm

    Alvy, sinceramente creo que proporcionalmente a su audiencia potencial microsiervos tiene más lectores dadas esas cifras que boing boing

    Piensa que no sólo el inglés tiene más internautas nativos, sino que cuenta con millones de consumidores no potencialmente emisores. Algo que el español ni de lejos alcanza. Todo esto tiene que ver precisamente con todo el debate que estamos manteniendo sobre la estructura de poder lingüístico en la blogsfera

    Mañana prometo un traducir un artículo de Pere Quintana de hoy brillante sobre el tema

  23. Alvy el 11/05/06 a las 12:01 am

    Proporcionalmente podría ser, en términos absolutos ya te digo que es x20 veces más pequeño, todo depende de qué “poblaciones” consideres para esos cálculos proporcionales, si hispanohablantes o sólo españoles, si estadounidenses o hablantes de inglés, etc. etc. Eso desde luego sería es una forma innovadora de medirlo.

    Otra forma es como hace Nielsen Netratings que es con Reach por país (% de internautas a los que llegas, en cada país).

  24. David el 11/05/06 a las 12:24 am

    Hombre, si lo consideras en términos de lectores potenciales, es decir de aquellos que pueden leer en el idioma del blog y tienen conexión a internet, yo creo que la constante es mayor que veinte. Vamos, que os leen un porcentaje mayor de vuestra audiencia potencial que a boing boing.

    Contar en cada idioma tan sólo los hablantes nativos y no contar tampoco cuantos de ellos tienen acceso a la red me parecería una distorsión no justificable.

    En cualquier caso, aunque no llevara razón y os sobreevaluara: felicidades! Si os lee tanta gente es porque hacéis contenidos que gustan a mucha gente con identidades diferentes, en lugares diferentes… y eso es estupendo y digno de felicitación y aprecio. Eso es lo importante, la comunicación que habéis abierto con un montón de personas distintas y no la comparativa con boing boing. Si algún día queréis sacar algo, transmitir algo que es especialmente relevante para la gente del perfil de vuestra audiencia es seguro que les va a llegar, independientemente de lo que sobre eso opinara hipotéticamente boing boing.

    Por eso, dicho sea de paso, los rankings me parecen un juego tonto que nos aleja de lo que de verdad importa en la blogsfera.

  25. Julio Alonso el 11/05/06 a las 3:29 pm

    David, aporto yo también datos de nuestros blogs y parece que Alvy va a estar en lo cierto, para sitios con ranking por encima de 50.000 sí que vale.

    Alexa, ni tanto ni tan poco

  26. Alvy el 11/05/06 a las 4:16 pm

    Julio Alonso ha ampliado el estudio que has hecho con datos de más blog y con más audiencia y ha encontrado cierta relación, siempre con las cautelas habituales respecto a la fiabilida de Alexa. Creo que está muy bien:

    Alexa, ni tanto ni tan poco
    http://www.merodeando.com/blog/archivos/2006/05/11-alexa-ni-tanto-ni-tan-poco.php

  27. nico el 12/05/06 a las 4:24 pm

    Hola yo quería acotar a la charla que Alexa crea las estadísticas de acceso a sitios en base a los navegadores que tengan instalado la barra de Alexa. Cuando alguien entra en un sitio y tiene la barra de Alexa instalada, envía esos datos a los servidores y luego con esos datos se crean las estadísticas.

    Por supuesto que basarse en los datos de Alexa para estimar las visita de una web, no sirve para nada ya que un bajo porcentaje de usuarios tiene esa barra instalada y además me animo a decir que la mayoría son usuarios en ingles.

    Se podría usar los datos de Alexa para tener una estimación de lo popular de cada web, pero no valerse de esos datos fielmente. Ya que se podría crear un software que engañe a los servidores de Alexa. Y que le envié información de accesos falsos….

  28. Lo mejorcito por países, según Alianzo y Blogalaxia | Blog en Serio el 12/02/08 a las 7:33 am

    [...] críticas de la poca fiabilidad de los sistemas de medición: Alianzo, Blogalaxia, Technorati y Alexa. Sin embargo, es lo que tenemos y de lo que podemos echar mano. A sabiendas de [...]

No espero notas en relación con este post. Los comentarios se cierran automáticamente a los tres días de la publicación del post.

Tout ce qui n'est point nouveau dans un temps d'innovation est pernicieux ~ Saint Just

« Esbozo para una introducción « Portada » La urgencia de una política lingüística europea »
Dominio público
Salvo indicación o advertencia en contrario, el autor de todas las entradas de este blog es David de Ugarte, quien las escribe y hace devolución expresa de ellas al Dominio Público

David de Ugarte: biografía y contacto

Básica, completa, podcast, videocast, miniposts [+feeds]
2008 BBVA blogsfera brasil ciberactivismo ciberpunk Devolución el poder de las redes fabbing feevy google lasindias libro electrónico nacionalismo neovenecianismo planta29 plurarquía redes distribuidas RMD sionismo digital web 2.0 web 2.1 wordpress
Creandote un usuario en un servidor OpenID podrás enviar comentarios y miniposts logueándote en el blog con tu OpenID
Puedes ver los 23 posts más actualizados de mi feevy un poco más abajo o jugar con el portal feevy interactivo. Si te gusta puedes personalizar esta plantilla y convertir tu propio feevy en un portal interactivo de todas tus fuentes.
Puedes ver las estadísticas de este blog -entre otros- en el servidor Urchin de Exploradores Electrónicos conectándote con el usuario abierto y la contraseña abierto123.

RMD es una alternativa distribuida y bloguera al microposting centralizado. Logueáte y envía desde este blog tus miniposts a la red usando tu identidad OpenID
Si quieres superar tu dependencia de Flickr, YouTube y otros servicios, consulta mi caja de herramientas