dijous, 19 de gener del 2012

Presentació sobre Indicadors web en el Programa de Postgrau en Gestió Museística organitzat per l'IDEC i el Museu Picasso.

Dimarts al vespre vaig fer una presentació sobre indicadors web, (i, de fet, sobre indicadors en general), en el Programa de Postgrau en Gestió Museística organitzat conjuntament per l'IDEC-UPF i el Museu Picasso.

Tot seguit us apunto unes breus anotacions del que vaig explicar.

Els tres principals objectius que em vaig imposar per aquesta sessió van ser:
  • Conscienciar de la importància de les estadístiques.
  • Definir què és la analítica web i quins són els seus conceptes essencials.
  • Proporcionar uns consells bàsics per poder tenir unes estadístiques web de qualitat.
Si algú vol seguir el debat, ho pot fer en aquest blog.



Breu comentari per cada diapositiva:
  • #1: Presentació.
  • #2: "La mort d'un home és una tragèdia. La mort de milions és una estadística", atribuït a Iósif Stalin (tot i que alguns diuen que és una cita de Kurt Tucholsky).
  • #3: Objectius d'aquesta sessió (indicats anteriorment).
  • #4: Índex de la sessió.

Primera part: Conscienciació de la importància de les estadístiques.

  • #5: A principis de juny de 2011 l’ONU va decidir que l’accés a Internet és un dret humà. Actualment no és analfabet el que no sap llegir ni escriure... És analfabet qui no sap llegir, escriure i no tingui connexió a Internet.
  • #6: "Internet nos lleva de la era industrial a la digital". Entrevista a Don Tappscott a La Vanguardia. Estem canviant de tipus de Societat, amb tot el que això comporta, especialment respecte als canvis en les "regles del joc".
  • #7: Un dels principals canvis (i el que ens ocupa aquí) és que ara tot és mesurable amb detall, no cal fer aproximacions, podem saber al detall les estadístiques de (pràcticament) qualsevol servei digital.
  • #8: Què és el que ha canviat més? L'usuari ha passat de ser només passiu a poder ser totalment actiu. Això ha provocat que hi hagi molt més contingut a la Xarxa, també ha provocat que aquests nous usuaris creadors de contingut tinguin curiositat estadística pel seu contingut, tot plegat ha comportat una socialització de l'ús dels sistemes estadístics, (semblant a la socialització que es va produir en l'àmbit geogràfic amb la irrupció de Google Maps).
  • #9: A més, aquest nou contingut és mesurable, aquesta revolució, aquesta nova societat és mesurable com es pot veure en aquest exemple.
  • #10: De fet, podríem dir que el sector dels indicadors (especialment en l'àmbit digital) està vivint un bon moment, cada cop és més habitual que se'n parli, ha deixat de ser un tema només per experts. Iniciatives com les infografies ajuden a trencar aquest aïllament.
  • #11: Les diferències, en quant a estadístiques d'ús, són molt diferents en funció del mitjà de comunicació. En el cas de la TV utilitzem enquestes per panel (per tant, no deixa de ser una aproximació, això sí, estadisticament 100% vàlid); el cas de la ràdio és molt semblant. El cas de la prensa escrita està auditada per un ens independent (com ara la OJD) però bàsicament l'únic que controla és la difusió del mitjà escrit, però no quin ús se'n fa. El cas del canal web és molt diferent, podem saber exactament l'ús que se'n fa amb un nivell de detall impensable per a la resta de canals de comunicació i amb un cost francament molt baix.
  • #12: A més, com darrerament va dir un bon amic (Jorge Campanillas), estem vivint en la Societat de la Dada, tenim dades de tot, per tot arreu i a tota hora. Això fa que sigui encara més indispensable una bona gestió de les estadístiques que ens permeti extraure conclusions i reduir la incertesa derivada de l'ingent volum de dades disponibles.
  • #13: Un bon exemple d'aquest BigData el provoca les iniciatives anomenades SmartCity que, entre d'altres, provocarà tenir sensors per tota la ciutat. Això donarà grans volums de dades en temps real que caldrà saber extraure'n el valor. Aquest és un dels principals valors de la estadística: extraure valor de les dades.
  • #14: Un altre dels principals valors dels indicadors és permetre calcular el retorn de la inversió. Dit d'una altra manera, si un servei/producte no és mesurable no podrem saber mai si la inversió efectuada ha resultat exitosa o no.
  • #15: Fins i tot una bona gestió estadística ens pot ajudar a predir el futur, (com és el cas del web de Google que prediu les epidèmies de grip en funció de les estadistiques relacionades amb les cerques que serveixen).

Segona part: Què és la analítica web i quins són els seus conceptes essencials.

  • #16: Es defineix l'Analítica Web com: "Estudi de l'ús que es fa d'un web a partir de les dades resultants de la navegació que han realitzat els seus usuaris".
  • #17: Com funciona?.
    • Cada vegada que realitzem una petició a un lloc web, aquesta arriba al servidor web que la processa retornant la pàgina (o el que sigui) a l'usuari.
    • A més, per cada petició es guarden traces en uns fitxers anomenats de log. A partir d'aquesta informació es generen les estadístiques web.
  • #18: Exemple d'entrades d'un fitxer de log.
  • #19: Encara que l'usuari només posi una URL al seu navegador, aquest usualment realitza diverses peticions web (hits):
    • 1 petició per la URL que li ha sol·licitat l'usuari.
    • Quan el servidor web retorna la pàgina sol·licitada, aquesta probablement tindrà altres elements web (sovint imatges però no només això) que la complementen.
    • Per a cada un d'aquests recursos web, el navegador - i de forma totalment transparent a l'usuari - realitzarà noves peticions al servidor web.
    • I així fins que no quedi cap recurs web per demanar.
  • #20: Es defineix una visita com aquella successió de peticions d'un mateix usuari que entre una petició i una altra no passen més de 30 minuts, (aquesta quantitat és un estàndard de facto). És complicat de definir però és un concepte fàcil d'entendre.
  • #21: Des d'un punt de vista lògic, tots sabem què és una pàgina. Però no és tant fàcil definir-la formalment: És una petició al servidor web que retorna dades codificades en llenguatge HTML? En aquest cas tenim 1 visita de 3 pàgines, (la darrera pàgina ja no és del nostre site) [En aquests exemples he suposat que el nostre site és el del Museu Picasso]. Per tant, es dedueix que una visita té com a mínim una pàgina, dit d'una altra manera, el volum de pàgines servides ha de ser igual o superior al volum de visites rebudes.
  • #22: Un visitant únic és aquell que realitza les visites, és el concepte més proper a les persones, per això és un dels indicadors més utilitzats. ¿Però, com diferenciem un visitant d'un altre?, Com sé que una petició és de l'usuari A i no del B? Gràcies al que es coneix com a tracking d'usuaris, és a dir, discernir cada petició de quin usuari és. Habitualment no és fàcil de calcular, especialment si el lloc web no té activades les cookies, per això s'acostuma a fer aproximacions.
  • #23: La duració d'una visita és el temps (en segons) que hi ha entre la primera petició d'una pàgina i l'última (dins de la mateixa visita). També podem saber el temps que destinen els usuaris a cada pàgina (sempre que després hi hagi una altra petició). Per tant, no sabrem mai el temps que està un usuari a la darrera pàgina d'una visita. Això és així degur a com està creat el protocol HTTP.
  • #24: Un referrer és aquell lloc que ha proporcionat visitants (mitjançant el clic a un enllaç) al meu lloc. Google és un dels principals referrers que existeixen actualment.
  • #25: Gràcies als referrers podem saber quantes visites al nostre lloc web provenen de cercadors. A més, podem saber quines paraules estaven cercant quan han arribat a nosaltres.
  • #26: Paths: Podem saber quins són els “camins” del nostre lloc web amb més demanda.
  • #27: Gràcies al penúltim camp dels fitxers de log (l'anomenat UserAgent) podem saber quin navegador està utilitzant l'usuari i, a més, en quina plataforma. Actualment això s'utilitza també per diferenciar (tot i que no és fiable al 100%) si ens estan visitant des d'un dispositiu mòbil o no.
  • #28: L'Analítica Web també ens proporciona estadístiques d'errors (detectats). Les estadístiques més interessants en aquest sentit són els errors de pàgina no trobada (el famós codi 404), són errors produïts per enllaços trencats.
    No només és capaç de dir-nos els enllaços trencats sinó que a més ens indica quina pàgina té l'enllaç trencat (sigui del nostre lloc web o no) gràcies a la informació proporcionada pel camp referrer.
  • #29: També podem saber l'origen geogràfic de les visites. No obstant cal tenir en compte que és una dada no fiable al 100%, especialment quan es dóna a nivell de ciutat.
  • #30: Tota la informació necessària per generar aquestes estadístiques (amb tota la combinatòria possible, incloent la informació de dia i hora) s'obtè del fitxer de log.
  • #31: L'ús d'estadístiques basats en fitxers de log té una clara limitació: només es poden obtenir indicadors dels 10 camps estàndards que té un log, res més. Per exemple, no podem crear cap indicador que ens doni xifres de visites al nostre web en funció del sexe del visitant.
  • #32: Hi ha un altre sistema per fer estadístiques web: el sistema de tags (marcatge).
    • Cada vegada que realitzem una petició a un lloc web, aquesta arriba al servidor web que processa la petició retornant la pàgina (o el que sigui) a l'usuari.
    • A més, quan la pàgina web arriba al navegador aquest es dóna compte que ha de realitzar una petició addicional (l'anomenat "marcatge" o tag).
    • Aquest petició del tag va a parar a un altre servidor (de tags) que guarda la informació estadística en un altre fitxer de log, (però aquest no està limitat a 10 camps, és a dir, es poden afegir nous camps en funció de les necessitats estadístiques del teu lloc web, per exemple, es poden afegir dades de negoci del teu web).
    • A partir d'aquesta informació es generen les estadístiques web.
  • #33: Un altre sistema és el de panel, d'empreses com Nielsen.
    • A partir de mètodes estadístics, i seleccionant només una petita part dels internautes, s'infereixen les estadístiques per a tot l'univers del meu lloc web.
    • El problema és saber definir quin és l'univers del meu lloc web, no és tant fàcil saber-ho en l'actual Societat Digital on els teus visitants potencialment poden ser de qualsevol lloc del món.
    • És un sistema car, però que permet comparar-nos amb d'altres webs similars al nostre.
  • #34: Un altre sistema és per enquesta (a l'estil tradicional d'enquestes i després inferir - mitjançant mètodes estadístics - les estadístiques de tot el lloc web). És un sistema car i per moments puntuals (encara que es recomana que siguin repetits cada cert temps per poder contrastar al llarg del temps).
  • #35: Actualment en el mercat hi ha un ampli ventall d'eines d'analítica web. Aquestes en són només uns exemples.
  • #36: Com hem d'interpretar les xifres?
  • #37: Les dades sense contextualitzar-les ni contrastar-les amb períodes anteriors no serveixen de res.

Tercera part: Consells bàsics per poder tenir unes estadístiques web de qualitat.

  • #38: Coneix sempre com es generen (tècnicament) els indicadors web.
    Cal dominar-ho per entendre el perquè dels resultats obtinguts i deduir com millorar-los.
    Per exemple cal conèixer bé es dos principals sistemes de generació de estadítiques web: per logs vs. per tags. Els pros d'un sistema són les contres de l'altre.
    Sistema basat en fitxers de log:
    • No requereix la modificació de les pàgines.
    • No es genera més trànsit de l'estrictament necessari.
    • Permet la generació de dades velles (sempre que es disposi dels fitxers de log).
    Sistema basat en etiquetes, (tags):
    • Podem tenir estadístiques més riques i adaptables a cada cas.
    • Permet tenir el web hostatjat en remot, no necessàriament cal que estigui en el teu CPD.
    • El càlcul de les estadístiques pot ser continu (i més lleuger).
  • #39: Coneix la varietat d'indicadors disponibles.
    Visita: L'indicador més subjectiu... però segueix sent un dels més utilitzats. Però, quan realment acaba una visita?
    Visitant (únic): S'utilitza per ser l'indicador més semblant al nombre de persones diferents que consulten la web. Però, com identifiquem a un visitant únic?
    Sol·licitud de pàgina: S'utilitza més a nivell intern. No s'hauria d'utilitzar aquest indicador per a comparar webs degut a que no està clara la definició d'una pàgina.
    Petició (hit): És l'únic indicador 100% objectiu. És un indicador molt tècnic que bàsicament s'utilitza per gestionar la càrrega de servei dels servidors web.
    Referrer: On estava abans el nostre visitant?
    Indicadors d'errors: De servidor ... de client ...
    Durada de les visites: No és el mateix la mitjana aritmètica que la mediana (més utilitzada en l'àmbit de les estadístiques web que no pas la mitjana).
    Temps mitjà de resposta: Millor diferenciar per entorns.
    Disponibilitat del servei: En percentatge respecte al temps total (utilitzat per veure si es compleixen els acords de nivell de servei (SLA) pactats amb el nostre proveïdor).
    I tot això des del punt de vista de tot el web, però també a nivell de seccions del web.
    A més, hi ha molts més indicadors...
  • #40: Sempre compara amb períodes anteriors. L'important són les tendències, no les xifres absolutes.
  • #41: Si cal, desgrana fins assolir el detall desitjat/requerit.
  • #42: Explica els motius que justifiquen les dades obtingudes.
  • #43: Complementa les dades estadístiques internes amb dades d'origen extern. No només et servirà de complement sinó que, a més, podràs contrastar el teu web amb el de la teva competència. Una bona font de dades estadístiques externa és Alexa, n'hi ha més: Compete, HitWise, ComScore, Google Trends, etc.
  • #44: Innova constantment el catàleg de serveis web analytics. La tecnologia web no para d'evolucionar, per tant, has d'evolucionar també els indicadors que registren l'activitat del web. En aquest punt cal tenir en compte tot el món 2.0 que, a dia d'avui, encara no hi ha cap producte que resolgui, de forma íntegra i amb un mínim de qualitat, les principals necessitats d'indicadors 2.0. Cal que el sector maduri una mica més...
  • #45: De fet, hi ha una important amalgama de serveis 2.0 que dificulta molt saber en quins indicadors ens hem de centrar i, després, com generar-los. Hi ha una gran hetereogeneïtat.
  • #46: És molt important fer contínuament pedagogia dels indicadors web en tots els implicats.
    Les estadístiques web són una de les tasques que generalment sempre se li dedica menys esforços, està poc valorada... però és la millor manera (sovint la única) de saber el retorn de la inversió que s'està fent al site.
    Convé explicar bé els 'quatre conceptes' bàsics dels indicadors web per estalviar-se problemes i malentesos.
    No és un tema tècnic, és un tema de negoci, de saber el retorn de la inversió, de saber si s'ha invertit bé. L'analítica web proporciona dades molt importants per a la Direcció, conseqüentment convé explicar bé els conceptes més importants.
    Aspectes a destacar:
    • En aquesta pedagogia deixa clar que les estadístiques web es generen a poc a poc (diàriament) i sempre cap endavant, mai enrere.
    • Avança't als esdeveniments, sigues proactiu, crear noves estadístiques, modifica les ja existents a partir de les notícies, informació, que disposis del site.
    • 'Cuina' els resultats i proporcionals 'premasticats' als dirigents perquè aquests els puguin 'digerir' més ràpidament. No donis números, dóna respostes. Tal com diu Gemma Muñoz: "Si sólo reportamos datos somo parte del problema, si reportamos conocimiento somos parte de la solución".
    • Elimina informació massa tècnica i afegeix prosa.
    • Redacta informes amb periodicitat.
    • Fixa't més en les tendències i poc (molt poc) en els valors absoluts.
  • #47: Integra l'analítica web amb altres indicadors de l'organització.
    No té sentit que les dades analítiques estiguin aïllades, tot té una explicació o una dada que el complementa, i això no sempre està "controlat" sota el paraigua de l'analítica web.
    Per exemple, és convenient integrar amb altres tecnologies com els tests d'usuaris, o amb el SEO, o amb el sistema de reputació social, etcètera.
  • #48: Un exemple de procés a integrar amb l'analítica web és l'escolta activa.
    L'escolta activa (a Internet) són els processos d'anàlisi de la informació relacionada amb els nostres interessos que es produeixen a la Xarxa.
    Aquesta informació pot ser generada pels nostres clients, pels mitjans de comunicació, per líders d'opinió, per experts, per la competència, etc.
    Es tracta de transformar el soroll en valor.
  • #49: Un altre exemple són els processos de reputació social, influència social, (aquest és un exemple centrat d'una persona però també pot ser a nivell corporatiu).
  • #50: Es poden treure mil conclusions diferents de les mateixes dades.
    Pel que és important saber per a què es volen les dades i, en funció d'això, ressaltarem una dada o un altre.
    No es tracta de mentir, es tracta simplement de reforçar un missatge respecte d'un altre.
    Aspectes a tenir en compte:
    • L'estadística és una ciència 'poc exacta'.
    • Es poden llegir les mateixes dades de diferent manera per realçar (o dissimular) determinats aspectes.
    • Tingues sempre en compte quina política està aplicant l'organització, i, especialment, parla amb els teus superiors per deixar clar com es volen 'vestir' les xifres.
    • Mai s'ha de mentir, es tracta 'simplement' de llegir adequadament els resultats, jugar amb els períodes de temps, les variables, afegir (o no) comparacions amb altres anys, etc.
  • #51: I sempre amb sentit comú i amb humor! :)

  • #52: Conclusions de la sessió:
    • Conscienciar de la importància de les estadístiques.
    • Definir què és l'analítica web i quins són els seus conceptes essencials.
    • Proporcionar uns consells bàsics per poder tenir unes estadístiques web de qualitat.
  • #53: Final de la presentació.


Enllaços relacionats: