Verkkotilastoinnissa ”haku” on virheellinen suomennos termille ”request”

Kirjasto-kaapelille juuri kirjoittamaani:

Verkkotilastoinnissa ”haku” on virheellinen suomennos termille ”request”

mace, 4. tammikuuta 2012 14:50

Vuotuinen tilastointirumba alkaa olla käsillä ja haluaisin kiinnittää huomiota erääseen verkkopalvelujemme tilastointiin liittyvään asiaan. Tiedän että ainakin joissain kirjastoissa verkkopalvelujen käyttöä tilastoidessa termi englannin kielinen sana request suomennetaan ”hauiksi”. Tämä on klassinen sudenkuoppa verkkotilastoinnissa.

Esimerkiksi PallasPro -Intron tilastointityökalussa cmnd=getcommand → cmnd=getstat kerrotaan käyttömääristä kahdella luvulla: Requests ja Sessions. Tiedän että monissa kirjastoissa täältä poimitaan tuo ”request” -tieto raportointia varten.

Requestin suomentaminen hauksi vääristää kuvaa kirjaston käytöstä pahasti. Nämä luvut ovat suuruusluokan verran liian korkeita. Mikäli tätä tietoa käytetään esim. päätöksentekoon ja toiminnan ohjaamiseen tai raportoidaan tilaajalle (esim. kunta tai kunnan kulttuuritoimi), tällä voi olla isohkoja vaikutuksia esim. rahoitukseen.

Olen gallupinomaisesti kysellyt parilta- kolmeltakymmeneltä kollegalta ja maallikolta että mitä heidän mielestään ”haku” tarkoittaa verkkokirjaston yhteydessä… eli “mikä sinun mielestästi on yksi haku?” Käytännössä kaikki ovat kuvailleet että heidän mielestään ”haku” muodostuu kun ihminen kirjoittaa jonkinlaisen hakulausekkeen ja painaa verkkokirjaston Hae -nappia. Mielestäni tämä on erittäin järkeenkäypää ja epäilen että olemme miltei kaikki samaa mieltä että juuri tätä tarkoitetaan kun puhutaan ”hausta” verkkokirjastojen yhteydessä.

Tilastointityökalujen laskemat ”requestit” on kuitenkin jotain aivan muuta kuin tämä. Niiden laskemisella voida juurikaan arvioida palvelun todellista käyttöä. Esimerkiksi PallasPro -Intron pelkälle etusivulle meno aiheuttaa vähintään puoli tusinaa ”requestia”, vaikka käyttäjä ei koskaan tekisi yhtään varsinaista aineistohakua.

Esimerkkinä 13 requestia Vennyyn

Sivulle tullessa käyttäjän selain pyytää webbipalvelimelta esimerkiksi sivupohjaa, tyylitiedostoa, kirjaston logoa, Axiellin logoa, autocomplete-skriptiä jne. Verkkokirjastoon saapuminen, sisäänkirjautuminen, lainojensa uusinta, omien varaustensa tilan tarkistaminen, ulos kirjautuminen ja verkkokirjastosta pois siirtyminen aiheuttaa vähintään tusina ”requestia”. Samoin ”näytä seuraavat 10 hakutulosta” -nappi ja ”näytä saatavuustiedot” -nappi aiheuttavat kaikki requesteja, vaikka tuskin kukaan ajattelee että nämä ovat uusia hakuja an sich.

Requestien määrä voi siis olla parikymmenkertainen verrattuna siihen, mitä me ihmiset ymmärrämme ”hauilla”. Se monestiko käyttäjä on oikeasti painanut Hae -nappia, voidaan laskea PallasPron logitiedostoista etsimällä merkkijonoa formid=find2 tai jollakin verkkologien analysointityökalulla.

Kuten tuossa aiemmin syksyllä kirjoittelin, olen tutkiskellut verkkokirjastojen PallasPro-kirjastojen verkkologeja. Tämä on eräs sitä kautta selvinneistä asioista. Minulla ei ole mitään tietoa mitä Axiell asiasta ajattelee tai miten he ohjeistavat käyttäjiään (l. kirjastoja) verkkotilastoinnin tekemiseen.

Alallamme tuntuu liikkuvan tietynlaista, hyvin ymmärrettävää epäuskoa käyttämiimme tilastoihin, ja joissain paikoissa käytössä olleet Google Analytics tai Kirjastot.fi:n verkkotilastointipalvelut (joista jälkimmäinen on poistunut käytöstä) ovat antaneet aivan toisenlaisia lukuja kuin nämä PallasPron requestit antavat ymmärtää.

Toivon siis, että mikäli käännätte verkkopalvelujen tilastoissa termin ”request” suomeksi ”hauksi”, teillä on siihen hyvät perusteet ja tiedätte mitä olette tekemässä, tai alatte käyttää jotain toista suomenkielistä sanaa kuten ”sivupyyntö” tai ”sivulataus”.

Vastaan mielelläni lisäkysymyksiin esim. tällä palstalla, tai vaikkapa Kirjasto-kaapelilla/puhelimitse/sähköpostitse/Fesessä/kahvilla tms. Lisäksi olen kysellyt jotakuta vertaisarvioimaan menetelmiäni, ja tämä kutsu on edelleen auki. Opetusvideota en ole asiasta vielä laatinut :)

Tsemppiä tilastointiin kaikille sitä tekeville.

6 vastausta artikkeliin ”Verkkotilastoinnissa ”haku” on virheellinen suomennos termille ”request”

  1. Oi, kun tulee vanhat asiat mieleen. Vuoden 2000 lopussa minusta tuli työpaikallani ”e-intelligence engineer” ja ensitöikseni opin, että ’hit’ yksittäisen tiedoston eli esim. sivuelementin siirto ja piti näiden sijaan mitata ’page view’tä eli sivulatausta. Eli jos ymmärsin kuvauksesi ’requestista’ oikein (”Sivulle tullessa käyttäjän selain pyytää webbipalvelimelta esimerkiksi sivupohjaa, tyylitiedostoa, kirjaston logoa, Axiellin logoa, autocomplete-skriptiä jne. ”), oikea termi sille EI ole sivulataus, kuten alla ehdotat.

    Mutta oleellisin pointti on, että jos oikeasti halutaan mitata ”hakuja”, pitää perehtyä dataan ja etsiä oikea tapa löytää haluttu asia.

  2. Joo just näin, kiitos erinomaisesta tarkennuksesta Kaisa!! Tosiaan tossa Venny-esimerkkikuvan tilanteesta pitäisi laskea 13 requestia, 1 sivulataus ja 0 hakua.

  3. ”Requests” vieläpä kuulostaa siltä, että se ei vastaa edes tuota ”hitiä”, ja saattaa sisältää myös virheisiin päättyvät kyselyt. Ehkä jokin palvelinkysely tai HTTP-kysely olisi parempi käännös tuolle ”requests”-luvulle. Pitkä on matka varsinaisiin käynteihin tai peräti uniikkeihin sellaisiin, jotka tapaa olla niitä tilastoinnissa eniten kiinnostavia lukuja…

  4. Hei, BTJ Aleksi -viitetietokannan tilastotoiminto on Axiellin ATP-puolen tekemä ja siinä lukumäärä ”hakuja” tarkoittaa HAE-napin painalluksia, ei esim. navigointia pikaviitenäytön ja viitetietueiden välillä. – t. Kari S.

  5. Jotenkin tuntuu, että tämä sessions on kans ihan jotain huuhaata, mitä meillä on käytetty (luonnollisesti suurin luku mitä on). :-) Ainut hyvä asia on se, että käyttää edes sitä huonoa tapaa vuodesta toiseen, jolloin voi saada jonkinlaista vertailtavuutta. Tosin en tiedä oikeasti mitä verkkotilastoissa halutaan saada? Mace:n jutut logista liittyi laatuun… olen samalla linjalla. Ei kävijöillä. latauksilla tai hauilla ole määrinä mitään iloa, jos ei tiedetä mitä siellä tehdään. Toiveeni joulupukille: jokaisessa tarjouspyynnössä tulisi olla tilastointi ja rajapinnat ylikorostuneesti esillä. :-D

  6. Tere,

    Niin, PallasPro Intron request-kysely ei ole sama asia kuin tietokannasta tehtyjen hakujen määrä. Ihan kaikkia mainittuja hakuja ei sisälly kyselyyn, mutta useampi kuin yksi request voi syntyä.

    Olemme ohjeistaneet kirjastoja käyttämään ensisijaisesti tuota sessions-lukua, se kun on ainakin lähempänä sitä mitä tilastoilta halutaan ja mitä OKM kyselee. Lukujen vertailtavuushan on yksi tilastoista saatava keskeinen hyöty.

    Järjestelmissä on eroja, kuten Kari Saari tuossa aiemmin oivallisesti mainitsi. Täydennyksenä tuohon, Web-Origo laskee kävijät etusivun latauskertojen määrästä.

    Terveisin EsaP.

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s