Analyysi Helsingin kaupunginkirjaston aihepakettien ajallisesta kattavuudesta

Kirjasto on kertomus. Nimenomaiseen kertomukseen sisältyy väite, että kirjasto tuo esille kirjallisuuden (ym. julkaisujen) niin kutsuttua pitkää häntää. Siis pitämällä käytössä ja nostamalla esiin aineistoa, johon ei yksittäisinä julkaisuna kohdistu suurtakaan mielenkiintoa, mutta joka on määrällisesti laajaa.

Viime viikolla tuli mieleen, että Helsingin kaupunginkirjaston aihepakettien tonkiminen toisi tähän ehkä jotain valoa. Aihepaketit ovat sikäli mielenkiintoinen tutkimuskohde, että niiden laatimista ei ole keskitetysti juuri ohjattu; päin vastoin laatijoilla on vapaat kädet vinkata haluamaansa aineistoa, ja koko henkilökunta on pakettien kokoamiseen tervetullut. Näin voitaisi ajatella, että aihepaketit heijastavat kirjastoammattilaisten omaa näkemystä tällaisesta vinkkaamisesta ja aineiston esiin tuonnista, eikä organisaation näkemystä.

Koodasin ihmeellisillä bash-taidoillani pari loitsua, jotka käyvät hakemassa aihepakettien web-sivut kaupunginkirjaston julkaisujärjestelmässä asustavasta aihepakettiarkistosta, tonkivat niistä linkit pääkaupunkiseudun näyttöluetteloon HelMetiin ja käy vielä poimimassa sieltä ns. xrecord-tiedostot, jotka ovat XML-muotoisia MARC 21 -tietueita. Sieltä löytyy kenttä 260‡c, eli Julkaisu-, jakelu- jne. aika. Työkalusettinä minulla on perinteinen unix-varustus tyyliin sed, wget ja libxml:ään nojaava xpath. Logiikka on toteutettu bashillä. Oikeasti minun pitäisi opetella Perl-ohjelmointia juuri tällaista toimintaa varten.

Toivoin tällä tutkimuksella osoittavani, että toisin kuin yleensä tykätään toisella, kirjastolaiset oikeasti nostaisivat näissä paketeissa esille lähinnä uutta materiaalia. Ajattelin etukäteen, että ehkä 80% kohdistuisi viiden edellisen vuoden aikana julkaistuun aineistoon. Valitettavasti (tai siis onneksi) jouduin pettymään, sillä läpikäymäni aihepaketit todellakin nostivat esiin suuren määrän vanhempaa aineistoa!!

Kävin läpi vain vuosien 2010 ja 2009 aihepaketit. Tältä vuodelta on 16 aihepakettia, viime vuodelta 43. Tekemäni työkalu löysi näistä suoria viitteitä teoksiin 186 ja 747 kappaletta.

Alla tulos:

Vaikka painoa kertyykin huomattavasti viiden edellisen vuoden julkaistulle aineistolle vuonna 2009, ei käyrä ole ollenkaan niin jyrkkä kuin olin kuvitellut. Paljonkos se kirjan keskimääräinen aika kirjakaupan hyllyllä onkaan? Jotain 6 kuukautta tai jotain?

X-akselin otsikot ovat tässä aika pientä tihrua, mutta akselilla on sata vuotta julkaisuja vuodesta 1910 alkaen. Suurempi, paremmin luettava versio kuvasta löytyy Flickristä. Nyt nappaamani datat sekä työkalun saa minulta jos haluaa. Tai voin jatkaa työtä jos se jotakuta kovasti kiinnostaa ja siitä olisi kirjastoaatteen ja maailman hyvyyden kannalta iloa.

Mistään käyttämistäni työkaluista ei kiitos kuulu järjestelmätoimittajillemme (Innovative Interfacesin Millenium, Sinisen Meteoriitin Meteor). Ne eivät tarjoa mitään työkaluja tällaiseen tietojen ynnäilyyn eri lähteistä. Kiitos kuuluu sen sijaan avoimen lähdekoodin kansainväliselle yhteisölle, joka on kymmeniä vuosia herkeämättä tuottanut joustavia, tehokkaita, ilmaisia ja vapaita työkaluja, joita ilman maailma olisi erittäin erilainen kuin on. Kiitos.

Samalla menetelmällä ja tekemieni työkalujen avulla voi piirrellä erilaisia graafeja. Esim. käppyrän voisi rajoittaa vain tieto- tai kaunokirjallisuuteen tai vaikka musiikkiin. Myös aiempien vuosien käppyrät voisi piirtää. Aihepaketteja on nyt yhteensä 209, vuodesta 2006 lähtien. Tekemäni työkalusetti ei ole todellakaan täysautomaattinen (tosin tämä proof-of-concept todistaa, että työkalun voisi kehittää sellaiseksi), mutta pointti on, että meillä kirjastoilla on kaikenlaista dataa, jota voimme tutkia jos haluamme. Tämän tekemiseen meni noin yksi työpäivä, mukaan lukien tämä blogikirjoitus.

Ajallinen näkemys pitkään häntään on yksi tapa katsoa asiaa. Jos myös kirjastojen lainaustilastot olisivat saatavilla (kuten niiden pitäisi olla), voitaisi vastaavalla tavalla selvittää vaikkapa kuinka paljon kirjastolaiset nostavat esiin aineistoa jota ei lainata paljoakaan.

Kohan suomennos on nyt jossain vaiheessa

Tässä talven mittaan on ollut meneillään epämuodollinen ja aika impulsiivinen Kohan suomennos. Vielä keskeneräinen käännös on nyt jonkin aikaa ollut näkyvillä Labs.kirjastot.fi:n tarjoamassa Koha-asennuksessa , eli osoitteessa http://koha.kirjastot.fi. Se on toiminnalliselta puolelta melkolailla suomenkielinen. Kommentteja vastaanotetaan.

Aineistona tuossa Koha-asennuksessa on Project Gutenbergin sisältö. Auktorisoitua asiasanastoa ei tässä vaiheessa tosin ole, sellainen tarvittaisi kyllä sekä suomennoksen testaamiseksi että muutenkin. Onko kellään ideoita miten sellaisen saisi haltuunsa ja miten sen kikkailisi Kohaan? Periaatteessa yksi hailee mikä asiasanasto, mutta YSA olisi varmaan käytännönläheisin Kohan testailuun. Pitäisi varmaan fiilailla tuota testi-Kohaa parempaan esittely- ja demoilukuntoon.

Aloitin myös KirjastoWikiin sivun Kohan suomentamisesta.

Ja kysytäämpä vielä täälläkin: mikä sinusta on ”tag” suomeksi? ”Tagi”, ”tägi” ja ”avainsana” ovat ne ilmeiset ehdokkaat. Merkkasin nuo KirjastoWikissä olevaan termitaulukkoon, käykääpä äänestämässä tuon termin suomennosta laittamalla plus- (+) tai miinus (-) -merkkejä tuohon taulukkoon. Samalla voi kurkistaa ko. wikisivun rinnalla käytävää keskustelua.

Jos ei vielä ole selvää, niin Koha on avoimen lähdekoodin kirjastojärjestelmä. Siis vähän niin kuin PallasPro, Origo, Voyager, Aleph, Innovative Millenium ja tuleva Axiell Aurora, mutta ohjelman toiminta ei ole salaisuus. Esim täältä voi katsoa ja muokata miten haku ihan oikeasti toimii ja mitä relevanssialgoritmi tekee.

Suomennetaas piruuttaan toi Koha

Aloitimme viime viikolla Kohan suomentamisen. Nyt käännetään aineistoluettelon l. näyttöluettelon l. OPACin l. verkkokirjaston puoli, eli se asiakkaille näkyvä osa. Työn alla on Koha 3.0:n OPAC.

Meillä on pieni ryhmä Google Groupsissa jossa on puitu terminologiaa. Kohasta on muutenkin tullut sähköpostiteltua tässä talven mittaan muutaman suomalaisen kirjastoaktivistin sekä sellaisten kirjastojen kanssa, joissa se on käytössä. Niitä ei tosin ole montaa kappaletta. Mutta riittävän monta, jotta suomeksi kääntäminen kannattaa tehdä (eli enemmän kuin 0 kpl). Kerran kääntämisestä hyötyvät kaikki, mutta voi olla olemassa monta erilaista suomennosta. Itse teen työtä Kirjastot.fi:n Labs-hankkeen nimissä ja Labs onkin asentanut Kohan kaikkien niiden kokeiltavaksi, joita kyseinen avoimen lähdekoodin kirjastojärjestelmä kiinnostaa. Myös Evergreen on asennettu tutkittavaksi. Teen suomentamista ”virkamiestyönä”, eli ilman mitään erityistä projektisuunnitelmaa tms. sekoilua. Virkamiestyön ja talkootyön ero on hienonhieno 🙂 En tiedä miten muut Kohan suomentamisessa mukana olevat ovat omaa työtään organisoineet, eikä oikeastaan kiinnostakaan – kunhan saadaan jotain aikaan ja hyvä pysyy kierrossa. Koha käyttää PO-tiedostoja ja kääntämistä eri kielille tehdään Pootle -ympäristössä. Tai voi muitakin käännöstyökaluja käyttää jos haluaa, mutta ainakin tässä vaiheessa tuo Pootle on osoitteutunut näppäräksi.

Tässä käännöshankkeessa on muutamakin kiehtova puoli. Ensinnäkin tämä on konkreettnen osoitus siitä, miten avoin lähdekoodi ja yhteisöllinen kehittäminen yleensäkin toimii. Uskoisin, että tuota Kohan OPACin suomennosta päästään kokeilemaan ensi viikon loppupuolella. Vertailun vuoksi HelMet-alueella on vähän aikaa sitten otettu käyttöön Innovativen mobiilituote AirPAC, joka on siis käytännössä helmet.fi -sivusto älypuhelimille sopivammassa muodossa. Se on saatavilla Innovativelta vain englanninkielisenä. Niinsanotusti kansainvälinen versio on pääkaupunkiseutulaisten käytössä ehkä 2012. Todellisuudessa kääntäminen varmasti sujuisi päivässä parissa, jos siihen vain olisi mahdollisuus. Pointti on, että avoimen lähdekoodin ohjelmistoissa ei ole mitään yhtä tahoa, joka voi estää halukkaita tekemästä omasta ja toisen elämästä parempaa.

Toinen kiehtova puoli Kohan kääntämisessä on se, että edes hieman mahdollistaa kirjastojärjestelmistä ja niiden valitsemisesta keskustelemista. Tilannehan on Suomen yleisissä kirjastoissa nyt se, että järjestelmätoimittajia on tasan yksi kappale. Axiell. No pääkaupunkiseutu uloslukien. Ei minulla periaatteessa ole mitään Axiellia vastaan, mutta sitä vastaan on, ettei ole mitään vaihtoehtoja joista edes keskustella, tai joihin verrata käytössä olevaa järjestelmää. Tulevaisuudessahan se tulee olemaan Axiellin Aurora, kun Axiell siirtää Pallas ja Origo -asiakkaansa siihen.

HelMet on yhä enemmän 2.0

HelMet

Lienettekö huomanneet, että pääkaupunkiseudun yleisten kirjastojen näyttöluettelo sallii nykyään arvioiden kirjoittamisen? Sitä en osaa sanoa aikooko kirjasto tarjota itse kirjallisuusarvioita niitä tuottamalla tai hankkimalla julkaisuoikeuksia ammattilaisten laatimiin kirja-arvioihin vai onko tarkoitus että vain loppukäyttäjät (siis ihmiset) laativat niitä.

Jokatapauksessa asiakkaille arvion kirjoittaminen onnistuu kirjautumalla normaalisti kirjastokortin numerolla sekä siihen liittyvällä pin-koodilla. Teoksen saatavuustietojen alapuolelta, käyttäjien antamien tähtien vierestä löytyy nappi ”kirjoita arviointi”.

Muita, vastaavia palveluja on sekä käytössä että vireillä pilvin pimein ja niitä onkin kirjastoalalla kaipailtu jo vuosia. Tai ainakin jotkut ovat kaipailleet, minä mukaan lukien.

Kotimaiset kirjastomarkkinat itseensä käytännössä kokonaan integroinut Axiell myy Arena -palvelua ja se on käytössä jo Hämeenlinnassa ja tulossa mm. Tampereelle. Axiellin Arenalle kilpailija on ruotsalaisen Teknikhusetin CS Library. CS Libraryn hatussa on sulka mm. Tukholman kaupunginkirjaston verkkosivu-uudistuksesta. Molemmat ovat varsinaisen kirjastojärjestelmän sekä niiden perinteisen ankeiden webbisivustojen päällä/rinnalla pyöriviä, rikkaampia sivustoja. Tällaisista ohjelmistoista puhutaan discovery interfacena.

Saatavilla on jo vuosia ollut ”kirjasto 2.0” -tuotteita, joista suuri osa on saatavilla myös ilmaiseksi (lähdekoodeineen) ja heti käyttöönotettavissa. Näistä mainittakoot SOPAC, XC, VuFind sekä Blacklight. Suomalaiset yleiset, akateemiset tai erikoiskirjastot eivät kuitenkaan ole halunneet alkaa ottamaan käyttöön mitään näistä, vaan ovat odottaneet perinteisten järjestelmäntoimittajiensa tarjoavan jotain tuotetta. Pääkaupunkiseudun järjestelmäntoimittaja Innovative onkin koonnut ns. ”kirjasto 2.0” -ominaisuuksia Encore -tuotteeseensa (jota ei ainakaan toistaiseksi ole hankittu HelMet-alueelle) ja Axiell on siis kehitellyt Arenaa omien kirjastojärjestelmiensä päälle.

CS Library, kuten suurin osa avoimen lähdekoodin ilmaisista, itseasennettavista discovery interfaceista väittävät olevansa alla kehräävästä kirjastojärjestelmästä (melko) riippumattomia. Harvat avoimen lähdekoodin ohjelmistoista kuitenkaan tukevat suomalaisissa yleisissä kirjastoissa käytettäviä kirjastojärjestelmiä, eli Origoa ja PallasProta (jotka olivat siis ATP:n ja Tiedon tuotteita ennenkuin Axiell osti molemmat). Tuen rakentaminen Origoa, PallasProta ja muita kirjastojärjestelmiä varten avoimen lähdekoodin ratkaisuihin ei kuitenkaan olisi suurikaan työ ja kerralla saataisi mukaan suurensuuri joukko suomalaisia yleisiä kirjastoja. Tämä olisi järkevää hoitaa keskitettynä ostopalveluna. Milleniumia sensijaan tukee suuri osa näistä ratkaisuista.

Asiaa monimutkaistaa sinänsä hyvä pyrkimys siihen, ettei kirjastojen mustasukkaisesti vartioiman bibliografisen metatiedon ympärille muodostuva lisätieto (esim. arvostelut, käyttötilastot jne) sirpaloituisi moneen paikkaan. Suomi on liian pieni käyttäjäkunta hajautumaan alueellisiin kirjasto 2.0-palveluihin, eikä maantieteellinen alue kuitenkaan ole internetissä kovinkaan relevanttia. Kuvitelkaa että jokaisella maailman kunnalla olisi oma Facebook yhden yhteisen Facebookin sijasta. Ei toimi. Kirjastoalalla puhutaan sensijaan yhden laarin mallista.

Kirjasampo pyrkii olemaan se laari. Lisäksi se mullistaa kaiken mistä kirjastojen metatietotyössä on kyse. Tässä vaiheessa on kuitenkin erittäin epäselvää miten Kirjasampo yhtyy kirjastojen verkkopalveluihin (terveisiä sinnepäin, että plsplspls miettikää jonkinlaiset liittymät Origoon, PallasProhon ja HelMetiin, osana pr-työtä kirjastoille. välivaiheena). Lisäksi Kirjasampo rajautuu kaunokirjallisuuteen joten tietokirjallisuuteen, musiikkiin ja kävelysauvoihin liittyvä metatieto on ratkaistava jotenkin muuten.

Vaarana on, että arvostelupalvelut keräävät tietoa suljettuihin siiloihin. Mielestäni siilot ja ”2.0” ovat keskenään tyystin epäyhteensopivat käsitteet. En tunne CS Libraryn tuotetta tarkasti, mutta ainakin mainostavat ohjelmointirajapintaansa (API) kovasti. Ehkä se ei ole siilo ja ehkä Axiell Arena ei ole siilo. Nykyiset HelMetin arvostelut muodostavat siilon ja marginalisoivat 4 miljoonaa suomalaista. Kirjastolaisille tuttuja yhteystyön muotoja ovat MARC, z39.50 ja kopioluettelointi. Teoksia kuvailevien MARC-tietueiden lisäksi kaikki muutkin kirjastojen tietotuotteet on rakennettava saman periaatteen, eli yhteiskäyttöisyyden ja verkostomaisuuden mukaisesti. Mutta tietenkin vielä paremmin kuin 25 vuotta sitten!

Oikean kirjastomaailman ulkopuolelta käyttäjäarvioita ja muita kirjasto 2.0 -ominaisuuksia löytyy esim. LibraryThingistä, Amazonista ja Google – tyylilleen uskollisensa – haravoi arvioita ja viitteitä verkosta koneellisesti Google Book Searchiin. Nämä kolme palvelua konseptoivat kirjastoa aivan eri lähtökohdista kuin perinteiset, institutionalisoidut kirjasto-organisaatiot (tai no, monet kirjastoinstituutiot ml. yleinen kirjastolaitos ovat oikeastaan aika lyhyt välivaihe kirjastojen historiassa). Amazonin ja Googlen kanssa ns. oikeiilla kirjastoilla ei ole oikeastaan minkäänlaista vuorovaikutussuhdetta, LT on onneksi aktiivinen toimija kirjastojen suuntaan.

Todella sekava kirjoitus, mutta sekava on kirjastojen verkkopalvelujen tilannekin. Tilannetta pyrkii valottamaan Kirjastojärjestelmät nyt! -raportti sekä Yleisten kirjastojen neuvoston verkkostrategia. Muutama selvä linjaus on olemassa (esim. mainittu yhden laarin malli) ja riittävästi teknisiä avaimia sekä kansainvälistä yhteistyökumppaneita (eli tanskalaisia) olisi tarjolla kuten Antti innostavasti kirjoittaa. Taustalla kuitenkin häämöttää toisaalta järjestelmätoimittajien tuotteet (Axiell Arena, CS Library) joilla kaikesta tästä murehtiminen voidaan ulkoistaa ja toisaalta Suuri Yhteisluettelo, Joka Tulee Ratkaisemaan Kaikki Ongelmat. Joten ehkä nyt ei kannata hätiköidä (lue: kannattaa olla tekemättä mitään, yhtikäs mitään). Ja toisaalta–yleisten kirjastojen keskuskirjaston (Helsingin kaupunginkirjasto) sekä sen seudullisten kumppanien (Espoo, Vantaa, Kauniainen) lähteminen oman laarin rakentamiseen on signaali muille noin 350:lle kirjastolle siitä halutaanko sittenkään hakeutua kohti yhteisiä verkkopalveluratkaisuja vai ei.

Aarg, tarvin poistokoulutusta!

Tänään kokoelmanhallinnallista aineiston poistamista tehdessäni turhauduin siinä määrin, että laadin tämän kirjelmän Helsingin kaupunginkirjaston kehittämisyksikölle:

Kaipailen jotain hyvää, mieluusti HelMetin laajuista koulutusta aineiston poistamisesta. Näkökulman soisi olevan ensin teoreettisempi, sitten katsottaisi hieman talon periaatteita ja strategioita ja lopulta katsottaisi Milleniumia ja muita järjestelmiä että mitä tietoa voi poistamisen tueksi saada.

Miltsissähän on (ainakin minun mielestäni) todella ankeasti saatavilla poistamispäätöstä tukevaa tietoa esimerkiksi niteen historiasta tai siitä ovatko niteet liikkuneet esim. varausten kautta vai onko asiakas poiminut ne hyllystä.

Googlen avulla voi yrittää arvailla että mitkä kirjoittajat ja teokset ovat alansa tai genrensä merkkiteoksia. Toisten teosten viiteluetteloita voi lueskella myös, mutta se on työlästä.

Minusta tuntuu, että erityisesti poistaminen on toiminto jota kirjastolaiset ainakin täällä Miltsin alueella (Millenium -järjestelmä on Suomessa käytässä vain HelMetissä, eli pääkaupunkiseudun kaupunginkirjastoissa) oikeastaan eivät voi suorittaa muuten kuin mutu -fiiliksen pohjalta. Jossain tätä kutsutaan ”hiljaiseksi tiedoksi”, ”ammattitaidoksi” tai ”harkinnaksi” mutta varaan itselleni oikeuden suhtautua moisiin nimityksiin kriittisesti.

Minusta julkishallinnon alaisen ammattilaisen pitää pystyä selvästi osoittamaan mihin tietolähteisiin hänen tekemänsä päätökset perustuvat, etenkin kun on kyse aineiston poistamisen kaltaisesta toimenpiteestä. Etenkin kun ollaan sentään kirjastolaisia!

HelMetin oma kirjavarasto toimii Pasilassa ja erillinen, koko kansallista kirjastoverkkoa palveleva ja tukeva Varastokirjasto sijaitsee Kuopiossa. Sinne voi lähettää jotain. Sitten on niinkutsutut nollalistat, eli listat niteistä jotka eivät ole liikkuneet edellisen vuoden aikana. Järjestelmästä selviää myös koska nide on viimeksi palautettu, koska sen tietue on luotu. Niteiden lainaus- ja uusintakertojen määrä näkyy myös mutta siinäpä ne tiedot sitten oikeastaan ovatkin. Ei esimerkiksi tietoa siitä miten jonkun kirjailijan tai johonkin asiasanoihin liittyvät teokset ovat liikkuneet viimeaikoina. Lainausmääräkin ilmoitetaan vain yhtenä lukuna tietueen luonnista nykyhetkeen asti, ei ole käytettävissä mitään tietoa siitä miten lainauskerrat ovat kertyneet esimerkiksi ajan funktiona tai minkätyyppiset käyttäjät ovat sitä lainanneet.

Olisi hienoa tietää miten poistamista oikeasti tehdään muissa kirjastoissa ja miten siihen liittyvää tietoa hallinnoidaan.