Kirjastojärjestelmät vai kirjastot ilman järjestelmää

Joulutontun tehtävää toimittanut kuriiri toi juuri himaan tekijäkappaleeni Jarmo Saartin ja Pirjo Tuomen toimittamasta Kirjastojärjestelmät vai kirjastot ilman järjestelmää -teoksesta (Avain, 2012, ISBN 978-951-692-947-0). Toimittajien lisäksi tekstiä on Juha Hakalalta, Ari Rouvarilta, Petri Tonterilta, Ari Mäkirannalta, Sami Varjolta, Lea Tastulalta, Vesa Suomiselta, Ari Haasiolta ja hieman myös allekirjoittaneelta. Osaltani haluan kiittää kaikkia prosessista, ja kehoitan blogin lukijoita tutustumaan näihin erittäin hyviin, ajankohtaisiin ja todelliseen kokemukseen pohjaaviin teksteihin.

Omasta mielestäni mielenkiintoisin oma argumenttini on se, että kirjastojärjestelmän käyttäjäyhteisö on osa ko. järjestelmää, ja tämä tulisi huomioida hankinnassa. Lisäksi tuossa on muutama sanaseni siitä, mitä sosiaalinen media merkitsee kirjastoalan sisällä (vrt. asiakkaille mainostaminen). Muut kirjoittajat kertovat esim. Kohasta ja Evergreenistä, KDK:sta, Melindasta, musiikkiin liittyvästä tietopalvelusta sekä sen työn auttamisesta luetteloinnin ja verkkokirjaston avulla, selailunäkymistä sekä norsuista. Avoin lähdekoodi, avoimet rajapinnat ovat tietenkin keskiössä, koska kirjastot haluavat saada asioita aikaan.

Siis joululomalukemistoa parhaimmillaan. Sain kaksi tekijäkappaletta, laittakaa esim. sähköpostilla tai fesessä postiosoitteenne, niin voin postittaa toisen lainaan (joo kyllä, lainaaminen on mahdollista ilman kirjastojärjestelmääkin).

Mainokset

Käyttäjäyhteistö on osa kirjastojärjestelmää

Häät 1905 (Lontoon juutalainen museo)

Osallistun kirjastojärjestelmän hankkijalle suunnatun opaskirjan kirjoittamiseen (BTJ julkaisee sen piakkoin). Väitän tekstissäni, että

Valitessamme kirjastojärjestelmän, valitsemme samalla myös sen käyttäjäyhteisön johon kuulumme. Etsimällä hyvän, avoimen ja rikkaan yhteisön ja sitoutumalla siihen saamme käyttöömme arvokasta, jo kertynyttä sosiaalista pääomaa emmekä jää kirjastojärjestelmän toimittajan kanssa paitsioon. Joidenkin järjestelmien ympärillä on tunnetusti hyvät käyttäjäyhteisöt (esimerkiksi avoimen lähdekoodin Koha sekä VuFind), toisista ei ole paljoakaan sanottavaa. Järjestelmätoimittajan suhde asiakkaisiinsa vaikuttaa paljon. Käyttäjäyhteisö – siis kollegamme – on osa sitä investointia, jonka järjestelmän valitessamme teemme.

Kirjastojärjestelmä ja muutkin teknologiset infrastruktuurit ovat tyypillisesti pitkäaikaisia ja kuormittavia kumppaneita ja tiiviisti sidoksissa kirjastossa tehtävään arkityöhön. Hyvin johdettu kirjasto siis katsoo tarkkaan kenet johonkin tuotteeseen/toimittajaan sitoutuessaan epäsuorasti ”nai sukuunsa”. Jos oma organisaatio on aidosti yhteistyökykyinen ja valmis panostamaan tuotteen ympärillä olevaan yhteisöön (pomojen väliset puolivuotiset pullakaffit eivät riitä oikeaksi yhteistyöksi), voi yhteisöstä paljon irti sellaista lisäarvoa, jota järjestelmätoimittaja eikä organisaatio itse saa aikaan.

Millaiseen yhteisöön Axiell Arenan tai Auroran, tai ExLibriksen Voyagerin tai Alephin valitseva kirjasto saa? Minusta asiaa voi hyvin verrata naimisiin menoon; millainen suku tulee naimakaupan mukana? Hullu, flegmaattinen, talkoovalmis, tyystin arvaamaton vai millainen?

Vaskin asiasanat, jotka eivät ole YSAssa

Sanaston pengontaa

Kävin läpi Vaski-kirjastojen aineistotietokannan ja etsin asiasanat, jotka eivät esiinny tesauruksessa. Ohessa lista yleisimmistä:

esiintymien lkm termi
202 sotaromaanit
108 Lieto-kokoelma
100 korjausoppaat
66 eräkirjat
38 matkakirjat
29 sisustusoppaat
27 Suomen historia
23 kansanmusiikki: Venäjä
23 jouluaskartelu
22 posliinimaalaus
21 viihdetaiteilija : Suomi
21 salapoliisiromaanit
20 Yhdistyneet kansakunnat
20 kirjasto- ja informaatiopalveluala
20 1980-LUKU
18 vaateompelu
17 rock and roll
16 MURRENÄYTTEET
16 itämaiset taistelulajit
15 sosiaali- ja terveydenhuolto
15 rajavartiolaitos
15 paperiaskartelu
15 laivaluettelo
15 DVD-elokuvat
14 tiedeakatemiat
14 Suomen taideyhdistys
14 piirroselokuvat
13 tabulatuurinotaatiot
13 ranskalainen keittiö
13 nuorten aikuisten kirjat
13 Jeesus Kristus
13 äänentoistotekniikka
13 šamanismi
12 YKSINLAULU
12 vauvanhoito
12 Titanic
12 tilastollinen tutkimus
12 punk rock
12 kaupunkihistoriat
12 historia : 1900-luku
12 arabialainen musiikki
12 1960-luku
11 tšekin kieli
11 säveltäjät : Suomi
11 rentoutuminen
11 muodin historia
11 kuultokudos
10 varastaminen
10 Uusi testamentti
10 taitelijat
10 seminaarit (kokoukset)
10 samanismi
10 rockmusiikki
10 kiinalainen keittiö
10 1800-LUKU

Ohjelman (kts. alla) antamista tiedoista näkee myös, että esim. asiasana muodin historia (jota ei ole YSAssa) esiintyy Vaskin tietueissa Ppro853_137785, Ppro853_541141, Ppro853_541143, Ppro853_541144, Ppro853_541145, Ppro853_541146, Ppro853_541634, Ppro853_561083, Ppro853_561086, Ppro853_561087 sekä Ppro853_561088.

Eri asiasanoja joilla on vain yksi esiintymä Vaskissa löysin 1761 kappaletta. Kymmesti esiintyviä asiasanoja on kahdeksan kappaletta. Miten tällaista dataa olisi parasta havainnoillistaa? Ideoita vastaanotetaan.

Vaski on FinMARC 1998 -muotoa ja kyseisen standardin mukaan kentässä 652 olevat asiasanat ovat peräisin Yleisestä suomalaisesta asiasanastosta, eli YSA:sta (kansainvälisessä MARC21:ssä asia ilmaistaan hieman toisin, kuvaamalla asiasanakenttien osakentässä ‡2 mikä sanasto on kyseessä, tyyliin 650 #7 ‡a bibliografinen valvonta ‡2 ysa).

Tein aiemmin pienen työkalun jolle voi antaa yksittäisiä MARC-tietueita ja se kyselee ONKI-palvelun ohjelmointirajapintaa (APIa) käyttäen ovatko tietueen asiasanat YSO-ontologiassa. Kun YSA julkaisiin vastikään avoimena datana, tuli nyt tekemäni massakäsittely helpommaksi. Työn voi nykyään tehdä omalla koneella, pommittamatta ONKIn rajapintaa noin suurella kyselymäärällä.

Prosessi

Noukin ensin YSA:n SKOS-muotoisesta tiedostosta varsinaiset sanat (prefLabel ja altLabel) tekstitiedostoon yhdeksi pitkäksi, pitkäksi listaksi. 14.6.2011 lataamassani tesauruksessa oli 36991 termiä.

Sekä MARC-data että sanasto ovat saatavilla myös XML:nä, jonka käyttäminen olisi oikeaoppisempaa, mutta en nyt jaksanut säätää niiden kanssa sillä XML:n käsittelytyökalut ovat minulle aika tuntemattomia. Sensijaan olen tottunut operoimaan unixin komentoriviltä ja opettelen myös Perliä.

Tässä kirjoittamani Perl-kielinen ohjelma jota käytin:

#!/usr/bin/perl

use MARC::Batch;

my $file = "vaski-kunnostettu.mrc";
my $batch = MARC::Batch->new('USMARC', $file);
my $sanasto = "~/ysa.lista.alt_too";

$batch->strict_off();
while (my $record = $batch->next()) {
        for my $termi ($record->subfield('652', 'a')) {
        if (system("grep -q -i \"$termi\" $sanasto")) {
            print($termi, ";", $record->field('001')->as_string,"\n");
        }
    }
}

Kuten ehkä huomaat, tämä on hyvin kaukana elegantista. Ensinnäkin käsiteltävät tiedostot on nimetty ohjelman sisällä ja toisekseen kukin termi etsitään sanastosta käyttäen ulkoista ohjelmaa. Tämä aiheuttaa yhden forkin per asiasana, joka on huono asia. Oikeasti vertailu pitäisi tehdä tämän ohjelman sisällä, lukemalla asiasanat tiedostosta yksiulotteiseen taulokkoon tai listaan. Mutta toimii tämä näinkin, kun huonoa ohjelmistosuunnittelua voi korvata prosessoriteholla 🙂 Miniläppärini (joka on ainoa käyttämäni työväline) rouskutteli tätä useita tunteja.

Mutta tämän ei olekaan tarkoitus olla eleganttia. Tämän on tarkoitus osoittaa kirjastoammattilaisille, että me itse voimme ottaa aloitteen käsimme sen sijaan, että odottelemme että järjestelmätoimittajamme tekee kivoja asioita puolestamme (sitä on turha odotella).

Vielä pari huomiota laatimani menetelmän puutteista: se ei huomioi asiasanaketjuja, ja tuon kaltainen huoleton merkkijonojen etsintä johtaa vääriin tuloksiin mikäli etsittävä epäkelpo asiasana esiintyy osana kelpoa asiasanaa. Tälle asialle pitäisi todella tehdä jotain.

Mitä välii?

Ymmärtääkseni kaikkien 652-kentässä olevien termien pitäisi olla peräisin YSA:sta. Näin sanoo myös FinMARC -formaatti. Asiasanoja joita ei YSAssa ole, ei pitäisi käyttää ainakaan kyseisessä kentässä. Kuten tiedämme, ei asiasanasto kuvaa kaikkia maailman ilmiöitä. Siksi paikallisille sanastoille onkin tarvetta.

Minua paremmin luettelointiin perehtyneet tietänevät mitä sisällönkuvailussa oikeasti kuvaillaan. Jossain lienee sovittu, onko sisällön lisäksi aiheellista kuvailla muotoa. Esim. Vaskissa käytetään termejä ”Nintendo Wii”, ”sotaromaanit” ja ”elämäkerrat” kuvailemaan muotoa. Nämä teokset eivät kerro Nintendon Wii-peleistä, sotaa kuvaavista romaaneista tai elämäkertojen kirjoittamisesta, vaan ovat niitä. Ehkä tämä on ookoo – en jaksa nyt lueskella luettelointisäännöstöä asiaa tarkistaakseni enkä muista ulkoa mitä siellä sanotaan. Mutta ei ole vaikea nähdä että tämä on problemaattista. Ihmettelin samaa asiaa aiemmin, kun mietin minkähänlaista olisi “ihan oikea kirjastotyö” pelien parissa?

Mainiot luetteloijat ovat arvatenkin tämän muoto vs. sisältö -asian ratkaisseet jollain sopimuksella (joka siis lienee kirjattuna luettelointisääntöihin). Käytännössä ainakin Vaskissa kuvaillaan surutta sekä muotoa että sisältöä 652 -kentässä.

Tässä on muitakin mielenkiintoisia puolia: MARC-tietueessa ei esimerkiksi ole mitään tietoa siitä, mitä YSAssa on ollut tietueen luontihetkellä. YSA muuttuu ajan myötä, kenties osa nyt listaamistani termeistä on ollut kyseisen luetteloijan käyttämässä YSA:n versiossa luettelointihetkellä… MARC-tietueesta itsestään puuttuu tällainen tekninen metadata.

Kirjoitusvirhe luetteloinnissa on fataali virhe, ja teos katoaa kyseisen aiheen kannalta mustaan aukkoon. Varsinaisia kirjoitusvirheitä löysin Vaskista onneksi vain ihan muutaman.

Monet löytämäni, YSA:n ulkopuoliset termit ovat hyvin käytännöllisiä ja olen oikeasti onnellinen että niitä on tietueisiin luettelointisääntöjen vastaisesti tallennettu. Tämä kertoo sanaston puutteellisuudesta ja myös luokitusjärjestelmän puutteista, sekä kirjastoihmisten omatoimisista ongelmanratkaisupyrkimyksistä. Se on tietenkin aivan oikein. Nämä itse keksityt termit voisi eristää omaan sanastoonsa, jolla YSAa täydennetään, ellei ole YSAn tarkoituksenmukainen ylläpito ole mahdollista. Lisäksi meillä on käytettävissämme useampia sanastoja YSAn rinnalla ja niitä olisikin hyvä käyttää MARC-tietueen sellaisissa paikoissa, jotka eivät ole YSAlle varattuja.

Raporttimme yleisten kirjastojen kirjastojärjestelmistä

Minulla oli kevään ja kesän aikana iloa ja kunnia saada osallistua Tuula Haaviston ja Marja-Rii Jokisen kanssa yleisten kirjastojen tietoteknisiä järjestelmiä käsittelevän raportin laatimiseen. Tekstin laatimisprosessi oli minulle erittäin antoisa, josta siis kiitos tiimillemme. Raportti on julkaistu vastikään ja sen nimi on Kirjastojärjestelmät nyt! Se on saatavilla PDF:nä sekä KirjastoWikissä kommentointia ja edelleenmuokkaamista varten. Kirjasto-kaapeli -foorumilla raportista tiedotettiin eilen.

Tässä raportin sisällysluettelo:

Raportti pohjaa pitkälti Tuulan syvään asiantuntemukseen kirjastojen järjestelmäasioissa. Tekstiä esitellään nähtävästi tulevissa kirjastoalan tapahtumissa sekä Kirjastolehdessä. Raportti käsittelee sangen kattavasti yleisten kirjastojen kirjastojärjestelmiä, niiden ympäristötekijöitä, suhdetta kunnan/kaupungin omaan tietohallintoon sekä muihin järjestelmiin tuolla ulkona internetissä. Raportissa tarkastellaan kirjastojärjestelmien kehitysvaiheita Suomessa sekä katsellaan hieman tulevaisuuteen ja ulkomaille. Esiin nousee vaade sille, etteivät kirjastot voi enää asustella omassa pikku kuplassaan, vaan kirjaston keskeisten tietojärjestelmien on kyettävä keskusteluun myös muiden tietojärjestelmien kanssa. Raportti pyrkii kokoamaan ja edelleenlevittämään sellaista tietoa jota järjestelmän suunnitteluun, valitsemiseen, käyttöönottoon ja kehittämiseen liittyy.

Varsinaisesti hiljaisuudessa laadittu teksti valmistui jo kesällä, mutta julkaisu valitettavasti viivästyi tänne syksyn kynnykselle. Toisaalta hyväkin, sillä syksyllä raportin kohderyhmä eli kirjastolaiset ovat palanneet kesälaitumiltaan.

PDF:ää vastaava versio wikissä on tämä 25.08.2009 klo 13:54 ja näköjään tekstiin on tullutkin jo pari kommenttia! Ihanaa! Kommentteja on ehkä mukavin laittaa wikisivun keskustelu-välilehdelle eikä suoraan tekstin sekaan.

Jos tämä blogipostaus on kuulostanut juhlapuheelta,  ei ihme sillä kyllä tässä suoraansanoen hieman juhlalliset fiilikset on kun on tällainen homma takanapäin!*<:-)