Dolly Parton on hyvä kirjastotäti <3

Dolly

Pikainen bloggaus pyöräreissulta Turusta Otavalle. Tapaan kuuntelemaan podcasteja pyöräillessäni, ja tämänviikkoinen BBC:n Documentary of the Week kertoo suunnattoman karismaattisen Dolly Partonin hyväntekeväisyyshankkeesta Imagination Library (@dollyslibrary). Puolituntisen, tämän viikon saatavilla olevan dokumentin nimi on How Dolly Got Rotherham Reading. Tässä blurbi:

Coming from a poor background Dolly Parton came to regard good literacy skills as one of the key passports to enhanced life chances. In 1995 she launched the ’Imagination Library.’ – all children in the area were sent one book a month from birth until five years. In 2007 she took South Yorkshire by surprise when she turned up in Rotherham. But what happened next? Did her library capture the imagination of Rotherham’s children? We follow up to ask whether it was just a flash in the pan or a serious project.

USA:ssa, Canadassa sekä Britannissa toimiva hanke lähettää nuorille jäsenilleen kirjan kuukaudessa suoraan kotiin. Joka kirjassa on lapsen oma nimi sekä pieni tervehdys Dollyltä.

Ennenpitkää dokumentissa esitetään kysymys, että mihin tällaista tarvitaan, kun onhan meillä kirjastot (tosin brittikollegoillamme ei nyt mene hyvin). Noh, vastaus on tietenkin ilmeinen: kaikki eivät yksinkertaisesti käy kirjastossa.

Dollyn oma aktiivisuus, karisma sekä tietenkin hänen legendansa tekevät tästä kirjanlahjoitushankkeesta erityisen. Dokumentin mukaan toimii kuin häkä ja vanhemmat, poliitikot, Dolly sekä tärkeimpinä tietenkin muksut rakastavat tätä. Kirjastopalvelu par excellence. Kiitos Dolly, olet inspiroiva kollega

Advertisement

TouchArcade hämmästelee kirjastojen asiakaspäätteitä

TouchArcade

Mobiilipelaamista käsittelevän TouchArcade -sivuston podcast numerossa 10 Brad, Eli ja Jared hämmästelevät tietokoneiden käyttöä kirjastoissa ja niihin liittyviä ”vakavia” probleemia kuten poken katsomista, toisten olan yli kurkkimista, hämäriä kirjaston käyttäjiä ja muita hyvin tunnettuja ilmiöitä, sekä sitä miten kirjastot tapaavat tietokoneet sijoittelemaan.

Koko podcast on noin tunnin mittainen, ja käsittelee kirjastoja mielenkiintoisempia asioita, kuten tarinankerronta mobiilipeleissä, Angry Birdsin pelimekaniikkaa, Applen iOS:n, iPhonen ja iPadin yllättävää vaikutusta koko pelikulttuuriin ja -teollisuuteen edellisten viiden vuoden aikana jne. Kirjastoja hämmästellään jakson alussa, noin 3:30-6:00.

Mainituista peleistä suosittelen Space is keytä, joka on hyvää hupia vaikkapa siellä kirjaston tiskissä lusiessa.

Olisko kellään kokemusta PallasPron verkkokirjaston logien penkomisesta?

What's this then?

Onkohan kellään tietoa PallasPro-Intro -verkkokirjaston hakulogien tonkimisesta? Siinä ei käsittääkseni ole minkäänlaista raportointityökalua sinänsä, mutta ainakin sellaisilla kirjastoilla joilla on pääsy oman verkkokirjastonsa (aka näyttöluettelon aineistoluettelon aka OPACin) webbipalvelimeen on mahdollisuus tutkia sen logeja. Meidän (siis Vaskin) verkkokirjasto esittäytyy näin:

Server: PallasPro-Intro3 (liw3srvr kirjasto 13.6.2011 klo 12.10.03 HP-UX B.11.00 U II 2.0)

Onko kellään kokemusta tällaisen palvelimen logien tonkimisesta? Hakulausekkeethan eivät PallasPro-Introssa näy hakutulossivun URLissa vaan HTTP-headerissa. Onko tähän jotain työkaluja olemassa? Apachen logien tonkimiseen on vaikka mitä työkaluja, mutta tämä liw3srvr on mulle tyystin tuntematon.

Mikäli PallasPro-Intro juttelee taustajärjestelmän kanssa SRU:lla, tuon rajapinnan tarkkailu olisi toinen herkullinen paikka nuuskia mitä asiakkaat etsivät. Webbipalvelimen logista näkyy tosin kaikkea muutakin hauskaa.

Unelma: hakutuloksia seurattaisi systemaattisest päivittäin, ja tietoa hyödynnettäisi luetteloinnissa ja luetteloinnin apuvälineiden (esim. sanastot) kehittämisessä, kokoelmapolitiikassa, tapahtumien järjestämisessä ja käyttöliittymäsuunnittelussa. Näen asian niin, että tuohon PallasPro Intron hakulooraan asiakkaat kertovat tuhansia kertoja päivässä mitä he haluavat. Logien tutkiminen on tämän viestinnän kuuntelua. Näiden seuraaminen, tutkiminen ja julkaisu (sekä datana että jalostetusti) voisi minun mielestäni olla arkipäiväistä kirjastorutiinia.

Aloitin säikeen myös Kirjasto-kaapelilla.

Another day in the office

Oh dear, my cubicle is a mess

Today on 25th of July i participated in Library day in the life -campaign. This was already the 7th time for the campaign, and the idea that all sorts of library workers tell about their everyday job for a day (some are reporting all week). The background of the campaign is explained better elsewhere. Today afternoon when i started writing this there were 144 registered reporters and many, many more by the evening. Even more unregistered people were active, especially on tag #libday7 on Twitter.

Ok let’s get to the (everyday) business, this is what i do on this random day in the office:

Just before 9 when i arrived at the library office it seemed that the holiday-season was coming to an end as it seemed more lively than the previous few weeks at the Turku city library’s main building. This day i intended to read some ExLibris Primo documentation and see if i could come up with a way to generate lists of new titles from it via it’s servlet programming interface (API). We are piloting Primo in National Digital Library of Finland -project.

The morning didn’t go too well in that regard, that i was interrupted a few times (quite useful interruptions though, i’m not saying that). First we discussed with my boss how i could get my hands on the access logs of the online catalogue (OPAC) of our Vaski -libraryconsortia for doing some analysis of them. After that we agreed, that i am allowed to travel to and attend Online Information 2011 -conference (where i will be presenting), if i take unpaid leave for it.

11:20 a late morning coffee at the excellent Café Art around the corner.

After coffee i actually managed to spend about 30 minutes looking for and asking for the Primo documentation before the next interruption. This time i had to figure out my own extra salary (päivärahat) for the duration of the IFLA 2011 -conference, where i will be presenting my pet-project Cycling for libraries. I spent a little more than half an hour on this task of calculating my salary.

After that i downloaded primo4j, eyeballed it’s documentation and tried out an example program that came with it.

14 o’clock pasta at Café Sirius.

After food i opened the Primo CSS-stylesheet, which i haven’t really touched during all summer. I have the CSS under version control system (i’m using Bazaar aka bzr), and i reoriented myself to how i had arranged the files there. I also thought about how to organize CSS and other customizable components of the Primo user interface in a version control system (and issue management system), if we wanted to collaborate with other pilot-organizations of the National Digital Library. I wrote a proposal to our NDL-mailing list about finally getting together and starting a collaboration with some such tool.

At about 15:30 i found and installed a version of Firebug that is compatible with my version of Firefox, Firefox 6.0. I started to fiddle with the CSS, and tune it to look like what our ad agency KMG is building our Vaski-consortia’s new website to look like. So i was tuning the colours and layout of our navigation menu etc. It’s quite meditative, really.

I left the office a little after 18, i had tickets to an art performance (which was great, i may add).

Arkipäivä kirjastotyössä

Primon CSS:n säätelyä. Varjo-IT FTW! =)

Osallistuin tänään 25.7. Library day in the life -kampanjaan. Se järjestettiin nyt jo seitsemättä kertaa ja ideana on, että päivän mittaan erilaiset kirjastoihmiset kertovat arkipäivästään netissä; kamppiksen taustoja on selitelty tarkemmin muualla. Tätä kirjoittaessa meitä rekisteröityneitä on 144 kappaletta, ja rekisteröitymättömiä on varmasti enemmän, etenkin Twitterin #libday7 -tagilla.

Asiaan, eli sattumanvarainen maanantai kirjastoammattilaisen arjessa:

Vähän ennen klo 9 toimistolle saapuessani vaikutti, että lomakausi on pikkuhiljaa päättymässä ja toimistolla täällä Turun pääkirjastolla on jo hieman enemmän elämää kuin aiemmilla viikoilla. Tarkoitus oli lueskella Kansallisessa Digitaalisessa KDK:ssa pilotoitavana olevan ExLibris Primon dokumentteja sillä ajatuksella, että keksisinkö jonkun menetelmän tuottaa Primosta uutuusluetteloita sen servlet-ohjelmointirajapintojen kautta.

Aamupäivä meni tämän kannalta kuitenkin melkolailla harakoille muutaman (sinänsä ihan hyödyllisen) keskeytyksen vuoksi; ensiksi juttelimme pomoni kanssa miten saisin Vaskin -verkkokirjaston logeja tutkittavakseni ja sen jälkeen sovimme, että voin matkustaa Online Information 2011 -konferenssiin (jossa minulla on puheenvuoro), mikäli otan palkatonta lomaa.

11:20 viivästyneet aamukaffit mainiossa Cafe Artissa tuossa kulman takana.

Kerkesin etsiskelemään ja kyselemään noita Primon dokumentteja jonkin puolisen tuntia ennen seuraavaa keskeytystä: nyt oli tarpeen laskea päivärahat IFLA 2011 -konferenssiin osallistumisesta, johon menen esittelemään Cycling for librariesia. Päivärahojen selvittelyyn ja laskemiseen meni reilu puoli tuntia.

Sen jälkeen lueskelin latasin primo4j:n, selailin sen dokumentteja ja kokeilin sen mukana toimitettua esimerkkiohjelmaa.

Klo 14 ruokana pastaa Café Siriuksessa.

Ruoan jälkeen aloin katselemaan Primon tyylitiedostoja (eli CSS:ää), jolle en ole tehnyt oikeastaan mitään kesän aikana. CSS:t ovat minulla versionhallintajärjestelmässä, katselin vähän miten olen sen sinne aiemmin organisoinut ja mietin miten Primon CSS:ää (ja muuta käyttöliittämän muokkausta) olisi paras versionhallintajärjestelmään tallentaa, jos haluaisi tehdä sitä yhdessä muiden KDK-pilottien kanssa. Kirjoitin KDK-pilottien sähköpostilistalle ehdotuksen yhteisestä työkalusta tähän hommaan.

Noin klo 15:30 löysin sellaisen version Firebugista, joka toimii käyttämäni Firefox 6.0:n kanssa. Aloin säätämään KDK:n Primon Vaski-näkymää sen henkiseksi, millaiseksi käyttämämme mainostoimisto KMG on tekemässä uutta, kirjastokonsortiomme yhteistä verkkosivustoa. Säätelin siis Primon navigointivalikon värejä ja asetteluja. Se on oikeastaan aika tyydyttävää työtä.

Toimistolta lähdin hieman klo 18 jälkeen, sillä minulla oli lippu Salainen retki -esitykseen, joka on osa Elämyspuisto Turkua.

Millainen olis täydellinen tekstarimuikkari?

PallasPron lähettämä muikkari

Axiellin PallasPron tekstarimuikkarit näyttävät tällaiselta. Millainen olisi paras mahdollinen tekstarimuikkari? Henkilökohtaisesti ehkä kaipailisin sähköpostiosoitteen sijasta linkkiä verkkokirjastoon josta uusiminen onnistuu. Sähköpostiuusimisia meillä Vaskissa ei vastaanoteta. Olisi myös hienoa, jos tekstari tulisi numerosta 0600 02623, joka on uusintapalvelumme numero.

Axiellin kirjastojärjestelmien avoimilla Axiell Web Services (AWS) rajapinnoilla ja pienoisella lähettävän pään suunnittelulla uusiminen onnistuisi jopa suoraan tekstarista. Tällainen palvelu on mahdollista rakentaa, kun avoin AWS tulee saatavillemme, toivottavasti pian. Ehkä PIKI-alueella sekä Hämeenlinnassa onnistuisi jo tänään!

Lisäksi olisi kiva asiakkaana tietää paljonko maksuja on päässyt kertymään, sekä tietenkin mikä teos/mitkä teokset ovat myöhässä. Tekstarin pituus on rajoitettu, mutta tekstareita voi onneksi ketjuttaa peräkkäin. Mitä tietoa tässä sinun mielestäsi olisi hyvä olla?

Mulla ei valitettavasti ole nyt Origon, Milleniumin tai Auroran muikkareita. Arvostaisin jos te, joilla sellaisia on voisivat laittaa niitä näytille.

Kun kirjasto ahnehtii julkisomaisuuden levityskanavat itselleen [korjattu]

Tiedettä

[edit 22.07.2011 klo 00:40 kts alla ”Errata”]

Oletteko seuranneet tätä Aaron Swartz vs. JSTOR -jupakkaa? Erittäin herkullinen.

Perusidea on siis se, että tämä yksi heppu, nimeltään Aaron Swartz imaisi iltapuhteenaan JSTORista suunnilleen koko arkiston Philosophical Transactions of the Royal Society -julkaisua (lienee useimmille tuttu ainakin nimenä). Tavara on pakattu mukavaksi 33GB -paketiksi ja löytyy esim. täältä (tuosta löytyy myös naseva kirjoitus siitä, miten kamalassa tilassa kulttuuriperinnön saavuttaminen on). Tekijänoikeus ei tietenkään enää päde. Tekijänoikeutta ei oltu keksittykään Royal Societyn kirjoitusten alkuaikoina eli 1600-luvun puolessavälissä.

JSTOR on siis eräs palveluntarjoaja, joka myy tätä julkisomaisuutta olevaa tiedettä erilaisille tahoille, mm. kirjastoille. Ei siinä mitään. Mutta kun joku ns. ”ottaa” ”heidän” sisältönsä ja jakaa sitä muita reittejä, tämä onkin yllättäen ongelma.

Todettakoot vielä se, että JSTOR on voittoa tavoittelematon akadeemian sekä kirjastojen yhteistyöhanke.

W00t?

Errata

Nyt meikällä kärähti käämit ennenkuin luin riittävästi casesta. Homma meni siis kutakuinkin niin, että USA:n liittovaltion hallitus (federal government) vei Aaronin oikeuteen, eikä JSTOR. Syyte tuli pelkästä artikkelien lataamisesta, ei levittämisestä.

Levitykseen artikkelit tulivat Greg Maxwellin toimesta, joka halusi ne sekä manifestinsa julkaisemalla osoittaa solidaarisuutta Aaronille ja tuoda esille tieteellisen julkaisemisen nykytilaa… onnistuen siinä erinomaisesti.

Pahoittelen aiheuttamaani sekaannusta; mutta aika absurdi tilanne :\

Sarahin ja mun mobiili+AR -sessio Next Libraryssä Aarhusissa

Sarah ja Mace Next Library 2011:ssä, kuva Bo Fristed (kai)/Aarhusin kaupunginkirjasto

Pidimme Sarah Houghton-Janin (aka. The Librarian in Blackin) kanssa Next Library -konffassa, Aarhusissa session kirjastojen mobiilipalveluista. Olimme Sarahin kanssa aiemmin Facebookin kautta ja edellisenä tavatessamme sopineet, että Sarah esittelee augmented realityä (”lisättyä todellisuutta”) sekä erästä AR-hanketta jossa hän on ollut mukana, ja minä sanon muutaman valitun sanasen kirjastojen mobiilipalveluista yleisemmin ottaen.

Mindmappini Next Libraryn sessiostamme

Aloitusvuoron minä ja Sarah arvoimme kolikkoa heittämällä, ja vuoro lankesi minulle. Powerpointteja tai vastaavia esitysgrafiikoita en kokenut asiakseni tähän puheenvuoroon laatia, sen sijaan rakentamani muistiinpanot löytyvät mindmapina netistä jos niitä haluaa tutkia.

Aluksi halusin kiinnittää yleisön (ja myös blogini lukijoiden) huomion erittäin keskeiseen kirjastojen ”mobiilipalveluun”, eli ulos lainaamiseen. Tämän 1900-luvulla laajaan käyttöön tulleen palvelumuodon lähtökohta on sen tunnustaminen, ettei kirjasto ole aineiston käyttöön kaikkein paras paikka. Lainaamalla sen sijaan tuemme asiakasta siinä, että hän voi käyttää aineistoja siellä missä se on hänen omasta mielestään parasta (mökillä, bussissa, kotona, työpaikalla, matkoilla, jossain toisessa kirjastossa jne). Asiakas kyllä tietää itse parhaiten. Tästä perustavanlaatuisesta ”mobiilikirjastopalvelun” muodosta on paljon opittavaa!

Next Libraryssä esittämäni väittämä on, että kirjaston palvelujen tuottaminen älykännyköhin ym. mobiililaitteisiin on periaatteessa melko triviaali tehtävä… jota emme syystä tai viidennestä kuitenkaan ole saaneet aikaiseksi (syiden esiin kaivelu tehdään toisaalla). Kirjaston mobiilipalvelujen rakentamisen pitäisi käydä meidän kaltaisiltamme tiedon jäsentelyn ja käyttöönsaattamisen ammattilaisilta käden käänteessä. Ehdotinkin Aarhusissa, että me kirjastoammattilaiset kieltäytyisimme osallistumasta projekteihin, joissa yritetään käyttää yli 2 kuukautta mobiilien kirjastopalvelujen rakentamiseen. Mobiilisivuston sisältöjen suunnittelu onnistunee 10 minuutissa. Yli 2 kuukautta kestävät mobiilihankkeet – elleivät ole tyypillistä kunnianhimoisempia – loukkaavat ammattikuntaamme :^)

Kirjastojen mobiilipalvelujen rakentelun lähtökohta on nykyisten nettipalvelujen soveltaminen mobiilikäyttöön. Kirjastojen verkkosivujen tärkein sisältöhän kyllä tiedetään, eli aukioloajat, lainojen uusiminen, aineiston etsintä sekä kirjastojen yhteystiedot ja sijainnit. Näiden jo olemassaolevien verkkosisältöjen muokkaaminen mobiilikäyttöön pitäisi kyllä onnistua aika helposti, jo pelkkää CSS:ää hieman muokkaamalla pääsee pitkälle (KVG ”how to make website mobile” tms.).

Eräs mielenkiintoinen kokeilu olisi katsoa, kuinka helposti suurimman osan noista keskeisimmiksi tiedetyistä sisällöistä voisi laittaa näkyville suoraan kirjaston etusivulle! Suomalaisissa kirjastoissa nyt vallalla oleva webbisivustojen suunnitteluparadigma on tosin toisensuuntainen: etusivut toimivat fasadeina ja monimutkaisina navigointivalikoina eivätkä pyri tarjoamaan vastauksia tai ratkaisuja asiakkaiden elämään tai kirjastonkäyttöön.

Sarah Houghton-Jan esitteli vuorostaan erilaisia augmented reality -sovelluksia ja rakennelmia. Niitä olikin yllättävän suuri määrä ja suurin osa minulle tuntemattomia. Osalle olisi helposti nähtävissä käyttöä kirjastomaailmassa (esim. kirjastojen arkkitehtuurikilpailujen ne osallistujat, joita ei koskaan toteutettu), osa taas oli tehty spesifemmeistä lähtökohdista esim. jonkun organisaation käyttöön. AR:stä ei kyllä Suomessa paljoa kuule. Tai no, riippuu tietenkin miten termiä ymmärtää… onko Twitterin, Facebookin, Qaikun #seminaarikannun tms. käyttäminen tapahtuman backchannelina AR:ää? Älypuhelimen kartta? Foursquare? Geokätköily?

Turun keskustan kirjastot iPhonen kartan mukaan

Sarah käsitteli yleisön kanssa sitä, olisiko parasta rakentaa kirjastoille omia sovelluksia tai palveluja, vai pyrkiä mukaan jo olemassaoleviin, tunnettuihin palveluihin (Layars jne.). Sama kysymys on auki myös ns. tavallisten mobiilipalvelujen kohdalla – mene esim. älypuhelimesi kartta-sovellukseen, anna sovelluksen paikantaa sijaintisi, kirjoita hakukenttään ”kirjasto” ja hämmästy. Yleispätevää ratkaisua ei Next Libraryssä tähän löydetty, mutta N.I.H.:hon juuttuminen vaikuttaa hullulta.

Kaikenkaikkiaan näissä mobiiliasioissa on paljon hämärää termistöä, jonka pyörittely on antoisaa: miksei läppäreitä mielletä mobiililaitteiksi? Onko iPad rajatapaus? Mitä on ”mobiili kirjasto”? Spotifyn, Elisan e-kirjapalvelun, PressDisplayn ja Google Readerin mobiililiittymät varmasti lukeutuvat mobiileihin kirjastoihin, mutta entäs kirjaston aineistotietokanta? Oma lukunsa ovat sitten tietenkin kirjastoautot, joita niitäkin kutsutaan myös ”mobile libraryiksi”.

Sessiomme lopuksi pidimme vielä parinkymmenen hengen kanssa kävelykokouksen Aarhusin konserritalon ympäri, mobiilihengessä 🙂

Kiitos Sarahille session vedosta ja hedelmällisestä sparrausseurasta, Aarhusin Jannik Mulvadille esiintymään pyytämisestä ja kaikille Next Libraryssä olleille yleisesti vaan.

Vaskin asiasanat, jotka eivät ole YSAssa

Sanaston pengontaa

Kävin läpi Vaski-kirjastojen aineistotietokannan ja etsin asiasanat, jotka eivät esiinny tesauruksessa. Ohessa lista yleisimmistä:

esiintymien lkm termi
202 sotaromaanit
108 Lieto-kokoelma
100 korjausoppaat
66 eräkirjat
38 matkakirjat
29 sisustusoppaat
27 Suomen historia
23 kansanmusiikki: Venäjä
23 jouluaskartelu
22 posliinimaalaus
21 viihdetaiteilija : Suomi
21 salapoliisiromaanit
20 Yhdistyneet kansakunnat
20 kirjasto- ja informaatiopalveluala
20 1980-LUKU
18 vaateompelu
17 rock and roll
16 MURRENÄYTTEET
16 itämaiset taistelulajit
15 sosiaali- ja terveydenhuolto
15 rajavartiolaitos
15 paperiaskartelu
15 laivaluettelo
15 DVD-elokuvat
14 tiedeakatemiat
14 Suomen taideyhdistys
14 piirroselokuvat
13 tabulatuurinotaatiot
13 ranskalainen keittiö
13 nuorten aikuisten kirjat
13 Jeesus Kristus
13 äänentoistotekniikka
13 šamanismi
12 YKSINLAULU
12 vauvanhoito
12 Titanic
12 tilastollinen tutkimus
12 punk rock
12 kaupunkihistoriat
12 historia : 1900-luku
12 arabialainen musiikki
12 1960-luku
11 tšekin kieli
11 säveltäjät : Suomi
11 rentoutuminen
11 muodin historia
11 kuultokudos
10 varastaminen
10 Uusi testamentti
10 taitelijat
10 seminaarit (kokoukset)
10 samanismi
10 rockmusiikki
10 kiinalainen keittiö
10 1800-LUKU

Ohjelman (kts. alla) antamista tiedoista näkee myös, että esim. asiasana muodin historia (jota ei ole YSAssa) esiintyy Vaskin tietueissa Ppro853_137785, Ppro853_541141, Ppro853_541143, Ppro853_541144, Ppro853_541145, Ppro853_541146, Ppro853_541634, Ppro853_561083, Ppro853_561086, Ppro853_561087 sekä Ppro853_561088.

Eri asiasanoja joilla on vain yksi esiintymä Vaskissa löysin 1761 kappaletta. Kymmesti esiintyviä asiasanoja on kahdeksan kappaletta. Miten tällaista dataa olisi parasta havainnoillistaa? Ideoita vastaanotetaan.

Vaski on FinMARC 1998 -muotoa ja kyseisen standardin mukaan kentässä 652 olevat asiasanat ovat peräisin Yleisestä suomalaisesta asiasanastosta, eli YSA:sta (kansainvälisessä MARC21:ssä asia ilmaistaan hieman toisin, kuvaamalla asiasanakenttien osakentässä ‡2 mikä sanasto on kyseessä, tyyliin 650 #7 ‡a bibliografinen valvonta ‡2 ysa).

Tein aiemmin pienen työkalun jolle voi antaa yksittäisiä MARC-tietueita ja se kyselee ONKI-palvelun ohjelmointirajapintaa (APIa) käyttäen ovatko tietueen asiasanat YSO-ontologiassa. Kun YSA julkaisiin vastikään avoimena datana, tuli nyt tekemäni massakäsittely helpommaksi. Työn voi nykyään tehdä omalla koneella, pommittamatta ONKIn rajapintaa noin suurella kyselymäärällä.

Prosessi

Noukin ensin YSA:n SKOS-muotoisesta tiedostosta varsinaiset sanat (prefLabel ja altLabel) tekstitiedostoon yhdeksi pitkäksi, pitkäksi listaksi. 14.6.2011 lataamassani tesauruksessa oli 36991 termiä.

Sekä MARC-data että sanasto ovat saatavilla myös XML:nä, jonka käyttäminen olisi oikeaoppisempaa, mutta en nyt jaksanut säätää niiden kanssa sillä XML:n käsittelytyökalut ovat minulle aika tuntemattomia. Sensijaan olen tottunut operoimaan unixin komentoriviltä ja opettelen myös Perliä.

Tässä kirjoittamani Perl-kielinen ohjelma jota käytin:

#!/usr/bin/perl

use MARC::Batch;

my $file = "vaski-kunnostettu.mrc";
my $batch = MARC::Batch->new('USMARC', $file);
my $sanasto = "~/ysa.lista.alt_too";

$batch->strict_off();
while (my $record = $batch->next()) {
        for my $termi ($record->subfield('652', 'a')) {
        if (system("grep -q -i \"$termi\" $sanasto")) {
            print($termi, ";", $record->field('001')->as_string,"\n");
        }
    }
}

Kuten ehkä huomaat, tämä on hyvin kaukana elegantista. Ensinnäkin käsiteltävät tiedostot on nimetty ohjelman sisällä ja toisekseen kukin termi etsitään sanastosta käyttäen ulkoista ohjelmaa. Tämä aiheuttaa yhden forkin per asiasana, joka on huono asia. Oikeasti vertailu pitäisi tehdä tämän ohjelman sisällä, lukemalla asiasanat tiedostosta yksiulotteiseen taulokkoon tai listaan. Mutta toimii tämä näinkin, kun huonoa ohjelmistosuunnittelua voi korvata prosessoriteholla 🙂 Miniläppärini (joka on ainoa käyttämäni työväline) rouskutteli tätä useita tunteja.

Mutta tämän ei olekaan tarkoitus olla eleganttia. Tämän on tarkoitus osoittaa kirjastoammattilaisille, että me itse voimme ottaa aloitteen käsimme sen sijaan, että odottelemme että järjestelmätoimittajamme tekee kivoja asioita puolestamme (sitä on turha odotella).

Vielä pari huomiota laatimani menetelmän puutteista: se ei huomioi asiasanaketjuja, ja tuon kaltainen huoleton merkkijonojen etsintä johtaa vääriin tuloksiin mikäli etsittävä epäkelpo asiasana esiintyy osana kelpoa asiasanaa. Tälle asialle pitäisi todella tehdä jotain.

Mitä välii?

Ymmärtääkseni kaikkien 652-kentässä olevien termien pitäisi olla peräisin YSA:sta. Näin sanoo myös FinMARC -formaatti. Asiasanoja joita ei YSAssa ole, ei pitäisi käyttää ainakaan kyseisessä kentässä. Kuten tiedämme, ei asiasanasto kuvaa kaikkia maailman ilmiöitä. Siksi paikallisille sanastoille onkin tarvetta.

Minua paremmin luettelointiin perehtyneet tietänevät mitä sisällönkuvailussa oikeasti kuvaillaan. Jossain lienee sovittu, onko sisällön lisäksi aiheellista kuvailla muotoa. Esim. Vaskissa käytetään termejä ”Nintendo Wii”, ”sotaromaanit” ja ”elämäkerrat” kuvailemaan muotoa. Nämä teokset eivät kerro Nintendon Wii-peleistä, sotaa kuvaavista romaaneista tai elämäkertojen kirjoittamisesta, vaan ovat niitä. Ehkä tämä on ookoo – en jaksa nyt lueskella luettelointisäännöstöä asiaa tarkistaakseni enkä muista ulkoa mitä siellä sanotaan. Mutta ei ole vaikea nähdä että tämä on problemaattista. Ihmettelin samaa asiaa aiemmin, kun mietin minkähänlaista olisi “ihan oikea kirjastotyö” pelien parissa?

Mainiot luetteloijat ovat arvatenkin tämän muoto vs. sisältö -asian ratkaisseet jollain sopimuksella (joka siis lienee kirjattuna luettelointisääntöihin). Käytännössä ainakin Vaskissa kuvaillaan surutta sekä muotoa että sisältöä 652 -kentässä.

Tässä on muitakin mielenkiintoisia puolia: MARC-tietueessa ei esimerkiksi ole mitään tietoa siitä, mitä YSAssa on ollut tietueen luontihetkellä. YSA muuttuu ajan myötä, kenties osa nyt listaamistani termeistä on ollut kyseisen luetteloijan käyttämässä YSA:n versiossa luettelointihetkellä… MARC-tietueesta itsestään puuttuu tällainen tekninen metadata.

Kirjoitusvirhe luetteloinnissa on fataali virhe, ja teos katoaa kyseisen aiheen kannalta mustaan aukkoon. Varsinaisia kirjoitusvirheitä löysin Vaskista onneksi vain ihan muutaman.

Monet löytämäni, YSA:n ulkopuoliset termit ovat hyvin käytännöllisiä ja olen oikeasti onnellinen että niitä on tietueisiin luettelointisääntöjen vastaisesti tallennettu. Tämä kertoo sanaston puutteellisuudesta ja myös luokitusjärjestelmän puutteista, sekä kirjastoihmisten omatoimisista ongelmanratkaisupyrkimyksistä. Se on tietenkin aivan oikein. Nämä itse keksityt termit voisi eristää omaan sanastoonsa, jolla YSAa täydennetään, ellei ole YSAn tarkoituksenmukainen ylläpito ole mahdollista. Lisäksi meillä on käytettävissämme useampia sanastoja YSAn rinnalla ja niitä olisikin hyvä käyttää MARC-tietueen sellaisissa paikoissa, jotka eivät ole YSAlle varattuja.