Noni ne YKL:t, HKLJ:t, DDC:t, UDK:t ja muut roskasysteemit hiiteen jo ja tästä mallia!
Kyllä arkkitehti (rakennussellainen tai sisustussellainen, ei tietojärjestelmäsellainen) tietää.
(via Benjamin Blinten)
Tämä kirjoitus käsittelee ATK:ta. Uskon että automaattisella tietojen käsittelyllä olisi kirjastoille annettavaa. Olen kaavaillut jotain menetelmää visualisoida kirjastokokoelmia. Olen onnistunut keräämään aiheesta muutaman datasetin, mutta varsinainen työ on jäänyt tekemättä, uloslukien analyysi Helsingin kaupunginkirjaston aihepakettien ajallisesta kattavuudesta. Sitäpaitsi en tiedä tilastoanalyysistä yhtikäs mitään. Mutta pyrkimyksenäni on ollut todistaa, että sitä voidaan tehdä heti kun haluamme.
Minusta tällainen on tärkeää.
Tänään jostain syystä innostuin, ja laadin kuvatukset kahden suunnilleen saman kokoisen Varsinais-Suomalaisen yleisen kirjaston kokoelmien luokkien jakautumisesta.
Suurimmat luokat ovat
Toisen kirjaston kokoelma näyttää tältä, ja suurimmat luokat ovat
Näistä on leikattu pois kaikki luokat, joissa on alle 100 tietuetta. Voisi olla hyödyllisempää rajoittaa esim. luokan syvyyden perusteella vaikkapa pääluokkiin tai yhteen desimaaliin. Huomaa, että tässä olevien kuvajaisten värit eivät korreloi toistensa kanssa, vaikka vertailua ajatellen se olisi erittäin mukavaa. Lisäksi pikaisesti laatimani kuvajaiset ovat karseita lukea (voit kuitenkin avata kuvat isompina niitä klikkaamalla) ja ohjelmakoodissakin olisi paljon kehitettävää… itse asiassa laatimani ohjelma on erittäin karu, eikä edes piirrä noita kaavioita automaattisesti vaan tein ne itse taulukkolaskentaohjelmassa. Mutta kaavioiden tekeminen ohjelmallisesti ei todellakaan ole mikään ongelma. Niitä voisi laatia esim. GC-ohjelmointikirjastoa (ilmainen ja avointa lähdekoodia) tai gnuplotia (ilmainen ja avointa lähdekoodia) käyttäen. Molempiin löytyy tietenkin Perl-rajapinta (ilmaisia ja avointa lähdekoodia).
Käyttäjäystävällisyyden vuoksi nuo yleisen kymmenluokituksen (YKL) numeeriset kentät voisi suoraan automaattisesti muuntaa luokkien nimiksi; se onnistuisi ykl.kirjastot.fi -palvelua käyttäen. Kuvioiden tuijottelu olisi hauskempaa.
Käytin tähän MARC-siirtomuodossa olevia tietokantadumppeja, ensimmäisessä on noin 200 000 tietuetta ja toisessa 280 000. Molemmat sisältävät osakohteet. Poimin kummastakin dataläjästä 054‡a -kentät ja laskin eri arvojen määrät. Tuon datan käsittelyyn menee pieneltä, kohta pari vuotta vanhalta miniläppäriltäni noin 15 minuuttia yhteensä.
Mitä näistä voidaan päätellä? Ei ehkä mitään. Mutta ehkä jotain. Ainakin voidaan päätellä se (no tämänhän kaikki jo varmasti tietävätkin), että kokoelmanhallinnan työkaluja voi kehittää itse helposti ja ilmaiseksi. Ideoita ja työkaluja riittää niin paljon kuin haluaa. Lisäksi voidaan päätellä, että luetteloinnin on oltava hyvää, jotta tässä — tai tiedonhaussa yleensäkään on mitään järkeä. Mutta senkin me tiedämme jo erittäin hyvin.
Tuollaiset kuvajaiset voitaisi hyvin helposti (=automaattisesti ja halvalla) tehdä viikottain jokaiselle suomalaiselle kirjastolle. Ajan oloon nähtäisi miten kokoelmat ovat eläneet. Todella hyödyllistä olisi tehdä rinnalle vastaava analyysi asiakkaiden tekemistä lainoista ja katsoa miten ne korreloivat kirjaston kokoelmien kanssa.
Meillä on ollut kaikki tähän tarvittavat työkalut ilmaiseksi saatavilla vuosikausia. Vuosikymmeniä jopa! Itse käytin tällä kertaa Perliä (ilmainen ja avointa lähdekoodia), MARC::Record -moduulia (ilmainen ja avointa lähdekoodia), OpenOffice Calcia (ilmainen ja avointa lähdekoodia), Gimpiä (ilmainen ja avointa lähdekoodia), geditiä (ilmainen ja avointa lähdekoodia) sekä GNU/Linuxiin (ilmainen ja avointa lähdekoodia) perustuvaa Ubuntua (ilmainen ja avointa lähdekoodia). Koneelliseen käsittelyyn kehitetty MARC-luettelointiformaatti meillä on ollut olemassa 1960-luvulta.
Tätä ominaisutta et muuten löydä Axiell Aurora tai Innovative Millenium -järjestelmistä.
[edit 02.01.2011 katso myös Anna-Liisan Kirjasto-kaapelilla aloittama Tilastot kokoelmien hoidon tukena (credit: mace)]
Marras- joulukuu meni Lassilan Matin kanssa 23 asiaa -kurssia vetäen, mukana tällä kertaa 30 HelMet -alueen kirjastolaista. Langanpäitä (tehtävien tarkistus, palkintojen jako sekä pääpalkinnon arvonta) selvitellään vielä tässä alkuvuodesta. Kurssi on tietenkin lähtökohtaisesti verkkokurssi (vrt. veiston opetus järjestetään veiston luokassa, kemian opetus kemianluokassa→verkkokurssi verkossa) mutta kurssin myötä pidetään myös kaksi lähipäivää ja näistä jälkimmäinen on huomenna torstaina.
Istuskelen nyt Sellon kirjastossa keräilemässä huomenna käsiteltäviä kirjoituksia osallistujien blogeista. Tämänkin kurssin myötä on muodostunut vähintään pienen kirjasen verran tekstiä, jossa kolmekymmentä kirjastoammattilaista kertovat omakohtaisesta suhteestaan kurssiin itseensä, sen myötä käsiteltyihin aiheisiin, opiskeluun, toisiinsa, harrasteisiinsa ja yleisiin mielenkiintonsa kohteisiin, työnsä muuttumiseen, bloggaamiseen, internetiin ja yhteisölliseen mediaan sekä luonnollisesti kirjastoon. Olen niin ylpeä heistä; internet on taas hivenen parempi paikka! 8)
Asiaan todellakin liitty James Burke. Hän on Hyvä Jätkä. En tiedä muuten, mutta hän teki BBC:lle dokumenttisarjan Connections. Dans Hardcore History -podcastin jaksossa A Fly on James Burke’s Wall hän juttelee kaikenlaista mielenkiintoista siitä miten asiat ovat sidoksissa toisiinsa. Uskon että kuten minäkin, myös James tykkää hyperlinkistä.
Numerologiassa numero 23 voidaan liittää melkein kaikkeen. Kirjastolainen voi liittää sen esimerkiksi YKL:n luokkaan Dogmatismi. Kristillinen etiikka. Legendaarisen bibliografin Paul Otletin sekä Henri La Fontainen kehittelemässä Universal Decimal Classification -järjestelmässä 23 on Religions originating in Indian sub-continent. Hindu religion in the broad sense. 023 on sensijaan Library administration. Staff. Personnel. 02(3) tarkoittaisi antiikkisia tai keskiaikaisia kirjastoihin ja kirjastotieteeseen liittyviä paikkoja. 02=3 tarkoittaisi kirjastoihin ja kirjastotieteeseen liittyviä, tuntemattomia ja kuolleita kieliä. Ajatuksen juoksu taisi juuri kääntyä osoittamaan itseään.