PIKI-kirjastojen tietokantapöyhintäni lähdekoodi, työpäiväkirja ja raportti julkistettu

BaseX:llä ja XQueryllä MARC21 -tietueiden kimpussa

Tein marras-joulukuussa freelancena töitä PIKI-kirjastoille tietokannan  siivouksen parissa. Pöyhin about 2 miljoonaa MARC21 -tietuetta kokonaan kirjastojärjestelmän (Axiell Aurora) ulkopuolella ja hauskaa oli. Lisäksi suunnittelin miten kirjastojärjestelmän ulkopuolella tehtyjä muutoksia voi tuoda tuotantotietokantaan ym. ym.

Projektin- ja asianhallintaan käytin Kirjastot.fi:n tarjoamaa Redmineä, ja käytin sitä myös työpäiväkirjanani. Avasin sen julkiseksi ja se on siis kaikkien nähtävissä. Tonkimiseen paras alku lienee lista kaikista issue-trackeriin merkityistä asioista. Kaikki kirjoittamani XQuery -kielinen lähdekoodi löytyy sensijaan GitHubista ja minua, sinua ja lähdekoodia suojaa GNU GPL-lisenssi. Työpäiväkirja ja lähdekoodi ovat mielestäni mielenkiintoisimmat dokumentit työstäni ja analyyseistä. Laadin myös raportin, joka löytyy Google Docsista, jossa sitä voi myös kommentoida.

(: Check all classification fields which claim to get their value from
YKL classification systems, see if they are really define there. Based
on my screenscraped YKL :)

declare namespace srw="http://www.loc.gov/zing/srw/";
declare namespace marc="http://www.loc.gov/MARC21/slim";

declare variable $yklres := fn:doc('ykl.xml');
declare variable $ykl := $yklres/ykl/class/@no/data();

<yklClasses>{
for $field in /records/record/srw:recordData/marc:record/marc:datafield[@tag="084"]
  let $classNo := $field/marc:subfield[@code="a"]/data()
  where $field[marc:subfield[@code="2"] = "ykl"]
  return <yklClass
    inYkl="{if ($classNo = $ykl) then 'true' else 'false'}">{
      $classNo
  }</yklClass>
}</yklClasses>

Esitelmöin ja toivottavasti myös demoan hommiani Kansalliskirjaston järkkäämillä sisällönkuvailun tiedostuspäivillä lounaan jälkeen keskiviikkona 20.3.2013 Helsingin yliopiston päärakennuksen pienessä juhlasalissa. Päivillä on muutakin mukavaa ja mielenkiintoista aihetta tarjolla. Tilaisuuteen voi osallistua etänä, ja webinaari ilmeisesti myös taltioidaan. Toivottavasti siellä tavataan.

Mainokset

Kirjastojärjestelmät vai kirjastot ilman järjestelmää

Joulutontun tehtävää toimittanut kuriiri toi juuri himaan tekijäkappaleeni Jarmo Saartin ja Pirjo Tuomen toimittamasta Kirjastojärjestelmät vai kirjastot ilman järjestelmää -teoksesta (Avain, 2012, ISBN 978-951-692-947-0). Toimittajien lisäksi tekstiä on Juha Hakalalta, Ari Rouvarilta, Petri Tonterilta, Ari Mäkirannalta, Sami Varjolta, Lea Tastulalta, Vesa Suomiselta, Ari Haasiolta ja hieman myös allekirjoittaneelta. Osaltani haluan kiittää kaikkia prosessista, ja kehoitan blogin lukijoita tutustumaan näihin erittäin hyviin, ajankohtaisiin ja todelliseen kokemukseen pohjaaviin teksteihin.

Omasta mielestäni mielenkiintoisin oma argumenttini on se, että kirjastojärjestelmän käyttäjäyhteisö on osa ko. järjestelmää, ja tämä tulisi huomioida hankinnassa. Lisäksi tuossa on muutama sanaseni siitä, mitä sosiaalinen media merkitsee kirjastoalan sisällä (vrt. asiakkaille mainostaminen). Muut kirjoittajat kertovat esim. Kohasta ja Evergreenistä, KDK:sta, Melindasta, musiikkiin liittyvästä tietopalvelusta sekä sen työn auttamisesta luetteloinnin ja verkkokirjaston avulla, selailunäkymistä sekä norsuista. Avoin lähdekoodi, avoimet rajapinnat ovat tietenkin keskiössä, koska kirjastot haluavat saada asioita aikaan.

Siis joululomalukemistoa parhaimmillaan. Sain kaksi tekijäkappaletta, laittakaa esim. sähköpostilla tai fesessä postiosoitteenne, niin voin postittaa toisen lainaan (joo kyllä, lainaaminen on mahdollista ilman kirjastojärjestelmääkin).

Sillävälin YLEllä: ontologiat+Onki+Drupal+avoin lähdekoodi

YLE

Drupal

Onki-ontologiapalvelu

YLE käyttää Drupal -julkaisujärjestelmää monissa sivustoissaan. Ilahduin kovasti, kun viime lauantaisessa DrupalCampissa Isolla pajalla Teemo Tebest esitteli Svenskalle kehitettyä Drupal-moduulia, joka helpottaa YLEn sisällöhallintaa.

Resource Description Framework

Drupalhan ymmärtää itsekin semanttisen webin perustana olevaa RDF:ää, mutta nyt nähty moduuli on kirjastomaailmasta katsellen erityisen kiinnostava; moduuli yhdistää Drupalin Onki -ontologiapalveluun. Näin YLEn sisällöntuottajat voivat noukkia ontologioista sisältöään kuvailevia termejä. Kirjastoihminen voisi kutsua tätä vaikkapa luettelointi 2.0:ksi tai auktoriteettikontrolli 2.0:ksi. Vastaavaa ei meidän alallamme Suomessa tehdä kuin Kirjasammossa SAHA-annotaatioeditorilla. DrupalCampissa puhuttiinkin hieman myös siitä, sekä Onkin ja ontologioiden ylläpidon tulevaisuudesta.

YLE on avoimen lähdekoodin hengessä julkaissut moduulin Drupal.org:issa, jossa se on paraikaa menossa Drupal-yhteisön vertaisarviointiprosessin läpi. Moduulin lähdekoodi on jo saatavissa tarkastelua ja muutosten tekoa varten.

Viimeaikaisten järjestelmäkehitysten myötä kirjastot ovat ottaneet lähinnä takapakkia auktoriteettikontrollin ja muunkin automaattisen tietojenkäsittelyn osalta, mutta hienoa nähdä että tietotyön ammattilaiset toisaalla, esim. juuri YLEläiset, ottavat metadatan, avoimuuden ja muulla tehtävän metadatatyön (esim. ontologiat) näin vakavasti ja kunnianhimoisesti. Pisteet YLElle (taas)!

[edit 24.09.2012: upotin videotaltioinnin tähän mukaan, Teemo aloittaa kohdassa 16:30]

Lukekaa Petrin katsaus KDK-katsaukseen

Lukekaa Petrin kirjoitus KDK:n asiakasliittymä : missä mennään, millä mennään. Hyvä Kansalliskirjaston Alli-toimisto, lisää tätä kaikkialle ympäri meidän alaa heti nyt tänään.

Axiell saa palautetta; miten parannettaisi tilannetta?

Axiell

Ei kannata missata Kirjastot.fi:ssä käytävää keskustelua Axiellista sekä PIKI-alueen verkkokirjastouudistuksesta. Heikki Poroila aloitti blogissaan otsikolla PIKI-uudistus Tampereella epäonnistunut – asiakaspalaute murskaavaa ja sittemmin keskustelua on käyty Kirjasto-kaapelin puolella.

Jos minulla olisi kirjasto, se olisi varmasti Auroraton ja luultavasti Arenaton. Kirjastojen ja yritysten suhde on kiusallinen, eivätkä kirjastojen suhteet Axielin kanssa tunnu kuulopuheideni mukaan olevan kovin lämpimät. Tämä varmaan tiedetään Axiellissa kyllä, mutta itselleni lähinnä HelMetin Innovative -umpiossa kasvaneena epäluottamuksen määrä on kuitenkin ollut yllätys. Tilanne ei tietenkään ole kenenkään etu, ei kirjastojen, ei Axiellin eikä Suomen kansan etu.

Hyvä kuitenkin että tätä keskustelua käydään. Eilen taas seikkailin avoimen lähdekoodin maailmassa, ihailusta pakahtuneena. Aivan eri maailma. En nyt tarkoita tuotteita (siis tietokoneohjelmia) vaan avointa lähdekoodia kokonaisuudessaan. Mitä tapahtuisi jos avaisimme Axiellin kanssa tai ilman Axiellia jonkun issue trackerin, jonne dokumentoisimme ohjelmistohankkeitamme? Voisimme tehdä sen heti, siihen ei kauaa menisi sillä Kirjastot.fi on pitkään tarjonnut alallemme keskitettynä projektinhallintatyökaluna Redmineä.

Julkiset ongelmien raportointi-, dokumentointi- ja seurantatyökalut ovat olleet arkea avoimen lähdekoodin maailmassa vuosikausia. Vaikka Axiellin Arena ja Aurora -tuotteet eivät avointa lähdekoodia olekaan, voisimme aivan hyvin valita tehdä projektinhallintaa avoimesti, mieluusti Axiellin kanssa yhteistyössä.

Tässä vielä täydellisyyden (ja tautologian) vuoksi Kirjasto-kaapeli -foorumille kirjoittamani haaste:

Hyvää keskustelua täällä. Mutta hmm-hmm miten voitaisi parantaa tilannetta?

En tiedä moniko meistä tuntee esim. issue trackereiden kaltaisia projektinhallintatyökaluja enkä tiedä millaista ohjelmistoprojektien hallintaa Axiell sisäisesti tekee, mutta ehdotan, että avaamme julkisen issue trackerin.

Kirjastot.fi on jo pitkään tarjonnut Redmine -ohjelmistoa kirjastojen erilaisiin projektinhallintatarpeisiin, olen itse käyttänyt sitä 23 asiaa -verkkokurssin ja Suomen EuropeanaLocal -hankkeen yhteydessä. Redmine on ihan hyvin toimiva ongelmapohjaiseen projektinhallintaan, tosin en ole mikään projektinhallinnan ammattilainen enkä ole aktiivisesti käyttänyt montaakaan vastaavaa ohjelmistoa. Avoimen lähdekoodin maailmassa joitain yleisesti käytettyjä ovat Bugzilla, Launchpad, Trac (mm. Europeana), SourceForge, Google Code, Redmine.

Tällaisethän ovat tuolla ”Oikeassa Maailmassa”, kirjastokuplamme ulkopuoellla aivan arkipäiväisiä ohjelmistonkehityksen työkaluja. Avoin lähdekoodi ei ole edellytys tällaisen järjestelmän käyttämiseen (vaikka avoin lähdekoodi on tietenkin parempi asia kuin estetty lähdekoodi).

Vaski-kirjastoissa ollaan ottamassa käyttöön Auroraa. Asiakasliittymäksi tulee KDK, jota pilotoimme. Henkilökohtaisesti olen valmis sitoutumaan yllä kuvailemani kaltaiseen järjestelyyn käyttää jotain issuetrackeriä. Itseasiassa olisin hyvinkin kiinnostunut jos me Axiell -tuotteita kehittävät kehittävät päättäisimme ottaa tuollaisen jokapäiväikseksi työkaluksemme ja yhteistyöalustaksemme.

Olisiko kiinnostuneita? Tämä on erityisesti suunattu kollegoilleni Vaski-kirjastossa, Axiellille ja Kansalliskirjaston kirjastoverkkopalveluyksikölle, sekä mukaan haluaisin tietenkin kollegoita muualtakin jossa Axiellin kanssa toimitaan. Äkkiseltään tuntuisi hyvältä perustaa omat issue trackerit Axiellin Auroralle ja Axiell Arenalle, ja KDK:llekin olen kaipaillut sellaista. Miten on?

Analyysi Helsingin kaupunginkirjaston aihepakettien ajallisesta kattavuudesta

Kirjasto on kertomus. Nimenomaiseen kertomukseen sisältyy väite, että kirjasto tuo esille kirjallisuuden (ym. julkaisujen) niin kutsuttua pitkää häntää. Siis pitämällä käytössä ja nostamalla esiin aineistoa, johon ei yksittäisinä julkaisuna kohdistu suurtakaan mielenkiintoa, mutta joka on määrällisesti laajaa.

Viime viikolla tuli mieleen, että Helsingin kaupunginkirjaston aihepakettien tonkiminen toisi tähän ehkä jotain valoa. Aihepaketit ovat sikäli mielenkiintoinen tutkimuskohde, että niiden laatimista ei ole keskitetysti juuri ohjattu; päin vastoin laatijoilla on vapaat kädet vinkata haluamaansa aineistoa, ja koko henkilökunta on pakettien kokoamiseen tervetullut. Näin voitaisi ajatella, että aihepaketit heijastavat kirjastoammattilaisten omaa näkemystä tällaisesta vinkkaamisesta ja aineiston esiin tuonnista, eikä organisaation näkemystä.

Koodasin ihmeellisillä bash-taidoillani pari loitsua, jotka käyvät hakemassa aihepakettien web-sivut kaupunginkirjaston julkaisujärjestelmässä asustavasta aihepakettiarkistosta, tonkivat niistä linkit pääkaupunkiseudun näyttöluetteloon HelMetiin ja käy vielä poimimassa sieltä ns. xrecord-tiedostot, jotka ovat XML-muotoisia MARC 21 -tietueita. Sieltä löytyy kenttä 260‡c, eli Julkaisu-, jakelu- jne. aika. Työkalusettinä minulla on perinteinen unix-varustus tyyliin sed, wget ja libxml:ään nojaava xpath. Logiikka on toteutettu bashillä. Oikeasti minun pitäisi opetella Perl-ohjelmointia juuri tällaista toimintaa varten.

Toivoin tällä tutkimuksella osoittavani, että toisin kuin yleensä tykätään toisella, kirjastolaiset oikeasti nostaisivat näissä paketeissa esille lähinnä uutta materiaalia. Ajattelin etukäteen, että ehkä 80% kohdistuisi viiden edellisen vuoden aikana julkaistuun aineistoon. Valitettavasti (tai siis onneksi) jouduin pettymään, sillä läpikäymäni aihepaketit todellakin nostivat esiin suuren määrän vanhempaa aineistoa!!

Kävin läpi vain vuosien 2010 ja 2009 aihepaketit. Tältä vuodelta on 16 aihepakettia, viime vuodelta 43. Tekemäni työkalu löysi näistä suoria viitteitä teoksiin 186 ja 747 kappaletta.

Alla tulos:

Vaikka painoa kertyykin huomattavasti viiden edellisen vuoden julkaistulle aineistolle vuonna 2009, ei käyrä ole ollenkaan niin jyrkkä kuin olin kuvitellut. Paljonkos se kirjan keskimääräinen aika kirjakaupan hyllyllä onkaan? Jotain 6 kuukautta tai jotain?

X-akselin otsikot ovat tässä aika pientä tihrua, mutta akselilla on sata vuotta julkaisuja vuodesta 1910 alkaen. Suurempi, paremmin luettava versio kuvasta löytyy Flickristä. Nyt nappaamani datat sekä työkalun saa minulta jos haluaa. Tai voin jatkaa työtä jos se jotakuta kovasti kiinnostaa ja siitä olisi kirjastoaatteen ja maailman hyvyyden kannalta iloa.

Mistään käyttämistäni työkaluista ei kiitos kuulu järjestelmätoimittajillemme (Innovative Interfacesin Millenium, Sinisen Meteoriitin Meteor). Ne eivät tarjoa mitään työkaluja tällaiseen tietojen ynnäilyyn eri lähteistä. Kiitos kuuluu sen sijaan avoimen lähdekoodin kansainväliselle yhteisölle, joka on kymmeniä vuosia herkeämättä tuottanut joustavia, tehokkaita, ilmaisia ja vapaita työkaluja, joita ilman maailma olisi erittäin erilainen kuin on. Kiitos.

Samalla menetelmällä ja tekemieni työkalujen avulla voi piirrellä erilaisia graafeja. Esim. käppyrän voisi rajoittaa vain tieto- tai kaunokirjallisuuteen tai vaikka musiikkiin. Myös aiempien vuosien käppyrät voisi piirtää. Aihepaketteja on nyt yhteensä 209, vuodesta 2006 lähtien. Tekemäni työkalusetti ei ole todellakaan täysautomaattinen (tosin tämä proof-of-concept todistaa, että työkalun voisi kehittää sellaiseksi), mutta pointti on, että meillä kirjastoilla on kaikenlaista dataa, jota voimme tutkia jos haluamme. Tämän tekemiseen meni noin yksi työpäivä, mukaan lukien tämä blogikirjoitus.

Ajallinen näkemys pitkään häntään on yksi tapa katsoa asiaa. Jos myös kirjastojen lainaustilastot olisivat saatavilla (kuten niiden pitäisi olla), voitaisi vastaavalla tavalla selvittää vaikkapa kuinka paljon kirjastolaiset nostavat esiin aineistoa jota ei lainata paljoakaan.

Kohan suomennos on nyt jossain vaiheessa

Tässä talven mittaan on ollut meneillään epämuodollinen ja aika impulsiivinen Kohan suomennos. Vielä keskeneräinen käännös on nyt jonkin aikaa ollut näkyvillä Labs.kirjastot.fi:n tarjoamassa Koha-asennuksessa , eli osoitteessa http://koha.kirjastot.fi. Se on toiminnalliselta puolelta melkolailla suomenkielinen. Kommentteja vastaanotetaan.

Aineistona tuossa Koha-asennuksessa on Project Gutenbergin sisältö. Auktorisoitua asiasanastoa ei tässä vaiheessa tosin ole, sellainen tarvittaisi kyllä sekä suomennoksen testaamiseksi että muutenkin. Onko kellään ideoita miten sellaisen saisi haltuunsa ja miten sen kikkailisi Kohaan? Periaatteessa yksi hailee mikä asiasanasto, mutta YSA olisi varmaan käytännönläheisin Kohan testailuun. Pitäisi varmaan fiilailla tuota testi-Kohaa parempaan esittely- ja demoilukuntoon.

Aloitin myös KirjastoWikiin sivun Kohan suomentamisesta.

Ja kysytäämpä vielä täälläkin: mikä sinusta on ”tag” suomeksi? ”Tagi”, ”tägi” ja ”avainsana” ovat ne ilmeiset ehdokkaat. Merkkasin nuo KirjastoWikissä olevaan termitaulukkoon, käykääpä äänestämässä tuon termin suomennosta laittamalla plus- (+) tai miinus (-) -merkkejä tuohon taulukkoon. Samalla voi kurkistaa ko. wikisivun rinnalla käytävää keskustelua.

Jos ei vielä ole selvää, niin Koha on avoimen lähdekoodin kirjastojärjestelmä. Siis vähän niin kuin PallasPro, Origo, Voyager, Aleph, Innovative Millenium ja tuleva Axiell Aurora, mutta ohjelman toiminta ei ole salaisuus. Esim täältä voi katsoa ja muokata miten haku ihan oikeasti toimii ja mitä relevanssialgoritmi tekee.

Lori Ayre: ”Kymmenen vuotta opittua avuttomuutta”

Lori Ayre haastaa kirjastot tarttumaan niihin emansipaation avaimiin joita jo nyt saatavilla olevat avoimen lähdekoodin ohjelmistot ja menetelmät tarkoittavat. Hän kirjoittaa rohkeasti otsikolla Ten Years of Learned Helplessness Coming to an End.

Lorin mukaan kirjastojen on

  1. hankittava IT-osaajia, jotka osaavat lukea koodia, kirjoittaa koodia, tehdä määrityksiä ja korjata bugeja,
  2. päästävä yli avoimen lähdekoodin pelostaan esimerkiksi lukemalla kirjoja (kts. asiasanat vapaat ohjelmistot ja avoin lähdekoodi),
  3. sukellettava mukaan ja kokeiltava (Kirjastot.fi:n Labs-hanke tarjoaa testikäyttöön sekä Kohan että Evergreenin),
  4. keskusteltava keskenään

Samaa viestiä kuuluu monesta suunnasta.

Minusta tuntuu, että kirjastoalalla on meneillään voimakas emansipaatio. Eikä kyse ole vain tiettyjen tietojärjestelmien ajatuksiamme kahlitsevasta vapautumisesta. Kirjastolaiset puhuvat esimerkiksi siitä, että alan koulutus- ja osaamispohjaa on Suomessa laajennettava. Eikä tämä tarkoita vain, että meillä on oltava enemmän satusetiä ja vanhustenhoidon ammattilaisia. Tarvitsemme – ja uskon että myös haluamme – sisustussuunnittelijoita, somistajia ja tapahtumatuottajia. Ja supermarketologeja ja tilastotieteilijöitä. Kirjastoissa on pitkälti kyse mekaanisesta tietojenkäsittelystä ja -siirtelystä, eli tarvitsemme tietenkin myös ohjelmoijia ja logistikkoja, jotka varmistavat että tarvittava tieto on oikeassa paikassa ja oikeaan aikaan, oikeassa muodossa ja oikein kohdennettuna.

Suomennetaas piruuttaan toi Koha

Aloitimme viime viikolla Kohan suomentamisen. Nyt käännetään aineistoluettelon l. näyttöluettelon l. OPACin l. verkkokirjaston puoli, eli se asiakkaille näkyvä osa. Työn alla on Koha 3.0:n OPAC.

Meillä on pieni ryhmä Google Groupsissa jossa on puitu terminologiaa. Kohasta on muutenkin tullut sähköpostiteltua tässä talven mittaan muutaman suomalaisen kirjastoaktivistin sekä sellaisten kirjastojen kanssa, joissa se on käytössä. Niitä ei tosin ole montaa kappaletta. Mutta riittävän monta, jotta suomeksi kääntäminen kannattaa tehdä (eli enemmän kuin 0 kpl). Kerran kääntämisestä hyötyvät kaikki, mutta voi olla olemassa monta erilaista suomennosta. Itse teen työtä Kirjastot.fi:n Labs-hankkeen nimissä ja Labs onkin asentanut Kohan kaikkien niiden kokeiltavaksi, joita kyseinen avoimen lähdekoodin kirjastojärjestelmä kiinnostaa. Myös Evergreen on asennettu tutkittavaksi. Teen suomentamista ”virkamiestyönä”, eli ilman mitään erityistä projektisuunnitelmaa tms. sekoilua. Virkamiestyön ja talkootyön ero on hienonhieno 🙂 En tiedä miten muut Kohan suomentamisessa mukana olevat ovat omaa työtään organisoineet, eikä oikeastaan kiinnostakaan – kunhan saadaan jotain aikaan ja hyvä pysyy kierrossa. Koha käyttää PO-tiedostoja ja kääntämistä eri kielille tehdään Pootle -ympäristössä. Tai voi muitakin käännöstyökaluja käyttää jos haluaa, mutta ainakin tässä vaiheessa tuo Pootle on osoitteutunut näppäräksi.

Tässä käännöshankkeessa on muutamakin kiehtova puoli. Ensinnäkin tämä on konkreettnen osoitus siitä, miten avoin lähdekoodi ja yhteisöllinen kehittäminen yleensäkin toimii. Uskoisin, että tuota Kohan OPACin suomennosta päästään kokeilemaan ensi viikon loppupuolella. Vertailun vuoksi HelMet-alueella on vähän aikaa sitten otettu käyttöön Innovativen mobiilituote AirPAC, joka on siis käytännössä helmet.fi -sivusto älypuhelimille sopivammassa muodossa. Se on saatavilla Innovativelta vain englanninkielisenä. Niinsanotusti kansainvälinen versio on pääkaupunkiseutulaisten käytössä ehkä 2012. Todellisuudessa kääntäminen varmasti sujuisi päivässä parissa, jos siihen vain olisi mahdollisuus. Pointti on, että avoimen lähdekoodin ohjelmistoissa ei ole mitään yhtä tahoa, joka voi estää halukkaita tekemästä omasta ja toisen elämästä parempaa.

Toinen kiehtova puoli Kohan kääntämisessä on se, että edes hieman mahdollistaa kirjastojärjestelmistä ja niiden valitsemisesta keskustelemista. Tilannehan on Suomen yleisissä kirjastoissa nyt se, että järjestelmätoimittajia on tasan yksi kappale. Axiell. No pääkaupunkiseutu uloslukien. Ei minulla periaatteessa ole mitään Axiellia vastaan, mutta sitä vastaan on, ettei ole mitään vaihtoehtoja joista edes keskustella, tai joihin verrata käytössä olevaa järjestelmää. Tulevaisuudessahan se tulee olemaan Axiellin Aurora, kun Axiell siirtää Pallas ja Origo -asiakkaansa siihen.

HelMet on yhä enemmän 2.0

HelMet

Lienettekö huomanneet, että pääkaupunkiseudun yleisten kirjastojen näyttöluettelo sallii nykyään arvioiden kirjoittamisen? Sitä en osaa sanoa aikooko kirjasto tarjota itse kirjallisuusarvioita niitä tuottamalla tai hankkimalla julkaisuoikeuksia ammattilaisten laatimiin kirja-arvioihin vai onko tarkoitus että vain loppukäyttäjät (siis ihmiset) laativat niitä.

Jokatapauksessa asiakkaille arvion kirjoittaminen onnistuu kirjautumalla normaalisti kirjastokortin numerolla sekä siihen liittyvällä pin-koodilla. Teoksen saatavuustietojen alapuolelta, käyttäjien antamien tähtien vierestä löytyy nappi ”kirjoita arviointi”.

Muita, vastaavia palveluja on sekä käytössä että vireillä pilvin pimein ja niitä onkin kirjastoalalla kaipailtu jo vuosia. Tai ainakin jotkut ovat kaipailleet, minä mukaan lukien.

Kotimaiset kirjastomarkkinat itseensä käytännössä kokonaan integroinut Axiell myy Arena -palvelua ja se on käytössä jo Hämeenlinnassa ja tulossa mm. Tampereelle. Axiellin Arenalle kilpailija on ruotsalaisen Teknikhusetin CS Library. CS Libraryn hatussa on sulka mm. Tukholman kaupunginkirjaston verkkosivu-uudistuksesta. Molemmat ovat varsinaisen kirjastojärjestelmän sekä niiden perinteisen ankeiden webbisivustojen päällä/rinnalla pyöriviä, rikkaampia sivustoja. Tällaisista ohjelmistoista puhutaan discovery interfacena.

Saatavilla on jo vuosia ollut ”kirjasto 2.0” -tuotteita, joista suuri osa on saatavilla myös ilmaiseksi (lähdekoodeineen) ja heti käyttöönotettavissa. Näistä mainittakoot SOPAC, XC, VuFind sekä Blacklight. Suomalaiset yleiset, akateemiset tai erikoiskirjastot eivät kuitenkaan ole halunneet alkaa ottamaan käyttöön mitään näistä, vaan ovat odottaneet perinteisten järjestelmäntoimittajiensa tarjoavan jotain tuotetta. Pääkaupunkiseudun järjestelmäntoimittaja Innovative onkin koonnut ns. ”kirjasto 2.0” -ominaisuuksia Encore -tuotteeseensa (jota ei ainakaan toistaiseksi ole hankittu HelMet-alueelle) ja Axiell on siis kehitellyt Arenaa omien kirjastojärjestelmiensä päälle.

CS Library, kuten suurin osa avoimen lähdekoodin ilmaisista, itseasennettavista discovery interfaceista väittävät olevansa alla kehräävästä kirjastojärjestelmästä (melko) riippumattomia. Harvat avoimen lähdekoodin ohjelmistoista kuitenkaan tukevat suomalaisissa yleisissä kirjastoissa käytettäviä kirjastojärjestelmiä, eli Origoa ja PallasProta (jotka olivat siis ATP:n ja Tiedon tuotteita ennenkuin Axiell osti molemmat). Tuen rakentaminen Origoa, PallasProta ja muita kirjastojärjestelmiä varten avoimen lähdekoodin ratkaisuihin ei kuitenkaan olisi suurikaan työ ja kerralla saataisi mukaan suurensuuri joukko suomalaisia yleisiä kirjastoja. Tämä olisi järkevää hoitaa keskitettynä ostopalveluna. Milleniumia sensijaan tukee suuri osa näistä ratkaisuista.

Asiaa monimutkaistaa sinänsä hyvä pyrkimys siihen, ettei kirjastojen mustasukkaisesti vartioiman bibliografisen metatiedon ympärille muodostuva lisätieto (esim. arvostelut, käyttötilastot jne) sirpaloituisi moneen paikkaan. Suomi on liian pieni käyttäjäkunta hajautumaan alueellisiin kirjasto 2.0-palveluihin, eikä maantieteellinen alue kuitenkaan ole internetissä kovinkaan relevanttia. Kuvitelkaa että jokaisella maailman kunnalla olisi oma Facebook yhden yhteisen Facebookin sijasta. Ei toimi. Kirjastoalalla puhutaan sensijaan yhden laarin mallista.

Kirjasampo pyrkii olemaan se laari. Lisäksi se mullistaa kaiken mistä kirjastojen metatietotyössä on kyse. Tässä vaiheessa on kuitenkin erittäin epäselvää miten Kirjasampo yhtyy kirjastojen verkkopalveluihin (terveisiä sinnepäin, että plsplspls miettikää jonkinlaiset liittymät Origoon, PallasProhon ja HelMetiin, osana pr-työtä kirjastoille. välivaiheena). Lisäksi Kirjasampo rajautuu kaunokirjallisuuteen joten tietokirjallisuuteen, musiikkiin ja kävelysauvoihin liittyvä metatieto on ratkaistava jotenkin muuten.

Vaarana on, että arvostelupalvelut keräävät tietoa suljettuihin siiloihin. Mielestäni siilot ja ”2.0” ovat keskenään tyystin epäyhteensopivat käsitteet. En tunne CS Libraryn tuotetta tarkasti, mutta ainakin mainostavat ohjelmointirajapintaansa (API) kovasti. Ehkä se ei ole siilo ja ehkä Axiell Arena ei ole siilo. Nykyiset HelMetin arvostelut muodostavat siilon ja marginalisoivat 4 miljoonaa suomalaista. Kirjastolaisille tuttuja yhteystyön muotoja ovat MARC, z39.50 ja kopioluettelointi. Teoksia kuvailevien MARC-tietueiden lisäksi kaikki muutkin kirjastojen tietotuotteet on rakennettava saman periaatteen, eli yhteiskäyttöisyyden ja verkostomaisuuden mukaisesti. Mutta tietenkin vielä paremmin kuin 25 vuotta sitten!

Oikean kirjastomaailman ulkopuolelta käyttäjäarvioita ja muita kirjasto 2.0 -ominaisuuksia löytyy esim. LibraryThingistä, Amazonista ja Google – tyylilleen uskollisensa – haravoi arvioita ja viitteitä verkosta koneellisesti Google Book Searchiin. Nämä kolme palvelua konseptoivat kirjastoa aivan eri lähtökohdista kuin perinteiset, institutionalisoidut kirjasto-organisaatiot (tai no, monet kirjastoinstituutiot ml. yleinen kirjastolaitos ovat oikeastaan aika lyhyt välivaihe kirjastojen historiassa). Amazonin ja Googlen kanssa ns. oikeiilla kirjastoilla ei ole oikeastaan minkäänlaista vuorovaikutussuhdetta, LT on onneksi aktiivinen toimija kirjastojen suuntaan.

Todella sekava kirjoitus, mutta sekava on kirjastojen verkkopalvelujen tilannekin. Tilannetta pyrkii valottamaan Kirjastojärjestelmät nyt! -raportti sekä Yleisten kirjastojen neuvoston verkkostrategia. Muutama selvä linjaus on olemassa (esim. mainittu yhden laarin malli) ja riittävästi teknisiä avaimia sekä kansainvälistä yhteistyökumppaneita (eli tanskalaisia) olisi tarjolla kuten Antti innostavasti kirjoittaa. Taustalla kuitenkin häämöttää toisaalta järjestelmätoimittajien tuotteet (Axiell Arena, CS Library) joilla kaikesta tästä murehtiminen voidaan ulkoistaa ja toisaalta Suuri Yhteisluettelo, Joka Tulee Ratkaisemaan Kaikki Ongelmat. Joten ehkä nyt ei kannata hätiköidä (lue: kannattaa olla tekemättä mitään, yhtikäs mitään). Ja toisaalta–yleisten kirjastojen keskuskirjaston (Helsingin kaupunginkirjasto) sekä sen seudullisten kumppanien (Espoo, Vantaa, Kauniainen) lähteminen oman laarin rakentamiseen on signaali muille noin 350:lle kirjastolle siitä halutaanko sittenkään hakeutua kohti yhteisiä verkkopalveluratkaisuja vai ei.

Avoin lähdekoodi, jakaminen ja riisto. Ja kirjastot tietty

olet kaunis; kaunis kiitos 1541:lle

olet kaunis; kaunis kiitos 1541:lle

Silläkin uhalla, että tämä saattaa säikäyttää ujommat kirjastolaiset vielä syvempään epäilyksen suohon avoimen lähdekoodin ohjelmien suhteen, haastan kuitenkin kaikki kirjastolaiset miettimään sitä mitä sinun kirjastosi voisi konkreettisesti tehdä avoimen lähdekoodin hyväksi?

Tuolla ulkona on joitain avoimen lähdekoodin kirjasto-ohjelmistoja. Osa niistä on kokonaisia, integrated library system (ILS) -paradigman mukaisia kokonaisratkaisuja kuten Koha, NewGenLib ja Evergreen. Osa uudelleen toteuttaa vain joitain kirjastoautomaation komponentteja, tyypillisesti web-käyttöliittymän l. näyttöluettelon l. aineistoluettelon l. OPACin. Tässä joukossa ovat SOPAC ja XC.

Avoin lähdekoodi on ohjelmistona lähtökohtaisesti ylivertainen suljettuun lähdekoodiin; suljettu lähdekoodi on markkinataloudellinen kompromissi, jonka tuotteen ostaja saattaa joutua tekemään. Noniin, se siitä.

Kirjastoissa on totuttu ostamaan kirjastojärjestelmä. Eli antamaan jollekin rahaa siitä, että saa käyttää jotain ohjelmistoa. Tai toisinpäin: antamaan rahaa siitä, ettei ole estetty käyttämästä jotain ohjelmaa. Avoimen lähdekoodin ohjelmissa tällaista varainsiirtoa ei tehdä, vaan ohjelma sinänsä on ilmainen (free merkityksessä gratis, ”free as free piimä”).

Tämä on sinänsä yksinkertaista ymmärtää. Rahaa maksamalla ostaa itselleen myös oikeuden olla antamatta muuta; raha vastaa tuotteen arvoa. Näen kuitenkin, että avoimeen lähdekoodiin ja yleisemminkin ottaen avoimuuteen ja jakamiseen kuuluu moraalinen velvoite antaa takaisin. Puhutaankin esim.  kehittäjäyhteisöistä ja yhteisöt perustuvat juuri siihen, että kaikki tavalla tai viidennellä tuovat kortensa kekoon.

(Muunmuassa) tämä asia on kodifioitu copyleft-ajatukseen ja on juuri sen ytimessä. Copylefthän on nerokas tekijänoikeudellinen kikka, ja tarkoittaa sellaista kohtaa lisenssissä, että teos on kokonaisuudeen (ml. lähdekoodi tai muu tuotantoprosessi) vapaasti saatavissa, mutta teoksesta muokattuja versioita ei saa levittää ilman että tämän uusikin versio on vapaasti saatavilla. Tällainen ”tarttuva” vapaus suojaa teosta ja yhteisöä riistolta. Tässä kohtaa free as freedom.

Copyleft lienee kauneinta mitä immateriaalioikeuksilla itsellään on koskaan tehty. Ellei tunne asiaa, tätä voi olla hieman vaikeaa hahmottaa, eikä ihme. Asia kannattaa kuitenkin selvittää, copyleft osoittaa aivan nerokasta ajattelua ja on erinomaisen tyydyttävä brainfuck. Kuuluisin copyleft-lisenssi on GNU General Public License, mutta vastaava copyleft-ominaisuus on myös Creative Commonsin Sama Lisenssi (engl. Share Alike).

Termit tekijänoikeus ja copyright eivät suoranaisesti tarkoita samaa asiaa (vrt. author’s right vs. kopiointioikeus), mutta copyleftin voisi kääntää esim. tekijän velvollisuudeksi.

Eksyin aiheesta. Palaan: jos kirjasto valitsisi käyttää avoimen lähdekoodin ohjelmia (kuten yhä useammassa kirjastossa on valittu), mitä kirjasto voisi antaa takaisin? No tietenkin ihan pelkkää rahaa suoraan yhteisölle tai sitä tukevalle säätiölle tai yhdistykselle jos sellainen on. Kirjasto voisi ostaa tukipalveluja yhteisöltä tai yksittäisiltä henkilöiltä. Ja kirjasto voisi luovuttaa tekemänsä tai teettättämänsä muutokset, parannukset tai korjaukset takaisin yleiseen käyttöön vaatimalla alihankkijoiltaan lähdekoodin avoimuutta ja vapautta (ellei sellaista jo edellytetä lisenssissä).

Niin kaunista on copyleft, kirjasto ja maailma, että laitan tähän kuvitukseksi ensimmäisen Creative Commons-lisensoidun kuvan, jonka Flickr löytää haulla ”kaunis”. Kiitos kuvasta 1541 🙂

Sama lisenssi

Ilkka Tuomi määrittelee ja perustelee avoimet oppiresurssit

Vapaiden ja avointen oppiresurssien tuottaminen -kurssilla on ensimmäisen viikon (siis viime viikon) toisena tehtävänä lukea Ilkka Tuomen OECD:lle laatima raportti Open Educational Resources: What they are and why do they matter? Tekstissä Tuomi kuvailee OER-liikkeen (open educational resource) sekä olosuhteet joissa se on syntynyt. OER:n kuvailun pohjana ovat muunmuassa tieteellinen prosessi sekä avoimen lähdekoodin prosessi. Sivuilla 15-25 annetaan kuvaus siitä mitä ”resurssilla” tässä yhteydessä käytetään. Tämä onkin tervetullutta.

Minulle välittyi Tuomen tekstistä kuva, että vapaiden ja avointen oppiresurssien tuottaminen ja siihen liittyvä liikehdintä on syntynyt mahdollisuudesta tällaisten resurssien tuottamiseen kuin ongelmalähtöisestä tarpeesta. Mahdollistajana on tietenkin tieto- ja tietoliikennetekniikka, eli suomeksi sanoen internet. En tunne Tuomen sidoksia tai motiiveja, mutta on OER:n kannalta hyvä, ettei lähtökohtana ole vastakkainasettelu aiemman kaltaisen oppiresurssien tuotannon kanssa, ainakaan asiaa ei esitetä niin. Sen sijaan aiempi tuotanto näyttäytyy epätehokkaana ja avoimet oppiresurssit niihin nähden ylivertaisina.

Perustelua OER:lle haetaankin yhtäältä talousopista, toisaalta avoimuuden ihanteesta. Tämä taannee laajan kannatuksen, ja sitä tarvitaankin sillä oppiresurssien tuotantokentällä liikkuu suuria kaloja, eli kustantajia joita ei välttämättä tällaiset hankkeet kovasti miellytä. Minulla sattuu olemaan mielenkiintoinen Kirja 2010–Kirja-alan kehitystrendit -teos käpälän ulottuvilla, ja täältä selviää että esim vuonna 2000 noin 43% Suomessa julkaistuista nimikkeistä on ollut oppikirjoja, kappalemääräisestä myynnistä ne olivat noin 25% eli sangen suuria osuuksia. Tuoreempia tilastoja voi kyyläillä Suomen Kustannusyhdistyksen sivuilta. Oppikirjatuotanto oli kuuma aihe esim. Tietokirja.fi -tapahtumassa tuossa vähän aikaa sitten.

Tuomen teksti käsittelee tietenkin myös immateriaalioikeuksia sekä erityisesti niiden alkuperäistä ajatusta luovan työn tekemisen mahdollistajana. 90-vuoden suoja-aika ei muuten kuulunut alkuperäiseen ajatukseen. Taloudellinen tekijänoikeus on väliaikainen yksinoikeus, ja teokset suoja-ajan umpeuduttua päätyvät public domainiin, eli yhteiskuntaan. Tuomi nostaa myös esiin joitain tiedon (knowledge) peruspiirteistä, merkittävimpänä sen että tieto ei kulu käytössä vaan itse asiassa sen arvo lisääntyy.

Vapaan ja avoimen lähdekoodin (free and open source software=FOSS) selittäminen käy Tuomelta hyvin ja neljä keskeistä stallmannilaista vapautta esitellään kansantajuisesti. Kiinnostavasti Tuomi osoittaa myös että vapaa ja avoin lähdekoodi on itsessään avoin oppiresurssi ja verrattoman tehokas ympäristö esimerkiksi ohjelmoinnin oppimiseen.

Ehkä tärkein kohta raporttia OER:n perustelua ja legitimoitia ajatelleen on kuitenkin Tuomen kuvaa klassisen talousopin sekä tiedon ja avoimuuden suhdetta sivulta 26 alkaen. Minua kuitenkin jostain syystä harmittaa termin ”perinteiset hyödykkeet” (traditional goods) käyttäminen tässä yhteydessä.

UNESCO on kuvaillut avoimia oppiresursseja vuonna 2002 näin:

“The open provision of educational resources, enabled by information and communication technologies, for consultation, use and adaptation by a community of users for non-commercial purposes.

Tuomi antaa ymmärtää, että tämä on riittämätön lähtökohta mutta armeliaasti jatkaa, että kuvaus voi toimia ensiaskeleena kohti avointen oppiresurssien määrittelyä.

Hän tarttuu epäkaupallisen käytön vaateeseen, joka särähti omaankin korvaani. Eikö se ole vähän sama kuin jos koulussa opettaja sanoisi, että näitä oppeja ette sitten saa hyödyntää työelämässä? Missä edes menee kaupallisen ja epäkaupallisen raja, kun rahaa joka tapauksessa liikkuu ja joku ehkä saa hommasta elantonsa. Tuomenkin monesti viittaamassa avoimen ja vapaan lähdekoodin maailmassa probleemaa ei ole, sillä kaupallista käyttöä ei ole rajoitettu kun käytössä on GNU General Public License GPL. On toki muitakin avoimen lähdekoodin lisenssejä, perinteisenä vastapainona GPL:lle on BSD-lisenssi, joka ei pidä sisällään tätä tarttuvaa ”GNU-virusta”. GPL:ää onkin liberalistien piireissä kritisoitu, sillä se rajoittaa rajoittamista 😉 Ominaisuutta kutsutaan copyleftiksi ja se lienee kauneinta mitä immateriaalioikeuksilla on koskaan tehty. Tunnetussa Creative Commons -lisenssiperheessä Share Alike -lisämääre on copyleft-ominaisuus.

UNESCOn määritelmässä esiintyvä ilmaisu community of users saa myös kyytiä, sillä periaatteessa yhteisö voi olla ulossulkeva, ja tällainen resurssi ei siis ole avoin Tuomen kuvailemassa merkityksessä jossa ulossulkemista ei siedetä.

Lopulta Tuomen ehdotus on seuraava:

Open educational resources are accumulated assets that

  1. enable development of individual or social capabilities for understanding and acting

and

  1. can be enjoyed without restricting the possibilities of others to enjoy them

and which either

  1. provide non-discriminatory access to information and knowledge about the resource
  2. generate services that can be enjoyed by anyone with sufficient non-discriminatory capabilities
  3. can be contributed to by anyone, without restrictions that exceed the norms of open science

Minusta tämä kuulostaa oikein hyvältä ja idealistiselta. Ei muuta kuin meta-yliopistoa pystyyn vaan! Tuomi viittaa jo tekstin alkupuolella kolmen tasoitseen avoimuuteen, joista toinen voi kuitenkin tuottaa meta-yliopisto-opiskelussa ongelmia, ellei oppisuorituksia tunnusteta virallisesti. Wikiopistoon mukaan ECTS:ään?