
Hei kirjasto: avaa datas tai ne avataan (kuva Arja Lento / YLE, sori et förasin)
Avoin data (l. Open Data) etenee Suomessakin. Twitteristä sattui silmiin juuri Ehdotus valtioneuvoston periaatepäätökseksi julkisen sektorin digitaalisten tietoaineistojen saatavuuden parantamisesta ja uudelleenkäytön edistämisestä (52KB PDF). Kymmensivuisen tekstin tiivistelmä:
Periaatepäätöksen linjaukset esittävät tarvittavat toimenpiteet julkisten tietovarantojen saatavuuden ja uudelleenkäytön lisäämiseksi yhteiskunnan kaikilla alueilla. Linjaukset sisältävät kehittämistoimet tietopolitiikan ja lainsäädännön selkeyttämiseksi, käyttöä mahdollistavien rakenteiden ja käytänteiden luomiseksi sekä palvelu- ja sovelluskehityksen edistämiseksi.
Tietopoliittisilla linjauksilla tavoitellaan sitä, että julkisen sektorin digitaaliset tietoaineistot ovat avoimesti saatavilla ja uudelleenkäytettävissä yhtenäisin, selkein ja kaikille tasapuolisin käyttöehdoin. Tietoaineistoja tarjotaan kustannustehokkaasti, jolloin kansantalouden kokonaisedun kannalta tietoaineistot ovat pääsääntöisesti maksuttomia käyttäjälle. Samalla budjetoinnin ja tulosjohtamisen kautta on huolehdittava tietoaineistojen laadusta ja ylläpidosta.
Koko yhteiskunnan käyttöön luotavan tietoinfrastruktuurin avulla voidaan tietoaineistoja tarjota tehokkaasti. Hallinnonalojen tulee tunnistaa ja kuvata tietoaineistonsa uudelleenkäyttöä varten. Tietosisältöjen yhtenäiset kuvailutiedot ja palveluhakemistot helpottavat tiedon käyttöä. Luovutettavissa olevat tietoaineistot saatetaan koneluettavassa muodossa ja avoimilla rajapinnoilla käyttäjille. Tietoaineistojen tarjontaa ja käyttöä edistämään tulee luoda tarvittavat tukipalvelut. Avoimen tietoinfrastruktuurin kehittäminen ja ylläpito turvataan pitkäjänteisellä rahoituksella.
Palvelu- ja sovelluskehityksen edistämiseksi tarvitaan yhteistyömalleja ja kannustimia. Julkisessa hallinnossa kehitetään avoimen tiedon kulttuuria ja tuetaan kehittäjäyhteisöjen toimintaa. Alan tutkimusta ja kansainvälistä yhteistyötä tulee vahvistaa. Kokeilevaan toimintaan on panostettava erityisesti laajaa kysyntää edustavien tietoaineistojen avaamiseksi ja yhtenäisten käytänteiden luomiseksi.
Teksti on vielä luonnosvaiheessa. Suomessa kirjastot ovat lähteneet erittäin heikosti mukaan datansa avaamistalkoisiin (lue: “datan piilottelun lopettamistalkoisiin”). Jos dataansa ei halua auki, niin nyt vähän äkkiä kampanjoimaan tätä hallituksen periaatepäätöstä vastaan… jos rahkeita riittää. Henkilökohtaisesti en usko että kukaan tätä trendiä sinänsä vastustaa, vaan jahkailu on johtunut siitä, että kirjastolaiset ei vieläkään ymmärrä mitä avoin data tarkoittaa, emmekä ole ottanut asiaksemme selvittää. Katsokaas alkajaisiksi vaikka avointa dataa käsittelevät kirjoitukset Sorvipenkin äärellä -blogista, Kirjastot.fi:n Labsin blogista ja tästäkin blogista. Noh, ei se mitään, asia etenee ilman meidän omaa ymmärrystä ja tahtoa ei tarvita jos asia tulee hallitusohjelmaan tai muutoin säädellään meidän ulkopuolelta.
Kirjaston bibliografisen datan avaamisen ensiaskeleet ovat nämä:
- ilmoita luetteloijille aikeista, jotta tietävät
- juttele Labsin kanssa
- dumppaa tietokanta
- lähetä dumppi kirjastojen avoimeen datavarantoon data.kirjastot.fi
- viesti (Suomi.fi, Kirjasto-kaapeli, Kirjastolehti, lehdistö)
- profit!
Kohta 3 sujuu Origosta muistiinpanojeni mukaan näin: Aineistonhallinta
->Vienti
->ei hakuehtoja->valitse kaikki->Hyväksy valinta
. Tiedostomuodoksi ISO-2709 ja tallenna johonkin omalle tietokoneelle. Yritän muistaa tehdä opetusvideon joskus kun olen Origon äärellä. Dumppaaminen kestää Varsinais-Suomalaisessa, keskikokoisessa kirjastossa kolme neljä tuntia. Ei tiedostokaan ole suuri, Vaski-tietokanta on 763MB.
PallasPro-asiakkaat voivat tilata dumpin Axiellilta (älä maksa liikaa (tonni on liikaa)), tilauskoodi moihaluttaistietokantadumppiosakohteineeniso2709siirtoformaatissajamerkistökoodauksenavaikkapamarc8
. Mitenkäs se Voyagerista, Primosta ja muista järjestelmistä käy?
Euroopan yhteisen digitaalisen kirjaston Europeanan Data Provider -sopimuksessa (Europeana Aggregators’ Handbookin liitteenä, s. 44) on myös sovittu, että Europeanaan toimitettava data avataan (kts. artikla 4, Licence of rights for Metadata from Data Provider to
Third Parties, PDF:n s. 47). Epä-kaupallisuus -poikkeuksesta ollaan luopumassa, kuten Tapani vastikään kirjoitti Kansallisen digitaalisen kirjaston (KDK) asiakasliittymän blogissa, otsikolla Europeanan reunoilta. Ja KDK:honkin liittyy omat sopimuksensa, jossa tällaisista asioista sovitaan. KDK -pilotoinnissa meitä on vajaa tusina, seuraavassa KDK-aallossa kymmeniä lisää.
Miten me kirjastoalalla hoidettaisi toi valtioneuvoston periaatepäätöksen luonnoksen neljäs kappale? Asiakas-workshoppeja MARCista? Auts.
Helsingin Sanomat on tarttunut mahdollisuuteen keräillä vielä PR-pisteitä Open Data -buzzista julkaisemalla kustantamovertailunsa tuloksen datat (csv).
Helsingin Sanomat vertaili kustantajien kirjallista laadukkuutta antamalla pisteitä niiden julkaisemien kotimaisten kaunokirjojen saamille palkinnoille, ehdokkuuksille, myyntitilaston kärkisijoille ja käännöksille vuosina 2000–2010.
Tämä jos mikä kiinnostanee kirjastolaisia. Näitä voisi leipoa yhteen esim. kirjastojen kuvailudatan kanssa ja sitä kautta katsoa vaikkapa risteävätkö palkituimpien teosten asiasanat kirjastoon lainatuimpien teosten asiasanojen kanssa. Tämä edellyttää sitä, että lakkaamme piilottelemasta dataamme asiakkailta ja yhteiskunnalta, ja myös itseltämme ja kollegoiltamme.
Avoimen Dataan liittyvien, ilmaisten PR-pisteiden jako päättyy, kun hommasta tulee normaalitoimintaa, ja asiaahan siis odotellaan seuraavaan hallitusohjelmaan. Pistäkääs siis töpinäksi.
Hoi Tampere/PIKI, ette varmasti kerkeä avoimeksi dataksi bibliografisine datoinenne ennen Turkua/Vaskia :^) Kymppi vetoa!