[kieltämättä asiaan liittymätön, mutta dubstepin tahtiin skänkkäävä kissa 3D:nä]
Torstaina puitiin Jyväskylän kaupunginkirjaston emännöimänä ja Antti Poikolan fasilitoimana kirjastojen suhdetta avoimeen dataan. Tapahtuman muistiinpanot voi, ja kannattaa syynäillä yhteisestä muistiosta. Antti myös videoi alustukset (Antti Poikola, Antti Pakarinen, Petri Tonteri ja minä, 1 tunti 12 min.) ja työpajailun jälkeisen loppukeskustelun (40 min).
Täydentelin muistiota vielä, esim. näkemystäni BTJ:n suhteesta tietokantojemme omistukseen immateriaalioikeuksien näkökulmasta, muutamia ilmassa olevia ideoita ja silmäilin muutenkin muistiinpanoja torstaita hahmottaakseni. Seminaarissa keskustelu pyöri varsinaisen avoimen datan ympärillä toki, mutta kuten noista muistiinpanoistakin ilmenee, monesti tuli esille sekin, että meillä itsellämme ei ole pääsyä omiin datavarantoihimme tai mielenkiintoinen data tuntuu jatkuvasti valuvan näppiemme läpi. Käyttöideoita on vaikka kuinka paljon. En näe perinteisillä perusjärjestelmätoimittajillamme kovin kaksista roolia tässä, joten ei muuta kuin aloite omiin käpäliin vaan! 🙂
Sangen selvä tahtotila asiasta on: datat auki. Olisi tietenkin hyvä saada tarkasteltaviksi ne argumentit ja ongelmat miksi datamme ei ole avointa, ja sitten ratkoa ne.
Nyt on sopivasti myös se aika vuodesta kun kirjastoissa koostetaan tilastoja OKM:lle ym. toimittamista varten. Noita tilastoja on aika paljon, ne ovat hyvin kattavia, julkisia ja niihin on vieläpä avoin käyttöliittymä osoitteessa http://tilastot.kirjastot.fi. Avointa dataa nuo tilastot eivät kuitenkaan ole, sillä varsinainen data ei ole koneellisesti saavutettavassa muodossa. Tulipa mieleen, että nyt kun Kirjastot.fi rakentelee paraikaa uutta versiota kirjastotietokannastaan (josta tulee muuten mahtava) ja myös koneellisesti saavutettava, saataisikohan myös nuo tilastot mukaan?
Yksi mietintämyssyssä pidettävä näkökulma on tämä: suomalaiset kirjastot eivät ole kokeneet asiakseen avata dataansa, mutta muutamat muut toimijat ovat: miten me kirjastot voisimme näitä muiden nyt meidänkin saatavillemme antamia datoja hyödyntää?
Tilastodataa ollaan avaamassa kyllä. Ei pitäisi enää montaa kuukautta mennä. Kysele Sarmelalta tarkemmin, jos haluat tietää missä vaiheessa homma on.
Kiitti tiedosta Antti, tilastothan on jo tietokannassa ja siihen on ihan toimiva käyttöliittymä ihmisille, enää koneluettavuus kondikseen niin a vot.
Näyttäisi ainakin osa noista kyselyistäkin olevan generoitavissa (esim. vuoden 2010 Turun kuntatason tilastot ovat osoitteessa
http://tilastot.kirjastot.fi/fi-fi/perustilastot.aspx?AreaKey=Y2010T2N853
ja Turun virallinen kuntatunnushan on toi 853 johon törmäileekin siellä-täällä, esim. kirjastokorttien, MARC-tietueiden ja niteiden viivakoodien osana. Jos palautuisi XML:ää (esim XHTML) ja kunkin sivun sisältö olisi kuvailtu jossain, niin olisi koneellinen käyttö jo melkolailla mahdollista XML-työkaluilla. Unixin komentorivityökaluilla (curl, bash, sed, awk…) homma tietenkin onnistuu, mutta ei ole kovin ergonomista 🙂Kannattaa myös muistaa ISIL -tunnukset (International Standard for Libraries and Related Organizations). Sekä kirjastotietokanta, hankerekisteri että tilastot tulevat sisältämään nämä.
http://www.kansalliskirjasto.fi/kirjastoala/standardointi/isil.html
Ehdottomasti, ISIL ja tunnisteet yleensäkin FTW. Kirjastojärjestelmissähän on myös tunnisteita kun viitataan toimipisteisiin, ja Axiell Aurora lisää holdings -tietoja myös suoraan MARC-tietueisiin.
Olen yrittänyt täällä Turun kaupunginkirjastossa/Vaskissa edistää (viimeksi tänään kokouksessa) sitä että haluttaisi, rekisteröitäisi ja toteutettaisi toimipistekohtaiset ISILit järjestelmään sekä tietueisiin, mutta valitettavasti lobbausmenestykseni on ollut heikkoa enkä ole onnistunut ajamaan asiaa täällä läpi
Vastaisuudessakin tulee siis olemaan järjestelmän omat tunnisteet täällä käytössä. En tiedä kuinka uniikkeja ne ovat. Pahoittelen… 😦
Kansalliskirjaston kanssa jo juttelin asiasta, ei ongelmaa siellä päässä että olisi ISILit toimipistetasolla.