DogeDC, kirjastotieteen ja kirjastojen metadataprosessien ytimessä.
Tag Archives: bibliografinen kuvailu
Esitelmäni kirjaston bibliografisen datan laadusta sekä laadun arvioinnista ja valvonnasta (ym.)
Tein vuoden 2012 lopulla freelancerina parin kuukauden ajan erittäin hauskaa, opettavaa ja vaativaa ”kuutamokeikkaa” PIKI-kirjastoille bibliografisen datan parissa, ja ilmeisesti sen vuoksi olin kutsuttuna Kansalliskirjaston Kuvailun tiedotuspäivillä 20.-21.3.2013 puhumaan asiasta. Kansalliskirjaston Tarja Mäkisellä sekä minulla oli tunnin osuus otsikolla Näkökulmia laatuun. Itse juttelin luettelointityön ja luettelointidatan suhteesta tietojenkäsittelyyn, ohjelmointiin ja tietohallintoon, laatuajattelusta sekä kirjavista mahdollisuuksista joita meillä kirjastoilla olisi käytettävissämme, ja joiden parissa marras-joulukuussa estottomasti revittelin.
Tapahtuman molemmat päivät on taltioitu, oma osuuteni alkaa ensimmäisen päivän (20.3.) videotallenteen noin kohdasta 2:18:00 ja kestää 25 minuuttia plus keskustelua.
Jos haluat katsella pelkkää esitysgrafiikkaani tuolta tiedotuspäiviltä, se löytyy Prezistä. Aiempi blogipostauksessani maaliskuun 12. päivältä sisältää linkit laatimaani lähdekoodiin, myös työpäiväkirjana käyttämääni projektin- ja asianhallintajärjestelmään sekä myös tekstiksi kirjoittamaani raporttiin.
Kuka nää on luetteloinu?
Jos kirjallisuutta luetteloitaisi ja kuvailtaisi kuten digitaalisia pelejä luetteloidaan ja kuvaillaan, kaikilla kirjoilla olisi sisällönkuvailuna asiasanat kirjat, kirjallisuus sekä selluloosa. Huomautuskentässä voisi kertoa mitä vaaditaan käyttämiseen, esim. ”valot, vähintään yksi käsi, lukutaito 2000-luvun suomen kielellä”. Toisessa huomautuksessa voisi mainita että lainausoikeuden on myöntänyt Suomen tekijänoikeuslaki. Oheisessa kuvassa olevan teoksen nimeke olisi jotain tämän tyyppistä: Bibliografnen valvonta [Painettu aineisto] : Johdatus luetteloinnin ja sisällönkuvailun menetelmiin : Kirja. Kannessa mainittuja tekijöitä ei olisi olemassakaan eikä tekijät olisi muutenkaan mitenkään merkittävä asia. Poikkeuksena voisivat olla elämäkerrat, joiden tekijöinä olisi ehkä ne henkilöt/bändit josta ko. teos kertoo.
Aineistolajit eivät ole aineistolajeja, sisällönkuvailu ei kuvaile sisältöä, nimeke ei kerro nimekettä, tekijöitä ei kirjata ensinkään… onkohan kirjastojen luettelointisäännöt ja sovellusohjeet pitkäaikaissäilytyksen piirissä? Tästä datasta ei nimittäin tulevaisuuden ihmiset ota kyllä mitään tolkkua ilman niitä. LOL olisikin hauska joutua joskus päättelemään datasta että mitä oikeastaan sillä oli tarkoitus kuvata. Jos esim. Vaskia on uskominen, keskeisin kulttuurin kyseisen osa-alueen tekijä on Metallica, joka on todellisuudessa vaari-ikäinen power-rokkia soittava yhtye, jonka huippuvudet sijoittuvat minun ikästeni varhaisnuoruuteen.
Olen miettinyt ja suorastaan seuraillut pelien luettelointia muutama vuosia Vaskissa, HelMetissä, PIKIssä, Aallossa sekä Fennicassa, tilanne vaikuttaa onneksi olevan hitaasti paranemaan päin. Mistä nää tietueet oikein tulee? BTJ:ltä? Alalla on paljon kaikenlaisia hauskoja työ- ja ohjausryhmiä, ja niihin osallistuminen onkin mainio mahdollisuus saada kaffea ja ehkä pullaakin neljästi vuodessa. Mikä työryhmä ohjaa pelien luettelointia?
Ja tietenkin avauduin myös Kirjasto-kaapelilla:
Moi, tietääkö joku onko olemassa jotain tahoa joka yhtään kattoisi konsoli- ja tietskapelien yms. luetteloinnin perään? Sekä bibliografisessa kontrollissa että sisällönkuvailussa olis vielä skarpattavaa, ja ennenkaikkea yhtenäistettävää muiden julkaisujen luetteloinnin kanssa. BTJ:ltä nää tietueet kai tulee, mutta onko tähän jotain ohjausryhmää tai jotain?
Jos alkaisi viimein – about 30 vuoden jälkeen – kirjaamaan peleihin tekijät (joo pelit asuu tietokoneessa, mutta kyllä ne on ihminen ihan oikeeasti tehny) ja vaikka joku yhteinen ontologia pelityypeistä, ni päästäis jo ihan kivaan alkuun.
Yliopistossa mulle opetettiin että just tässä me ollaan ihan mielettömän hyviä.
Bibliografinen data on blääh, meillä on parempaakin
Mitä Lukas sanoi, bibliografinen metadata ja kuvailutiedot eivät ole kiinnostavinta dataa mitä meillä kirjastoilla on. Se on itseasiassa aika tylsää faktojen luettelemista ja se voidaan tuottaa, säilöä ja ylläpitää keskitetysti, ja jopa ostaa kuten tapana onkin (BTJ:ltä).
Bibliographic metadata as such describe publications, in the broadest sense, providing information about title, authors, subjects, editions, dates, urls, but also physical attributes like dimensions, number of pages, formats, etc. This type of information, in FRBR terms: Work, Expression and Manifestation metadata, is typically shared among a large number of libraries, publishers, booksellers, etc. ‘Shared’ in this case means ‘multiplied and redundantly stored in many different local systems‘. It doesn’t really make sense if all libraries in the world publish identical metadata side by side, does it?
Se mikä sensijaan oikeasti on mielenkiintoista, on paikallinen käyttödata sekä niteistä ja kokoelmista kertova data.
Currently, library data that is really unique and interesting is administrative information about holdings and circulation. After having found metadata about a potentially relevant publication it is very useful for someone to know how and where to get access to it, if it’s not freely available online. Do you need to go to a specific library location to get the physical item, or to have access to the online article? Do you have to be affiliated to a specific institution to be entitled to borrow or access it?
Usage data about publications, both print and digital, can be very useful in establishing relevance and impact. This way information seekers can be supported in finding the best possible publications for their specific circumstances.
Tästä on Suomessakin ollut puhetta tietyissä piireissä. Mitään kehitystä tähän suuntaan ei ole kuitenkaan otettu eikä toistaiseksi ole näkyvissäkään. Ehkä sitten, kun yhteisluettelo kansallinen metadatavaranto (”Melinda”), KDK:n asiakasliittymä, Axiell Arenan kansalliset ulottuvuudet tai jokin vastaava valmistuu ja teostaso voidaan kokonaan siirtää veke kaikista kirjastoista ja tehdä haut yhteen indeksiin (ja rajata halutuin ehdoin, esim. kuuluuko teos oman kirjastoni kokoelmaan), voidaan ruveta miettimään tällaisia asioita.
Lukekaa Lukaksen kirjoitus Local library data in the new global framework, jossa Lukas kertoo paikallisdatan merkityksestä tarkemmin ja myös esittelee malleja miten homman voisi toteuttaa.
Avoin kirje Tuijalle viitteidenhallintatyökaluista kuten Zotero, Mendeley ja RefWorks
Minulta kyseltiin privana suhteestani näihin RefWorksin yms. kaltaisiin viitteidenhallintatyökaluihin joista on kollegoiden kesken ollut toisaalla puhetta. Tässä avoin kirjeeni:
Suhteeni kirjallisuusviitetyökaluihin on lähinnä poleeminen. Mainitsemasi Mendeley on mennyt minulta täysin tutkan alta, en ole moista edes huomannut. En ole täten erityisesti suunnitellut Zoterosta siihen siirtymistä.
Vaikka Zotero on minulla kyllä koneellani asennettuna, ei sitä rehellisyyden nimissä tule koskaan käytettyä. Olen oikeastaan käyttänyt sitä vain muutamassa isommassa kirjoitusjutussa kun olen vääntänyt artikkelia kirjaan tms… itseasiassa kaikki Zoteron käyttötapaukseni taitavat olla juuri tuollaisten muodollisempien, kirjamaisempien tekstien laatimiseen liittyneitä… Lasken PDF-tiedostot (kuten raporttimme Kirjastojärjestelmät Nyt!) kirjamaisiksi, tai no e-kirjoiksi kai niitä pitäisi kutsua.
Kieltämättä tuntuu hassulta että joitain tietyntyyppisiä tuotoksia varten käyttää jotain tällaisia erityisiä työkaluja, kuten juuri tekstinkäsittelyohjelmaa ja viitteidenhallintatyökalua. Ehkä siitä tulee vähän tärkeä olo… kuin tekisi jotain oikeampaa kirjoittamista kuin normaalisti. Todellisuudessaan tekstin kirjoittamisen ja viitteiden hallinnan kanssa on tekemisissä joka-ikinen päivä, tuntikausia. Tekstinkäsittelyohjelmat ja erityiset viitteidenhallintatyökalut eivät tosin kuulu arkeen, vaan selain ja tietenkin mahdollisimman hyvät URL-osoitteet.
Yksi selkeä etu mikä Zoteron, RefWorksin tai vastaavan työkalun käytössä on, on siististi muotoiltu viiteluettelo. Luonnellisemmassa ympäristössäni eli verkossa tykkään aina laatia viitteet tekstin sisään, mutta printissä tai printtiä mallintavassa tekstissä (kuten juuri PDF:t), tämä ei ole tyypillisesti tapana. Silloin se, että napin painalluksella saa hienosti muotoillut viiteluettelon on ollut kiva juttu.
Normaalisti käytän viitteidenhallintaan lähinnä Diigoa. Aiemmin del.icio.usia. Ei näitäkään tule loppujenlopuksi niin paljoa käytettyä. Selaimen sivuhistoria ja Google ovat minulle aika kattavat viitteidenhallintatyökalut 🙂 Riippuu tilanteesta. Käytän aika paljon selaimen osoiteriviä tiedonhakuun. Näin käytän esim. valokuviani (jotka ovat Flickrissä, jolle voi tehdä kyselyjä suoraan URL-osoitteilla) sekä juuri selaimeni historiaa.
RefWorksista minulla ei ole oikeastaan mitään sanottavaa, paitsi että se on alansa establishmentti.
Zoterosta vielä yleisemmin. Sehän on Firefox-selaimen laajennos, ja sikäli aina naimisissa Firefoxiin. Stand-alone versio on kehitteillä, kuten Chrome ja Safari-versiotkin. Muistan kun Zoteroon tuli myös web-liittymä, jota voi nyt käyttää myös mobiilina. Se on ihan kiva. Zotero on kyllä monipuolinen ja varmasti kattava työkalu, mutta siistin, formaalin ja kontrolloidun metadatan ylläpitäminen vaatii aina työtä, joka monesti palvelee loppujenlopuksi jotain anaalista kontrollifriikkeyttä, eikä oikeaa tiedon käyttämistä aidosti (kirjastoihminen jos kuka tietää tämän). Tokihan tällaisen työkalut, niiden välinen tiedonsiirto ja ajatus jonkinlaisista ”rikkaammista”, ei suoraan perille johtavista linkeistä on kiehtovaa.
Zoteron tai muidenkaan viitteidenhallintatyökalujen ns. ”sosiaalisista” ominaisuuksista olen käyttänyt vähän. Deliciousin aikaan enemmän, ja jos on ollut jotain selkeitä porukoita joiden kanssa ja selkeä tehtävä, silloin tällaiset työkalut ovat olleet kyllä hyviä. Jos kirjoittaisin enemmän ”asiallista” ja ei-elävää tekstiä, niin käyttäisin enemmän. Varmaan jossain gradun ähläämisessä olisi hyvä, tai jos itse kirjottelisi akateemisa tekstejä niin voisi ehkä pitää omaa bibliografiaansa yllä tuollalailla.
Turku ym. Vaski-kirjastot nyt avointa dataa
Moi, terveisiä Varsinais-Suomesta. Laitoimme tänään koko Vaski-kimppamme luettelointitietokannan sisällön sellaisenaan verkkoon.
Vaskin, eli Turun, Liedon, Maskun, Mynämäen, Naantalin, Nousiaisten, Raision, Ruskon ja Taivassalon kunnankirjastojen yhteisessä tietokannassa on noin 1.7 miljoonaa tietuetta ja niihin on vaihtelevalla tarkkuudella kuvailtu kaikki ne kirjat, lehdet, cd-levyt, DVD:t, nuottivihot, yksittäisiä musiikkikappaleita ynnä muita aineistoja, joita kirjastojen hyllyistä voit löytää. Juuri nämä bibliografiset tietueet ovat historiallisesti muodostaneet kirjastojen tiedonhaun keskeisimmän ytimen, ja haluamme tällä julkistuksella olla mukana kaikenlaisten tietovarantojen käytön esteitä vähentävässä avoin data -liikehdinnässä (engl. Open Data).
Tässä tiedoitteemme, joka lähti tänään lehdistölle sekä tietenkin myös Kirjastot.fi:hin:
Varsinais-Suomen kirjastojen data avoimeksi
30. syyskuuta 2011 10:00
Varsinaissuomalaiset Vaski-kirjastot ovat avanneet aineistotietokantansa sisällön julkiseen käyttöön. Aiemmin vain hakuliittymän kautta käytettävä tietokanta on nyt lisäksi ladattavissa verkosta kokonaisuudessaan, tietokoneella käsiteltävässä muodossa. Tämä mahdollistaa kokonaisuudelle paljon uudenlaisia käyttömahdollisuuksia. Vaski-tietokanta sisältää noin 1.7 miljoonan kirjan, levyn, musiikkikappaleen ynnä muiden teosten julkaisutiedot sekä kirjastoammattilaisten tekemät luokittelu- ja hakusanatiedot.
Open data, tai suomalaisittain avoin data on pyrkimys avata erilaisia tietolähteitä mahdollisimman vapaaseen käyttöön. Erityisesti julkisin varoin tuotettua ja ylläpidettyä dataa ollaan Suomessa avaamassa monilla eri tahoilla.
Kirjastot ovat merkittävä osa yhteiskunnan avointa ja yhdenvertaista tietoinfrastruktuuria. Niiden tietokannat sisältävät paljon huolellisesti koottua tietoa erilaisista kulttuurijulkaisuista ja luonnollisesti kirjastot haluavat edistää näiden tietojen monipuolista saatavuutta. Suomessa kirjaston aineistotietokantojen saatavuutta pyrkivät parantamaan kirjastojen yhteinen Kirjastot.fi Labs -hanke, sekä Kansallinen Digitaalinen Kirjasto, jonka rakentamiseen Vaski-kirjastot myös osallistuvat. Vaski-kirjastoihin kuuluu tällä hetkellä yhdeksän kaupungin- ja kunnankirjastoa (vuonna 2012 17), ja ne palvelvat noin 340 000 suomalaista.
Lisätietoja antavat Varsinais-Suomen maakuntakirjastona toimivan Turun kaupunginkirjaston projektisuunnittelija Mace Ojala (mace.ojala@turku.fi) ja palvelujohtaja Ulla-Maija Maunu (ulla-maija.maunu@turku.fi).
Vaski-kirjastojen tietokanta on avattu yhteistyössä sisältöä tuottavan BTJ:n kanssa.
Henkilökohtainen kiitokseni kollegoilleni täällä Vaski-kirjastoissa ja erityisesti pomoille ja luetteloijille, sekä BTJ:lle jolta suuri osa suomalaisten kirjastojen luettelointityöstä on ostettu ja joka on käytännössä meidän yhteisluettelomme. Terkut myös kansainväliselle open data -yhteisölle 🙂
Nyt avattu Vaski-kirjastojen data on ladattavissa isona läjänä sekä XML-muodossa että MARCille tyypillisessä ISO-2709 -siirtomuodossa osoitteesta http://data.kirjastot.fi. Lisenssinä on erittäin salliva Creative Commons CC0. Kirjastoalan yhteisestä bibliografisesta MARC-standardista on erilaisia versioita, olemme Suomessa vielä siirtymävaiheessa FinMARCista kansainväliseen MARC21:een. MARCista sekä sen eri formaateista löydät lisää tietoa Kansalliskirjaston sivuilta ja meillä on myös erityinen sähköpostilista MARC-asioille… joka on tosin nykyään erittäin hiljainen. Olen bloggaillutkin silloin tällöin MARCista.
Tämä Vaski-julkistus on siis FinMARCia, ja yksittäinen tietue näyttää esim. tällaiselta:
00791nam a22002533 450
001 Ppro853_148215
008 921022s1992 fi 8
021 $a 951-581-008-6 $c sid. $d 162 FIM
041 1 $a fin $c rus
057 $a 68
064 $a 68.22
065 $a 68.22
068 $a 68.22
098 $a 68.22
100 1 $a Ponomareva $h Julia
241 $a Gribnaja kuhnja
245 2 $a Vaskiratsastajan sienisalaatti $b 201 mainiota sieniohjetta $d [Julia Ponomareva & Aleksei Ponomarev] $e [toimittanut ja suomentanut Liisa Viitanen]
260 $a Helsinki $b Taifuuni $c 1992 $e [Pieksämäki] $f RT-paino
300 $a 231 s. $b kuv. $c 22 cm
652 $a keittokirjat
652 $a sieniruoat
700 10 $a Ponomarev $h Aleksei
745 $a 201 mainiota sieniohjetta
745 $a Vaskiratsastajan sienisalaatti
Tai vastaavasti XML:nä
<record>
<leader>00791nam a22002533 450 </leader>
<controlfield tag="001">Ppro853_148215</controlfield>
<controlfield tag="008">921022s1992 fi 8</controlfield>
<datafield tag="021" ind1=" " ind2=" ">
<subfield code="a">951-581-008-6</subfield>
<subfield code="c">sid.</subfield>
<subfield code="d">162 FIM</subfield>
</datafield>
<datafield tag="041" ind1="1" ind2=" ">
<subfield code="a">fin</subfield>
<subfield code="c">rus</subfield>
</datafield>
<datafield tag="057" ind1=" " ind2=" ">
<subfield code="a">68</subfield>
</datafield>
<datafield tag="064" ind1=" " ind2=" ">
<subfield code="a">68.22</subfield>
</datafield>
<datafield tag="065" ind1=" " ind2=" ">
<subfield code="a">68.22</subfield>
</datafield>
<datafield tag="068" ind1=" " ind2=" ">
<subfield code="a">68.22</subfield>
</datafield>
<datafield tag="098" ind1=" " ind2=" ">
<subfield code="a">68.22</subfield>
</datafield>
<datafield tag="100" ind1="1" ind2=" ">
<subfield code="a">Ponomareva</subfield>
<subfield code="h">Julia</subfield>
</datafield>
<datafield tag="241" ind1=" " ind2=" ">
<subfield code="a">Gribnaja kuhnja</subfield>
</datafield>
<datafield tag="245" ind1="2" ind2=" ">
<subfield code="a">Vaskiratsastajan sienisalaatti</subfield>
<subfield code="b">201 mainiota sieniohjetta</subfield>
<subfield code="d">[Julia Ponomareva & Aleksei Ponomarev]</subfield>
<subfield code="e">[toimittanut ja suomentanut Liisa Viitanen]</subfield>
</datafield>
<datafield tag="260" ind1=" " ind2=" ">
<subfield code="a">Helsinki</subfield>
<subfield code="b">Taifuuni</subfield>
<subfield code="c">1992</subfield>
<subfield code="e">[Pieksämäki]</subfield>
<subfield code="f">RT-paino</subfield>
</datafield>
<datafield tag="300" ind1=" " ind2=" ">
<subfield code="a">231 s.</subfield>
<subfield code="b">kuv.</subfield>
<subfield code="c">22 cm</subfield>
</datafield>
<datafield tag="652" ind1=" " ind2=" ">
<subfield code="a">keittokirjat</subfield>
</datafield>
<datafield tag="652" ind1=" " ind2=" ">
<subfield code="a">sieniruoat</subfield>
</datafield>
<datafield tag="700" ind1="1" ind2="0">
<subfield code="a">Ponomarev</subfield>
<subfield code="h">Aleksei</subfield>
</datafield>
<datafield tag="745" ind1=" " ind2=" ">
<subfield code="a">201 mainiota sieniohjetta</subfield>
</datafield>
<datafield tag="745" ind1=" " ind2=" ">
<subfield code="a">Vaskiratsastajan sienisalaatti</subfield>
</datafield>
</record>
Kenttä 245, kenen keksintö?
Kenenhän idea tää MARCin kenttä 245
on (kts. formaatin lisäksi mm. monografioiden kuvailusäännöt (PDF), osio 1. Nimeke- ja vastullisuusalue)? Viimeksi tänään KDK:n Primo -koulutuksessa hämmästeltiin tätä ihmeellistä kenttää. Mahtaako tätä blogia seurata joku, joka osaisi hieman valottaa koska tämä kenttä keksittiin, miksi ja mitä ongelmia sen oli tarkoitus ratkaista sekä miten 245 on aikojen saatossa kehittynyt?
Olis kiva kuulla tästä, laittakaahan kommenttia tuohon alle jos 245
herättää muistoja tai tunteita.
HelMet-tietue b1915995 (xrecord)
245 10 Bibliografinen valvonta :|bjohdatus luetteloinnin ja sisällönkuvailun menetelmiin /|cVesa Suominen, Jarmo Saarti, Pirjo Tuomi
HelMet-tietue b1752703 (xrecord)
245 10 Suomalaiset luettelointisäännöt. Monografioiden kuvailu / [Kansallinen luetteloinnin ohjausryhmä]; [julkaisija:] Helsingin yliopiston kirjasto
HelMet-tietue b1380128 (xrecord)
245 10 Tutkielma hallitusvallasta :|btutkimus poliittisen vallan oikeasta alkuperästä,laajuudesta ja tarkoituksesta /|cJohn Locke ; suomennos ja esipuhe Mikko Yrjönsuuri
HelMet-tietue b1551077 (xrecord)
245 10 Taru sormusten herrasta. 2 : Kaksi tornia / [suom. Kersti Juva ja Eila Pennanen ; runot suom. Panu Pekkanen] /|cJ. R. R. Tolkien