Riippumaton asiantuntija

Päävalikko

Siirry sisältöön
  • Etusivu
  • About
  • Minusta

Tag Archives: metadata

Artikkelien selaus

← Vanhemmat artikkelit

DogeDC, wow such kirjastotiede

Posted on 5 maaliskuun, 2014 by mace

0

DogeDC: 013

DogeDC: 013

DogeDC, kirjastotieteen ja kirjastojen metadataprosessien ytimessä.

Advertisement

Arvioi tämä:

Posted in kirjasto Tagged bibliografia, bibliografinen kuvailu, ddc, doge, dogedc, huumori, järjestelmä, kirjasto, luettelointi, luokitusjärjestelmä, metadata, sisällönkuvailu

Avoin vastaukseni Googlelle suomalaisen bibliografisen kirjastodatan saatavuudesta

Posted on 2 heinäkuun, 2013 by mace

0

Google

Sähköpostissani oli Cycling for librariesista palatessa tälläinen viesti Googlelta

From: Google
To: Mace
Subject: VASKI feed?

Hei,

terveisiä Googlelta.

Olen Googlen kirjahakuprojektissa mukana, ja osa sitä on erilaisten kirjatietokantojen haaliminen. Huomasin VASKI-dumpin täällä http://data.kirjastot.fi/data.html mutta se on jo vuodelta 2010. Tiedätkö onko siitä mahdollisesti uudempaa versiota, vai olisiko peräti saatavilla säännöllinen dumppi?

Huomasin myös Helmet-datan, mutta sen CC-BY tekee siitä hieman hankalammin käytettävän

Lyhyet vastaukset kysymyksiin:

  • valitettavasti ei
  • pahoittelen, CC0 tiedetään kyllä sallivammaksi lisenssiksi

Kirjastojen bibliografinen metadatahan on hajaantunut sinne tänne, eikä ole mitään yhteistä laaria josta sitä voisi itselleen hankkia. Lähimpänä tällaista yhteisluetteloa lienee BTJ:n AllFons -palvelu ja suomenkielisen kirjallisuuden osalta kansallisbibliografia Fennica. Tulevaisuudessa ehkä sitten Melinda ja KDK, kunhan ne saadaan kasattua. Molemmat ovat sitoutuneet avoimeen dataan. Esimerkiksi Saksan kansalliskirjasto on kunnostautunut datansa saatavuuden osalta.

Googlen Knowledge Panel

Googlen Knowledge Panel

Tässä vielä taustaa, tilannekatsaus sekä näkemyksiäni kirjastojen avoimeen (bibliografiseen) dataan:

Vaskin osalta tilanne on tällä hetkellä se, että alkuperäisen, itse kätilöimäni avoimena datana julkaisun jälkeen dumppia ei ole päivitetty ja avoin data ei ilmeisesti ole strategista toimintaa Vaskissa. En ole siellä enää töissä, joten parhaiten ja virallisesti asiaan osaa organisaation näkökulmasta vastata palvelujohtaja Ulla-Maija Maunu (sähköposti muotoa etunimi.sukunimi@turku.fi). Jos kirjastojen bibliografisesta datasta olisi uudempia versioita olemassa, ne olisivat tuolla http://data.kirjastot.fi/data.html:ssä, joka on kirjastojen yhteinen, simppeli ”datarepositorio”. Olen lähettänyt Vaskin datan myös Datahubiin.

Pääkaupunkiseutua ja joitain muita poikkeuksia lukuunottamatta muissakin Suomen yleisissä kirjastoissa data asustaa järjestelmäpalvelua tarjoavan Axiellin siipien suojissa. Kirjastot saavat omat datansa sieltä käyttöönsä Axiellin kirjastojärjestelmien kuten Auroran, PallasPron tai Origon kautta sekä niihin liittyvien web-liittymien kautta, sekä SRU-ohjelmointirajapinnalla johon pääsy tuppaa nyt Auroraan siirtymisen myötä olemaan rajoitettua. Pääsyn omaan raakaan dataansa kirjasto voi ostaa Axiellilta kuten marras-joulukuussa 2012 tekemässäni PIKI-tietokannan siivousmenetelmät -hankkeessa tehtiin (kts. projektinhallintatyökalun+työpäiväkirjan issue #3325). Axiellilta voi kysellä toimitushalukkuutta, -aikoja sekä -hintoja, ja katsoa lisäksi yllä mainitun PIKI-casen raportin talousosiota.

Axiellin Origo-järjestelmää käyttävät kirjastot ovat hyvässä asemassa, sillä ne voivat itse ottaa bibliografisen datansa ulos MARC-muodossa. Myös akateemisissa kirjastoissa, AMK:ien kirjastoissa sekä Kansalliskirjastolla on myös aika hyvät oltavat, koska ne pystyvät siirtelemään (ainakin bibliografista) dataansa ulos Voyager ja Aleph-järjestelmistään aika kitkattomasti.

Kansalliskirjaston liidaaman Kansallinen Digitaalinen Kirjasto -hankkeen on ollut tarkoitus saada datat liikkeelle kirjastojen omista järjestelmistä, ja se onkin edellytys koko KDK:n toiminnalle. Sama pätee EU:n Europeanaan. Lyhyesti sanoen sekä KDK että Europeana molemmat pyrkivät yhdistämään kirjastojen (sekä arkistojen ja museoiden) haut yhteen weppisivustoon. Syksyllä 2010 Turkuun lähtiessäni toivottiin OAI-PMH haravointirajapintaa yleisten kirjastojen bibliografisen datan siirtelyyn, mutta tietojeni mukaan tilanne on edelleen sama kuin Turusta lähtiessäni 2012 kesällä, eli Axiell ei valitettavasti ole saanut sitä vielä toimitettua. Kansalliskirjasto jo ostikin kaikille yleisille kirjastoille ja maksettua hintaa voi kysellä Kansalliskirjastolta tai Opetus- ja kulttuuriministeriöstä (KDK:n blogikirjoitus aiheesta ei valitettavasti ole enää saatavilla, valitettavaa ja hieman ironista sinänsä). Aihetta käsitellään Vaski-kirjastojen KDK-asiakasliittymän piloinnin loppuraportissa.

Tuo on siis tilanne käytännön datan liikuttelun kannalta. Helsingin alueella Helsinki Region Infoshare on kunniakkaasti edistänyt avoimen datan etenemistä, ja sen toiminta on nyt vakiintumassa osaksi Helsingin kaupungin Tietokeskusta. Siitä on tietenkin vielä paljon, paljon matkaa siihen, että virastojen, kuten Helsingin kaupunginkirjaston data oikeasti liikkuisi niin näppärästi kuin sen pitäisi. Helsingin kaupunginkirjastolla voinee jutella Jussi Vehviläisen ja Antti Pakarisen kanssa, HRI:llä Ville Melonin ja Tietokeskukselta löytynee joku myös.

Paljon puhuttujen immateriaalioikeuksien osalta tilanne on selvä, sillä kirjasto on itse tietokantansa sisällön ylläpitäjä (ei Axiell eikä sisällöntuottaja BTJ tai Kirjavälitys), ja näinollen myös immateriaalioikeuksien omistaja (Tekijänoikeuslaki 49 §). Lisäksi tekijänoikeuslaki takaa sille jolla on oikeus käyttää tietokantaa myös oikeuden tehdä siitä kappaleita (25 j § mom. 4), ja erikseen kumoaa lisenssiehdot jotka pyrkivät haittaamaan tätä (25 j § mom. 5). Lisäksi joku keskeinen oikeus päättyy 15 vuoden päästä tietokannan yleisölle saattamisen jälkeen (49 § mom. 2), mutta minulle on hieman epäselvää tarkalleen mikä.

Kollegiaalisia terveisiä sinne Googlelle lähettäen

Mace

Arvioi tämä:

Posted in kirjasto Tagged allfons, antti pakarinen, aurora, avoin data, axiell, axiell aurora, bibliografinen data, btj, cc-by, cc0, creative commons, data, deutsche national bibliothek, dnb, europeana, fennica, haku, hakukone, hanke, haravointi, helsingin kaupungin tietokeskus, helsingin kaupunginkirjasto, helsingin kaupunki, helsinki, helsinki region infoshare, hri, immateriaalioikeudet, jussi vehviläinen, kansallinen digitaalinen kirjasto, kansallisbibliografia, kansalliskirjasto, kdk, kirjasto, kirjastoala, kirjastopalvelut, kirjavälitys, linda, lisensoint, lisenssi, marc, marc21, melinda, metadata, oai-pmh, open data, piki, piki-tietokannan siivousmenetelmät, raportti, tekijänoikeudet, tekijänoikeus, tekijänoikeuslaki, tietokanta, ulla-maija maunu, vaski, ville meloni, yhteisluettelo

Helsingin kaupungin tietokeskuksessa (ml. Helsinki Region Infoshare) urkkimassa

Posted on 31 toukokuun, 2013 by mace

1

Helsingin kaupungin tietokeskus

Helsingin kaupungin tietokeskus

Olin huhtikuun 23. tutustumassa Helsingin kaupungin tietokeskuksen toimintaan. Hyvä että töissä kehotetaan nuuskimaan vähän muualla, Kirjasto 10:stä on oltu esim. Kaupunginkirjaston tapahtuma- ja markkinointiyksikössä, Arabian ja Tapanilan kirjastoissa ja hankinnassa.

Olen käynyt Ympärätalossa sijaitsevassa Tietokeskuksen kirjastossa jokusen kerran in-cognito nuuskimassa, ja tunnen Tietokeskuksen ja Forum Viriumin yhteistä Helsinki Region Infoshare -hanketta (HRI) sen voimakkaan roolin vuoksi, jonka se on ottanut suomalaisessa avoimen datan (so. open data) parissa tässä parin vuoden ajan. Lämpimiä terveisiä sinnepäin!! Muutoin Tietokeskus on ollut minulle sangen tuntematon elin.

Helsingin kaupungin tietokeskuksen historia yltää peräti sadan vuoden päähän ja tuoreimman vuosikertomuksen (varo PDF) mukaan siellä on hyvä meininki.

Helsingin kaupungin tietokeskus on tilaston, tutkimuksen ja arkistotoimen asiantuntija- ja vastuuorganisaatio. [Se] hankkii, tutkii, välittää ja säilyttää tietoa Helsingistä ja sen alueista – nykyhetkestä, menneisyydestä ja tulevaisuudesta.

Tietokeskuksen, tuttavallisemmin Tieken webbisivut löytyvät osoitteesta http://www.hel.fi/hki/Tieke/fi/Etusivu, ja kaupungin Helmi-intrassa on heillä oma osionsa myös. Tietokeskuksessa on oma kirjasto, jonka olemassaolo oli minulle jonkinlainen mentaalinen hyppylauta tutustumiskäynnille. Kirjastossa työskentelee kolmisen henkilöä, Tiekessä kokonaisuudessaan joku viitisenkymmentä. Kyselin kyllä kaikkien kirjastoihmisten koulutus- ja työtaustat mutta valitettavasti unohdin ne jo. Tietokeskuksen kirjasto palvelee sekä tietokeskusta itseään, mutta on myös avoin kaikille. Avoimuus on näin yleisen kirjaston piirissä kasvaneen kannalta hieman erilaista, sillä Tietokeskus on lukittujen ovien takana. Anyways niille jotka haluavat siellä käydä, sisäänkäynti on Ympyrätalon nurkalla. Kirjaston henkilökunnan mukaan tietopalveluhommia hoidetaan pitkälti sähköpostitse. Kirjaston kokoelmaa käyttää lähinnä Tietokeskuksen oma väki, joskin tutkijoiden ja muiden tyyppien kiinnostus kirjastoon tilattuja lehtiä (varo PDF) kohtaan jättää toivomisen varaa. Minun on ulkopuolisena vaikea arvioida miten hyvin Tietokeskus kirjastoaan hyödyntää, ja millainen rooli kirjastolla todellisuudessa on. En sen tarkemmin tivannut Tietokeskuksen henkilökunnalta. Sinällään kirjasto sijaitsee fyysisesti hyvällä paikalla, Tietokeskuksen pitkän, kaarevan käytävän varrella.

Hyllyjä. Kirjastossa pitää olla hyllyjä

Hyllyjä. Kirjastossa pitää olla hyllyjä

Tietokeskuksen kirjaston tietokanta löytyy verkosta, ja järjestelmänä on PrettyLib. Yksi mietittävä asia on, olisiko hyvä että Tietokeskuksen kirjaston kaltaiset kirjastot olisivat mukana HelMetissä tm. alueellisessa konsortiossa… Vaskissahan niitä on ollut, samoin PIKissä. Ja (Me)linda ja KDK -yhteydet tulevat mieleen myös. Ovat kuitenkin mukana suomalaisten erikoiskirjastojen verkostossa.

Helsinki Region Infoshare

Helsinki Region Infoshare

Tapasin Tietokeskuksella myös HRI:n Ville Melonin sekä Hami Kekkosen. Siihen liittyykin mukavia uutisia, nimittäin kolmivuotisen HRI -projektin hartiavoimin puskemat avoin data -jutut juurrutetaan Tietokeskukseen. Tämä on tietenkin hieno homma, ja auttaa meitä muita virastoja saamaan datamme liikkeelle. Helsingin kaupunginkirjastolta onkin jo jonkin verran dataa liikkeellä, ja katalogista löytyvää, muidenkaan julkaisemaa dataa ei tarvitse kauaa selailla ennenkuin tulee ideoita miten sitä voisi käyttää omiin tarpeisiin. HRI:n ylläpitämä datakatalogi varmaankin siirtynee Tietokeskuksen haltuun. Rönsynä todettakoot, että paraikaa Gentissä meneillään olevassa ELAG -konferenssissa (Twitterissä #elag2013) oli työpaja kirjastojen suhteesta tutkimusdataan, ja siellä Joss Winn puhui datakatalogiohjelmisto CKANista ja sen kehittymisestä. ELAGin videotaltionnit tulevat nettiin ensi viikolla.

Avoin data on monille tätä lukeville varmaan suunnilleen tuttu ilmiö, josta lisää esim. HRI:n sivuilla. Datan avaaminen on helppoa ja pakollista (ja hauskaa), ja HRI johdattelee kädestä pitäen. Avoin data helpottaa datan käyttöä sekä oman viraston ulkopuolella (esim. Tietokeskuksessa tai tutkimuksessa), sekä myös viraston sisäpuolella (esim. luettelointitoimiston ulkopuolella).

HRI:n lisäksi Tietokeskuksella käynnissä ehkä mielenkiintoisinta oli kaupunkitutkimuksen tutkimusohjelma Tietoa Stadista. Sitä on tehty muutaman vuoden välien (nyt 2010-2015).

Kaupunkitutkimusosaston toiminnan päälinjat ja keskeiset tutkimushankkeet määritellään kaupunginhallituksen hyväksymässä Helsingin kaupungin tutkimusohjelmassa. Tutkimusohjelma tehdään joka kolmas vuosi, ja sen keskeisenä tavoitteena on paitsi suunnata kaupungin tutkimusvoimavarat tehokkaasti ja tuloksellisesti, myös aktivoida, koordinoida ja konkretisoida Helsingin harjoittamaa tutkimusyhteistyötä.

Sisällysluettelo tässä (sori kopipeistattu joten näyttää vähän pahalta)

  1. TILASTO- JA TUTKIMUSTOIMINNAN STRATEGISET SUUNNAT VUOSILLE 2011–2015 11
    1. TIETO PÄÄTÖKSENTEON TUKENA 11
    2. TILASTO- JA TUTKIMUSTOIMINNAN ORGANISOINTI 12
    3. VAHVISTUVA KORKEAKOULUYHTEISTYÖ 13
    4. SEUTUYHTEISTYÖ JA LAAJENEVA TIETOPALVELU 14
    5. TIEDON SAANNIN TURVAAMINEN JA YHTEISTYÖ TIEDON TUOTTAJIEN KANSSA 15
    6. KANSAINVÄLINEN TOIMINTA 15
    7. TIETOJEN KÄYTETTÄVYYS JA JULKAISEMINEN 16
    8. HELSINKI-TIEDON KESKEISET TEEMAT 18
  2. 2. HELSINGIN KAUPUNGIN TILASTO-OHJELMA 2011–2013 21
    1. HELSINKI-TILASTON VAKIINTUNEET TUOTTEET JA PALVELUT 21
      1. PERUSTIETOVARANNOT JA TILASTOJULKAISUT 21
      2. TIETOKESKUKSEN YLLÄPITÄMÄT TIETOJÄRJESTELMÄT JA PAIKKATIETOJEN KEHITTÄMINEN 25
      3. TIETO- JA ASIANTUNTIJAPALVELUT 26
      4. ASIANTUNTIJOIDEN VERKOSTOT JA YHTEISTYÖKUMPPANIT 27
    2. HELSINKI-TILASTON KEHITTÄMISHANKKEET VUOSILLE 2011–2013 28
      1. ASUMINEN, KAUPUNKIRAKENNE JA YMPÄRISTÖ 28
      2. HYVINVOINTI, TERVEYS JA PALVELUT 32
      3. KUNTATALOUS, TYÖMARKKINAT JA KILPAILUKYKY 35
      4. PERUSTIETOVARANTOJEN KEHITTÄMINEN 36
      5. TIETOVARANTOJEN AVAAMINEN, HALLINTA JA KÄYTETTÄVYYDEN PARANTAMINEN 37
  3. 3. HELSINGIN KAUPUNGIN TUTKIMUSOHJELMA 2011–2013 38
    1. 3.1 ASUMINEN, KAUPUNKIRAKENNE JA YMPÄRISTÖ 39
    2. 3.2 DEMOKRATIA JA HALLINTO 45
    3. 3.3 HYVINVOINTI, TERVEYS JA PALVELUT 48
    4. 3.4 KAUPUNKIKULTTUURI 55
    5. 3.5 KUNTATALOUS, TYÖMARKKINAT JA KILPAILUKYKY 59

Ohjelma löytyy netistä (varo PDF), ja on kiinnostavaa luettavaa. Siitähän selviää mitä tietoa Helsingistä on tiedossa, eli metatietoa siitä mitä tietoa meillä on tulevaisuudessa. Ohjelma on kehitetty koko Helsingin kaupungin laajuisena yhteistyönä, joten kaupunginkirjastollakin on ollut mahdollisuus vaikuttaa ja osallistua siihen. Ohjelmaa lukiessa selviää millaisten toimijoiden kanssa Tieke tekee tutkimusyhteistyötä. Linkkaan tässä nyt tilaisuuden tultua Jaani Lahtisen tammikuiseen luentoon Lainaustiedot kirjaston johtamisen työkaluna.

Tietokeskuksen muista julkaisuista mainittakoot Helsingin tila ja kehitys 2013 (varo PDF), neljännesvuosittain julkaistava Kvartti, sekä Helsingin seudun aluesarjat -tietokanta (sis. raakaa dataa)

Vierailuni päättyi eläväiseen kierrokseen kaupunginarkistossa, joka on myös osa Tietokeskusta. Kiitos vieraanvaraisuudesta ja virka-avusta Tietokeskukseen!

Helsinki

Helsinki

Arvioi tämä:

Posted in kirjasto Tagged arkisto, avoin data, ckan, data, elag, elag2013, european library automation group, helmi, helsingin kaupungin tietokeskuksen kirjasto, helsingin kaupungin tietokeskus, helsingin kaupunginkirjasto, helsingin kaupunki, helsinki, helsinki region infoshare, hri, jaani lahtinen, kansallinen digitaalinen kirjasto, kaupunginarkisto, kaupunkitutkimus, kdk, kirjasto, kirjastopalvelut, melinda, metadata, open data, piki, tilasto, tilastointi, tutkimusohjelma, vaski, vierailu, ympyrätalo

Muistutus: metadata on sontaa

Posted on 27 lokakuun, 2012 by mace

0

Cory Doctorow (kuva NK Guy, nkguy.com.tiff)

Cory Doctorow listasi vuoden 2001 esseessään Metacrap: Putting the torch to seven straw-men of the meta-utopia seitsemän syytä miksi metadata on sontaa emmekä elä meta-utopiassa kuten jotkut ehkä haluaisivat:

  1. Ihmiset valehtelevat
  2. Ihmiset ovat laiskoja
  3. Ihmiset ovat tyhmiä
  4. Mahdoton tehtävä – tunne itsesi
  5. Skeemat eivät ole neutraaleja
  6. Mittarit vaikuttavat tuloksiin
  7. On useampi kuin yksi tapa kuvailla jotain

(via @brinxmat, Defining/Defying reality: the struggle towards relevance in bibliographic data)

Arvioi tämä:

Posted in Ave amator! Morituri te salutant! Tagged 2001, cory doctorow, data, historia, kritiikki, metacrap, metadata, ongelma

Kuka nää on luetteloinu?

Posted on 7 maaliskuun, 2012 by mace

0

Tämänkin teoksen asiasanat voisivat olla "kirja" ja "kirjallisuus", ehkä myös "selluloosa"

Jos kirjallisuutta luetteloitaisi ja kuvailtaisi kuten digitaalisia pelejä luetteloidaan ja kuvaillaan, kaikilla kirjoilla olisi sisällönkuvailuna asiasanat kirjat, kirjallisuus sekä selluloosa.  Huomautuskentässä voisi kertoa mitä vaaditaan käyttämiseen, esim. ”valot, vähintään yksi käsi, lukutaito 2000-luvun suomen kielellä”. Toisessa huomautuksessa voisi mainita että lainausoikeuden on myöntänyt Suomen tekijänoikeuslaki. Oheisessa kuvassa olevan teoksen nimeke olisi jotain tämän tyyppistä: Bibliografnen valvonta [Painettu aineisto] : Johdatus luetteloinnin ja sisällönkuvailun menetelmiin : Kirja. Kannessa mainittuja tekijöitä ei olisi olemassakaan eikä tekijät olisi muutenkaan mitenkään merkittävä asia. Poikkeuksena voisivat olla elämäkerrat, joiden tekijöinä olisi ehkä ne henkilöt/bändit josta ko. teos kertoo.

Aineistolajit eivät ole aineistolajeja, sisällönkuvailu ei kuvaile sisältöä, nimeke ei kerro nimekettä, tekijöitä ei kirjata ensinkään… onkohan kirjastojen luettelointisäännöt ja sovellusohjeet pitkäaikaissäilytyksen piirissä? Tästä datasta ei nimittäin tulevaisuuden ihmiset ota kyllä mitään tolkkua ilman niitä. LOL olisikin hauska joutua joskus päättelemään datasta että mitä oikeastaan sillä oli tarkoitus kuvata. Jos esim. Vaskia on uskominen, keskeisin kulttuurin kyseisen osa-alueen tekijä on Metallica, joka on todellisuudessa vaari-ikäinen power-rokkia soittava yhtye, jonka huippuvudet sijoittuvat minun ikästeni varhaisnuoruuteen.

Olen miettinyt ja suorastaan seuraillut pelien luettelointia muutama vuosia Vaskissa, HelMetissä, PIKIssä, Aallossa sekä Fennicassa, tilanne vaikuttaa onneksi olevan hitaasti paranemaan päin. Mistä nää tietueet oikein tulee? BTJ:ltä? Alalla on paljon kaikenlaisia hauskoja työ- ja ohjausryhmiä, ja niihin osallistuminen onkin mainio mahdollisuus saada kaffea ja ehkä pullaakin neljästi vuodessa. Mikä työryhmä ohjaa pelien luettelointia?

Ja tietenkin avauduin myös Kirjasto-kaapelilla:

Moi, tietääkö joku onko olemassa jotain tahoa joka yhtään kattoisi konsoli- ja tietskapelien yms. luetteloinnin perään? Sekä bibliografisessa kontrollissa että sisällönkuvailussa olis vielä skarpattavaa, ja ennenkaikkea yhtenäistettävää muiden julkaisujen luetteloinnin kanssa. BTJ:ltä nää tietueet kai tulee, mutta onko tähän jotain ohjausryhmää tai jotain?

Jos alkaisi viimein – about 30 vuoden jälkeen – kirjaamaan peleihin tekijät (joo pelit asuu tietokoneessa, mutta kyllä ne on ihminen ihan oikeeasti tehny) ja vaikka joku yhteinen ontologia pelityypeistä, ni päästäis jo ihan kivaan alkuun.

Yliopistossa mulle opetettiin että just tässä me ollaan ihan mielettömän hyviä.

Arvioi tämä:

Posted in Ave amator! Morituri te salutant!, kirjasto, muualla sanomaani Tagged bibliografia, bibliografinen kuvailu, btj, kirjasto, luettelointi, metadata, pelit, sisällönkuvailu, tietokonepelit

Jälkiajatuksia kirjastojen avoimen datan semmasta Jyväskylässä

Posted on 19 helmikuun, 2012 by mace

4

[kieltämättä asiaan liittymätön, mutta dubstepin tahtiin skänkkäävä kissa 3D:nä]

Torstaina puitiin Jyväskylän kaupunginkirjaston emännöimänä ja Antti Poikolan fasilitoimana kirjastojen suhdetta avoimeen dataan. Tapahtuman muistiinpanot voi, ja kannattaa syynäillä yhteisestä muistiosta. Antti myös videoi alustukset (Antti Poikola, Antti Pakarinen, Petri Tonteri ja minä, 1 tunti 12 min.) ja työpajailun jälkeisen loppukeskustelun (40 min).

Täydentelin muistiota vielä, esim. näkemystäni BTJ:n suhteesta tietokantojemme omistukseen immateriaalioikeuksien näkökulmasta, muutamia ilmassa olevia ideoita ja silmäilin muutenkin muistiinpanoja torstaita hahmottaakseni. Seminaarissa keskustelu pyöri varsinaisen avoimen datan ympärillä toki, mutta kuten noista muistiinpanoistakin ilmenee, monesti tuli esille sekin, että meillä itsellämme ei ole pääsyä omiin datavarantoihimme tai mielenkiintoinen data tuntuu jatkuvasti valuvan näppiemme läpi. Käyttöideoita on vaikka kuinka paljon. En näe perinteisillä perusjärjestelmätoimittajillamme kovin kaksista roolia tässä, joten ei muuta kuin aloite omiin käpäliin vaan! 🙂

Sangen selvä tahtotila asiasta on: datat auki. Olisi tietenkin hyvä saada tarkasteltaviksi ne argumentit ja ongelmat miksi datamme ei ole avointa, ja sitten ratkoa ne.

Nyt on sopivasti myös se aika vuodesta kun kirjastoissa koostetaan tilastoja OKM:lle ym. toimittamista varten. Noita tilastoja on aika paljon, ne ovat hyvin kattavia, julkisia ja niihin on vieläpä avoin käyttöliittymä osoitteessa http://tilastot.kirjastot.fi. Avointa dataa nuo tilastot eivät kuitenkaan ole, sillä varsinainen data ei ole koneellisesti saavutettavassa muodossa. Tulipa mieleen, että nyt kun Kirjastot.fi rakentelee paraikaa uutta versiota kirjastotietokannastaan (josta tulee muuten mahtava) ja myös koneellisesti saavutettava, saataisikohan myös nuo tilastot mukaan?

Yksi mietintämyssyssä pidettävä näkökulma on tämä: suomalaiset kirjastot eivät ole kokeneet asiakseen avata dataansa, mutta muutamat muut toimijat ovat: miten me kirjastot voisimme näitä muiden nyt meidänkin saatavillemme antamia datoja hyödyntää?

Arvioi tämä:

Posted in kirjasto Tagged antti pakarinen, antti poikola, avoin data, btj, data, immateriaalioikeudet, innovaatio, jyväskylä, jyväskylän kaupunginkirjasto, kirjasto, kirjastopalvelut, kirjastot.fi, kirjastotietokanta, labs.kirjastot.fi, metadata, omistaminen, open data, palvelumuotoilu, palvelut, seminaari, tapahtuma, tietokanta, tilasto, tilastointi

Bibliografinen data on blääh, meillä on parempaakin

Posted on 11 tammikuun, 2012 by mace

2

Mitä kaikkea dataa kirjaston itse kannattaa ylläpitää?

Mitä Lukas sanoi, bibliografinen metadata ja kuvailutiedot eivät ole kiinnostavinta dataa mitä meillä kirjastoilla on. Se on itseasiassa aika tylsää faktojen luettelemista ja se voidaan tuottaa, säilöä ja ylläpitää keskitetysti, ja jopa ostaa kuten tapana onkin (BTJ:ltä).

Bibliographic metadata as such describe publications, in the broadest sense, providing information about title, authors, subjects, editions, dates, urls, but also physical attributes like dimensions, number of pages, formats, etc. This type of information, in FRBR terms: Work, Expression and Manifestation metadata, is typically shared among a large number of libraries, publishers, booksellers, etc. ‘Shared’ in this case means ‘multiplied and redundantly stored in many different local systems‘. It doesn’t really make sense if all libraries in the world publish identical metadata side by side, does it?

Se mikä sensijaan oikeasti on mielenkiintoista, on paikallinen käyttödata sekä niteistä ja kokoelmista kertova data.

Currently, library data that is really unique and interesting is administrative information about holdings and circulation. After having found metadata about a potentially relevant publication it is very useful for someone to know how and where to get access to it, if it’s not freely available online. Do you need to go to a specific library location to get the physical item, or to have access to the online article? Do you have to be affiliated to a specific institution to be entitled to borrow or access it?

Usage data about publications, both print and digital, can be very useful in establishing relevance and impact. This way information seekers can be supported in finding the best possible publications for their specific circumstances.

Tästä on Suomessakin ollut puhetta tietyissä piireissä. Mitään kehitystä tähän suuntaan ei ole kuitenkaan otettu eikä toistaiseksi ole näkyvissäkään. Ehkä sitten, kun yhteisluettelo kansallinen metadatavaranto (”Melinda”), KDK:n asiakasliittymä, Axiell Arenan kansalliset ulottuvuudet tai jokin vastaava valmistuu ja teostaso voidaan kokonaan siirtää veke kaikista kirjastoista ja tehdä haut yhteen indeksiin (ja rajata halutuin ehdoin, esim. kuuluuko teos oman kirjastoni kokoelmaan), voidaan ruveta miettimään tällaisia asioita.

Lukekaa Lukaksen kirjoitus Local library data in the new global framework, jossa Lukas kertoo paikallisdatan merkityksestä tarkemmin ja myös esittelee malleja miten homman voisi toteuttaa.

Arvioi tämä:

Posted in kirjasto Tagged arena, avoin data, axiell arena, bibliografia, bibliografinen kuvailu, btj, data, hakeminen, haku, julkaiseminen, kansallinen digitaalinen kirjasto, kdk, kirjasto, linked data, luettelointi, lukas koster, melinda, metadata, open linked data, sisällönkuvailu, tiedonhaku, tiedonhallinta, yhteisluettelo

Kaksi avoin data -sovellusta tällä viikolla: tuplakontrolli ja VuFind

Posted on 19 marraskuun, 2011 by mace

2

Metadataa. Kirjastotyön apuprosessien ytimessä!

Turun ja naapurikuntien kunnankirjastojen Vaski-kirjastokimppa julkaisi aineistotietokantansa avoimena datana vähän aikaa sitten. Avoimen datan idea on, että hyödyllinen annetaan esteettä kaikkien käyttöön. Tällainen ajattelu sopii erinomaisesti kirjastoihin. Yksi hauska puoli avoimessa datassa on se, että data on silloin myös meidän itsemme käytössä. Tämä ei ole ollenkaan itsestäänselvää – normaalisti voimme itsekin käsitellä MARC-tietueitamme vain yhdellä työkalulla, nimittäin kirjastojärjestelmällämme. Vaskissa käytämme Axiellin PallasProta, jolla ei voi tehdä kaikkea. On tärkeää päästä dataan käsiksi monin eri tavoin, ja monien eri tahojen toimesta.

Tässä kaksi casea, joissa kuluneella viikolla hyödyin siitä, että minulla (kuten kakikilla maailman ihmisillä) on esteetön pääsy luettelointidataamme.

Case 1: tuplakontrollia

Duplikaattiongelma. Lulz

Täällä Vaskissa me valmistaudumme vaihtamaan PallasPron toiseen Axiell-tuotteeseen, Auroraan. Samassa tietokantaamme tulee mukaan lisää kirjastoja, ja siirrymme FinMARC -luettelointiformaattista MARC21:een. Anna valvoo ja suunnittelee sitä, yhdessä muiden luetteloijien ja Axiellin kanssa.

Vaski, kuten muutkin kirjastotietokannat ovat sangen sotkuisia monellakin tapaa. Esimerkiksi yhdestä teoksesta saattaa olla useita luettelointitietueita (ns. tuplia (tai tripliä (tai quadruplia (ad nauseaum)))). Ne ovat tietokannan käytön kannalta ärsyttäviä, ja niitä yritetään nyt siivoilla pois.

Tein Annalle tällaisen Perl-ohjelman, joka etsii tuplia ISBN-koodin perusteella (joka on tallennettu kenttään 021‡a):

#!/usr/bin/perl
# lists ISBN-codes which appear in more than one MARC record

use MARC::Batch;

my $file = "vaski-kunnostettu.mrc";
my $batch = MARC::Batch->new('USMARC', $file);

$batch->strict_off();
# First, let's create a magnificient hash or arrays, with ISBNs as keys, and
# lists of record ids as values
while ($record = $batch->next()) {
	for my $field ($record->field('021')) {
		my $isbn = $field->subfield('a');
		push(@{$recsperisbn{$isbn}}, $record->field('001')->data());
	}
	++$i;
}

# then let's see through the hash, and print all the ISBNs which appear in more
# than one record, and list all the records ids per ISBN too
while (my ($key, $value) = each(%recsperisbn)) {
	if (@$value > 1) {
		print($key, ": ");
		foreach $recid (values($value)) {
			print($recid,",");
		}
		print("\n");
	}
}

Tämä ohjelma käy järjestyksessä läpi kaikki tietueemme, ja muodostaa kaikista esiintyvistä ISBN-koodeista listan missä kaikissa tietueissa se esiintyy. Lopuksi se tulostaa kaikkien sellaisten tietueiden tunnisteen (kentästä 001), joiden ISBN esiintyy useammassa kuin yhdessä tietueessa. Näitä löytyi reilu 15 000. Anna arvioikoot, mitkä niistä voisi yhdistää keskenään. Yllä oleva Perl-ohjelma on rakennettu MARC::Record ja MARC::Batch -ohjelmointikirjastojen päälle, jotka ovat ilmaisia, standardin mukaisia ja avointa lähdekoodia.

Case 2: verkkokirjaston pystyttäminen

VuFind

Toinen tämänviikkoinen näpertelyn kohde on VuFind. Se on täysiverinen verkkokirjasto-ohjelmisto, verrattavissa esim. KDK-hankkeessa pilotoitavana olevaan ExLibriksen Primoon. Hakumoottorina VuFind käyttää Solria. Vain paras on kyllin hyvää! Sanomattakin selvää, että sekä VuFind että Solr ovat avointa lähdekoodia ja vapaasti käytettävissä.

Taustajärjestelminä VuFind voi suoraan käyttää Alephia, Voyageria, Innovativen Milleniumia, avoimen lähdekoodin eXtensible Catalogia, Kohaa ja Evergreeniä, OCLC PICAa ynnä muita. Kuten erittäin hyvin tiedämme, me suomalaiset yleiset kirjastot olemme marginalisoituneita kansainvälisistä kollegoistamme omine Axiell-järjestelminemme, mutta VuFindin ja Axiellin järjestelmien väliin voi kyllä rakentaa yhteyden. Tämä tapahtuu laatimalla ohjelma, jota VuFindissa kutsutaan ILS -ajuriksi. Toisessa päässä, eli Axiellin kirjastojärjestelmän päässä käytetään Axiell Web Services -rajapintaa, joka on useiden suomalaisten Axiellin tuotteita käyttävien kirjastojen käytettävissä.

Viikin kampuskirjaston eViikki -palvelu

Suomessa VuFind on käytössä ainakin Helsingin yliopiston Viikin kampuskirjastossa, jonka palvelu on nimeltään eViikki. Maailmalta löytyy paljon kirjastoja, jotka ovat valinneet VuFindin.

En perjantaina jaksanut alkaa säätämään virallisen tietohallinnon kanssa tai ehdottelemaan mitään toimiryhmien perustamista ja kerran kuukaudessa pidettäviä pullakahvikokouksia, joten laitoin omin nokkineni palvelimen pystyyn Amazonin EC2 -pilveen. Se oli asiaan jo ennalta tutustuneena oikeastaan pöyristyttävän helppoa ja siihen meni alle tunti. VuFindin olen aiemmin asentanut omalle läppärilleni, mutta nyt pystyttämääni palvelimeen indeksoin myös Vaskin bibliografisen datan ja katsoin järjestelmää muutenkin tarkemmin. Datamme on FinMARCia, mutta olen konvertoinut sen itse MARC21:ksi Kansalliskirjaston ylläpitämillä konvertointisäännöillä sekä USEMARCON-ohjelmalla (kiitos Ulla, Ere ym.). Näitä Axiellkin käyttää kun teetätämme heillä konvertointityötä.

Hyvältä ja selkeältä näyttää toi VuFind kyllä 🙂

Laadukas viikko takana 🙂

Arvioi tämä:

Posted in kirjasto Tagged avoin data, avoin lädekoodi, avoin lähdekoodi, axiell, axiell aurora, axiell web services, deduplikointi, evergreen, eviikki, extensible catalog, finmarc, helsingin yliopiston kirjasto, isbn, kansallinen digitaalinen kirjasto, kdk, kirjasto, kirjastojärjestelmä, kirjastojärjestelmät, kirjastotietokanta, koha, luettelointi, marc, marc konversio, marc21, metadata, näyttöluettelo, opac, pallaspro, perl, politiikka, solr, tietohallinto, tietojärjestelmä, tietojenkäsittely, tietokanta, tietokantahuolto, tuplakontrolli, turun kaupunginkirjasto, usemarcon, vaski, viikki, vufind, xc

Nyt uusiksi se hyllyluokitusjärjestelmä

Posted on 29 lokakuun, 2011 by mace

2

Noni ne YKL:t, HKLJ:t, DDC:t, UDK:t ja muut roskasysteemit hiiteen jo ja tästä mallia!

Kyllä arkkitehti (rakennussellainen tai sisustussellainen, ei tietojärjestelmäsellainen) tietää.

(via Benjamin Blinten)

Arvioi tämä:

Posted in kirjasto Tagged arkkitehtuuri, ddc, dewey decimal classification, helsingin kaupunginkirjaston luokitusjärjestelmä, hklj, huumori, hyllyluokitus, informaatio, kirjasto, logistiikka, lol, luokitusjärjestelmä, metadata, satiiri, the confusing library, the two ronnies, väri, video, ykl, yleinen kymmenluokitus

Trip to old fortress in Lieto, and KDK

Posted on 18 toukokuun, 2011 by mace

0

"So, this bunch of barbarians was coming from over there..."

Yesterday a dozen or so people from Turku City Library bicycled to Lieto, to a historical site called Vanhalinna. It’s a pretty weird looking big rock sticking out of the flat ground, a bit like Uluru or something. Anyway, there used to be an important fortress when these parts of the world were coming to iron age. The big hill used to be and island of the archipelago. But now the sea has retreated quite a bit and a new fortress was built around the 13th centuy. This new fortress is the Turku Castle.

Being a little new here at Turku City Library, i learned that this is an annual tradition here to bicycle to some interesting site nearby in the springtime, and that’s fantastic of course (kuka tietää mitä on ”tyhy-toiminta” englanniksi?)

There is also a mansion next to the big rock. The site is administered by a foundation, and part of the Turku University. They have an interesting museum there, with several historical exhibitions and art exhibitions too.

Museums and museum-people fascinate me (remember, they are our sisters and brothers), so i had a little chat with a member of the staff there (aargh i didn’t catch her name). I asked about their cataloguing work, and she told me so far they have catalogued objects, and also would like to catalogue all the buildings in the area. We talked some stuff about education to become librarians and museum-people. Then we also talked about collection management in museums and libraries… and soon we were talking about KDK, (Kansallinen digitaalinen kirjasto, National Digital Library of Finland). KDK is a bit special because in addition to libraries, it has  museum and archive colletions in it too, all in a unified user interface… it’s a bit like a national Europeana really. Anyway i told her about those KDK and Europeana, and she said they are now converting their database so they can join Musketti, a database system for finnish museums… then KDK too. This is great, because i am currently working here in Turku to prepare KDK so that it will be suitable for the Vaski-consortia in this area and for finnish public libraries in general. I want to help the Linnavuori museum-people to join KDK if i just can!

Down to the mansion

The bicycling trip was about 20km, so it’s a great little daytrip if you want to visit a nice, interesting site close to Turku.

Thanks to Krisse, our excellent guide who told us a lot of interesting stuff about the site, thanks the museum-person for chats and also to everyone who joined the tour.

Arvioi tämä:

Posted in kirjasto Tagged bicycling, cyc4lib, cyclingforlibraries, digitaalinen kirjasto, digital library, europeana, fortress, historia, history, kansallinen digitaalinen kirjasto, kdk, kirjasto, kulttuurihistoria, library, lido, lieto, linnavuori, metadata, museum, musketti, public library, turku, turku castle, uluru, vaski

Tiesitkö tämän MARCista: salainen kolmas indikaattori

Posted on 2 helmikuun, 2011 by mace

2

Salainen kolmas indikaattori

Harva tietää, että MARC -luettelointiformaattissa kullakin kentällä on todellisudessa kolme indikaattoripaikka. Tyypillisesti kirjastoammattilaisille, jopa luettelointia päätyönään tekevillekin kerrotaan vain ensimmäisestä kahdesta indikaattorista. Vain harvat saavat koskaan kuulla kolmannesta indikaattorista.

Oletko huomannut, että kentän numerokoodin ja indikaattoreiden jälkeen on miltei poikkeuksetta tyhjä sarake? Se on todellisuudessa se paikka, jonne piilotettu kolmas indikaattori on tallennettu.

Kolmas indikaattori, jonka käyttö kuvataan erillisessä, aiemmin vain todella harvojen luettelointiammattilaisten käsiin annettavassa dokumentissa. Usein tieto kolmannesta indikaattorista onkin kulkenut suullisena perimätietona, niinsanottuna hiljaisena tietona. Tämän salaperäisen indikaattorin käyttö vaihtelee eri kentissä eikä ole varmaa missä kentissä se edes on määritelty, mutta yleensä sitä käytetään kuvailemaan luetteloijan sieluntilaa luettelointihetkellä: arvo 0 tarkoittaa että luetteloija kyseistä kenttää täyttäessään oli nälkäinen, 1 että hän oli hyvin, hyvin väsynyt, 2 että hän oli päihtynyt ja arvo 3 että hän pilaili.

Kiinteämittaisissa kentissä ja nimiössähän ei indikaattoreitä käytetä, mutta hatarien ja vahvistamattomien tietojeni mukaan niihin saattaa olla piilotettuna dataa luettelointiformaatin, siis MARCin itsensä kehittäjien mahdollisista sieluntiloista.

Arvioi tämä:

Posted in kirjasto Tagged hiljainen tieto, indikaattori, kolmas indikaattori, luettelointi, marc, marc21, metadata, perimätieto, salaisuus, suullinen perimätieto

Datat auki hallituksen päätöksellä, jos ei muuten

Posted on 27 tammikuun, 2011 by mace

4

Hei kirjasto: avaa datas tai ne avataan (kuva Arja Lento / YLE, sori et förasin)

Avoin data (l. Open Data) etenee Suomessakin. Twitteristä sattui silmiin juuri Ehdotus valtioneuvoston periaatepäätökseksi julkisen sektorin digitaalisten tietoaineistojen saatavuuden parantamisesta ja uudelleenkäytön edistämisestä (52KB PDF). Kymmensivuisen tekstin tiivistelmä:

Periaatepäätöksen linjaukset esittävät tarvittavat toimenpiteet julkisten tietovarantojen saatavuuden ja uudelleenkäytön lisäämiseksi yhteiskunnan kaikilla alueilla. Linjaukset sisältävät kehittämistoimet tietopolitiikan ja lainsäädännön selkeyttämiseksi, käyttöä mahdollistavien rakenteiden ja käytänteiden luomiseksi sekä palvelu- ja sovelluskehityksen edistämiseksi.

Tietopoliittisilla linjauksilla tavoitellaan sitä, että julkisen sektorin digitaaliset tietoaineistot ovat avoimesti saatavilla ja uudelleenkäytettävissä yhtenäisin, selkein ja kaikille tasapuolisin käyttöehdoin. Tietoaineistoja tarjotaan kustannustehokkaasti, jolloin kansantalouden kokonaisedun kannalta tietoaineistot ovat pääsääntöisesti maksuttomia käyttäjälle. Samalla budjetoinnin ja tulosjohtamisen kautta on huolehdittava tietoaineistojen laadusta ja ylläpidosta.

Koko yhteiskunnan käyttöön luotavan tietoinfrastruktuurin avulla voidaan tietoaineistoja tarjota tehokkaasti. Hallinnonalojen tulee tunnistaa ja kuvata tietoaineistonsa uudelleenkäyttöä varten. Tietosisältöjen yhtenäiset kuvailutiedot ja palveluhakemistot helpottavat tiedon käyttöä. Luovutettavissa olevat tietoaineistot saatetaan koneluettavassa muodossa ja avoimilla rajapinnoilla käyttäjille. Tietoaineistojen tarjontaa ja käyttöä edistämään tulee luoda tarvittavat tukipalvelut. Avoimen tietoinfrastruktuurin kehittäminen ja ylläpito turvataan pitkäjänteisellä rahoituksella.

Palvelu- ja sovelluskehityksen edistämiseksi tarvitaan yhteistyömalleja ja kannustimia. Julkisessa hallinnossa kehitetään avoimen tiedon kulttuuria ja tuetaan kehittäjäyhteisöjen toimintaa. Alan tutkimusta ja kansainvälistä yhteistyötä tulee vahvistaa. Kokeilevaan toimintaan on panostettava erityisesti laajaa kysyntää edustavien tietoaineistojen avaamiseksi ja yhtenäisten käytänteiden luomiseksi.

Teksti on vielä luonnosvaiheessa. Suomessa kirjastot ovat lähteneet erittäin heikosti mukaan datansa avaamistalkoisiin (lue: “datan piilottelun lopettamistalkoisiin”). Jos dataansa ei halua auki, niin nyt vähän äkkiä kampanjoimaan tätä hallituksen periaatepäätöstä vastaan… jos rahkeita riittää. Henkilökohtaisesti en usko että kukaan tätä trendiä sinänsä vastustaa, vaan jahkailu on johtunut siitä, että kirjastolaiset ei vieläkään ymmärrä mitä avoin data tarkoittaa, emmekä ole ottanut asiaksemme selvittää. Katsokaas alkajaisiksi vaikka avointa dataa käsittelevät kirjoitukset Sorvipenkin äärellä -blogista, Kirjastot.fi:n Labsin blogista ja tästäkin blogista. Noh, ei se mitään, asia etenee ilman meidän omaa ymmärrystä ja tahtoa ei tarvita jos asia tulee hallitusohjelmaan tai muutoin säädellään meidän ulkopuolelta.

Kirjaston bibliografisen datan avaamisen ensiaskeleet ovat nämä:

  1. ilmoita luetteloijille aikeista, jotta tietävät
  2. juttele Labsin kanssa
  3. dumppaa tietokanta
  4. lähetä dumppi kirjastojen avoimeen datavarantoon data.kirjastot.fi
  5. viesti (Suomi.fi, Kirjasto-kaapeli, Kirjastolehti, lehdistö)
  6. profit!

Kohta 3 sujuu Origosta muistiinpanojeni mukaan näin: Aineistonhallinta->Vienti->ei hakuehtoja->valitse kaikki->Hyväksy valinta. Tiedostomuodoksi ISO-2709 ja tallenna johonkin omalle tietokoneelle. Yritän muistaa tehdä opetusvideon joskus kun olen Origon äärellä. Dumppaaminen kestää Varsinais-Suomalaisessa, keskikokoisessa kirjastossa kolme neljä tuntia. Ei tiedostokaan ole suuri, Vaski-tietokanta on 763MB.

PallasPro-asiakkaat voivat tilata dumpin Axiellilta (älä maksa liikaa (tonni on liikaa)), tilauskoodi moihaluttaistietokantadumppiosakohteineeniso2709siirtoformaatissajamerkistökoodauksenavaikkapamarc8. Mitenkäs se Voyagerista, Primosta ja muista järjestelmistä käy?

Euroopan yhteisen digitaalisen kirjaston Europeanan Data Provider -sopimuksessa (Europeana Aggregators’ Handbookin liitteenä, s. 44) on myös sovittu, että Europeanaan toimitettava data avataan (kts. artikla 4, Licence of rights for Metadata from Data Provider to
Third Parties, PDF:n s. 47). Epä-kaupallisuus -poikkeuksesta ollaan luopumassa, kuten Tapani vastikään kirjoitti Kansallisen digitaalisen kirjaston (KDK) asiakasliittymän blogissa, otsikolla Europeanan reunoilta. Ja KDK:honkin liittyy omat sopimuksensa, jossa tällaisista asioista sovitaan. KDK -pilotoinnissa meitä on vajaa tusina, seuraavassa KDK-aallossa kymmeniä lisää.

Miten me kirjastoalalla hoidettaisi toi valtioneuvoston periaatepäätöksen luonnoksen neljäs kappale? Asiakas-workshoppeja MARCista? Auts.

Helsingin Sanomat on tarttunut mahdollisuuteen keräillä vielä PR-pisteitä Open Data -buzzista julkaisemalla kustantamovertailunsa tuloksen datat (csv).

Helsingin Sanomat vertaili kustantajien kirjallista laadukkuutta antamalla pisteitä niiden julkaisemien kotimaisten kaunokirjojen saamille palkinnoille, ehdokkuuksille, myyntitilaston kärkisijoille ja käännöksille vuosina 2000–2010.

Tämä jos mikä kiinnostanee kirjastolaisia. Näitä voisi leipoa yhteen esim. kirjastojen kuvailudatan kanssa ja sitä kautta katsoa vaikkapa risteävätkö palkituimpien teosten asiasanat kirjastoon lainatuimpien teosten asiasanojen kanssa. Tämä edellyttää sitä, että lakkaamme piilottelemasta dataamme asiakkailta ja yhteiskunnalta, ja myös itseltämme ja kollegoiltamme.

Avoimen Dataan liittyvien, ilmaisten PR-pisteiden jako päättyy, kun hommasta tulee normaalitoimintaa, ja asiaahan siis odotellaan seuraavaan hallitusohjelmaan. Pistäkääs siis töpinäksi.

Hoi Tampere/PIKI, ette varmasti kerkeä avoimeksi dataksi bibliografisine datoinenne ennen Turkua/Vaskia :^) Kymppi vetoa!

Arvioi tämä:

Posted in Ave amator! Morituri te salutant!, kirjasto Tagged avoin data, axiell, data, europeana, europeana data provider agreement, helsingin sanomat, innovaatiopolitiikka, kansallinen digitaalinen kirjasto, kdk, kirjastopolitiikka, kustantamovertailu, labs.kirjastot.fi, marc, metadata, myyntitilasto, ohje, open data, origo, palkinto, pallaspro, piki, politiikka, sopimus, sorvipenkin äärellä, tietovarantopolitiikka, tilasto, vaski, voyager

Kenttä 245, kenen keksintö?

Posted on 25 tammikuun, 2011 by mace

3

MARC -standardit

Kenenhän idea tää MARCin kenttä 245 on (kts. formaatin lisäksi mm. monografioiden kuvailusäännöt (PDF), osio 1. Nimeke- ja vastullisuusalue)? Viimeksi tänään KDK:n Primo -koulutuksessa hämmästeltiin tätä ihmeellistä kenttää. Mahtaako tätä blogia seurata joku, joka osaisi hieman valottaa koska tämä kenttä keksittiin, miksi ja mitä ongelmia sen oli tarkoitus ratkaista sekä miten 245 on aikojen saatossa kehittynyt?

Olis kiva kuulla tästä, laittakaahan kommenttia tuohon alle jos 245 herättää muistoja tai tunteita.

HelMet-tietue b1915995 (xrecord)

245 10 Bibliografinen valvonta :|bjohdatus luetteloinnin ja
       sisällönkuvailun menetelmiin /|cVesa Suominen, Jarmo
       Saarti, Pirjo Tuomi

HelMet-tietue b1752703 (xrecord)

245 10 Suomalaiset luettelointisäännöt. Monografioiden kuvailu /
       [Kansallinen luetteloinnin ohjausryhmä]; [julkaisija:]
       Helsingin yliopiston kirjasto

HelMet-tietue b1380128 (xrecord)

245 10 Tutkielma hallitusvallasta :|btutkimus poliittisen vallan
       oikeasta alkuperästä,laajuudesta ja tarkoituksesta /|cJohn
       Locke ; suomennos ja esipuhe Mikko Yrjönsuuri

HelMet-tietue b1551077 (xrecord)

245 10 Taru sormusten herrasta. 2 : Kaksi tornia / [suom. Kersti
       Juva ja Eila Pennanen ; runot suom. Panu Pekkanen] /|cJ.
       R. R. Tolkien

Duck and cover

Arvioi tämä:

Posted in kirjasto Tagged bibliografia, bibliografinen kuvailu, helmet, historia, kirjastohistoria, luettelointi, luettelointisäännöt, luettelointisääntö, marc, marc must die, marc-kenttä, marc21, metadata, monografioiden kuvailu, standardi, suomalaiset luettelointisäännöt

Kopioluettelointi on ehkä hajoamassa

Posted on 23 tammikuun, 2011 by mace

1

Eräs muunnostyökalu bibliografisten tietueiden käsittelyyn :^)

Tuli tuossa sattumalta esiin, että kirjastojen välinen kopioluettelointi (aka. poiminta) nähtävästi menee ainakin vähän rikki seuraavaksi pariksi vuodeksi. En vielä tässä vaiheessa tiedä asiasta tarpeeksi (kuten ensimmäisen virkkeen epämääräisyys antaa jo ymmärtää) ja tästä on ehkä jossain keskusteltu jo, mutta otanpa asian kuitenkin varmuuden vuoksi esiin.

Saattaa olla ehkä syytä kiinnittää huomiota siihen, että kun yleiset kirjastot pikkuhiljaa vaihtavat Axiellin PallasProsta ja Origosta Auroraan ja kun samalla vaihtuu myös metadataformaatti FinMARCista MARC21:een, eriytyy Suomi kahteen kopioluetteloinnin maailmaan, jotka ovat keskenään erilaisia formaatin eroista johtuen.

En tiedä onko tämä ongelma, MARC mikä MARC, ja kopioluetteloidessa jokatapauksessa kopsattavia tietueita muokataan paikallisesti. MARC21:stä (Auroroista) vanhempiin PallasProihin ja Origoihin kopsailu (ja toisinpäin) tullee kuitenkin muuttumaan työläämmäksi, kunnes kaikilla lopulta on MARC21. Voi toki olla, että Aurorassa itsessään on jo olemassa mahdollisuus pyytää tietueita muissakin muodoissa kuin MARC21:nä, se olisi hienoa.

Tässä olisi vielä aikaa toimia ja kenties ideoida joku keskitetty helpotuskeino. FinMARC↔MARC21 -muunnoshan onnistuu koneellisesti Kansalliskirjaston USEMARCON -ohjelmalle laatimilla muuntosäännöillä. En tiedä olisiko mitään järkeä rakennella jotenkin keskitetysti härveli, joka tekisi muunnoksen automaattisesti poiminnan yhteydessä? Index-Datan YAZ Proxyä voisi ehkä käyttää, tai rakennella YAZ-kirjastojen päälle oman gatewayn joka esim. USERMARCONia käyttäen murjoisi kopioitavat tietueet läpi Kansalliskirjaston muuntosäännöstöstä.

Oliskohan tollaiselle tarvetta? Yhteisluettelo sitten aikanaan poistaa tällaiset haasteet lopullisesti. Jos tämä nyt osoittautuu merkittävästi työllistäväksi asiaksi, niin positiivisena asiana nähtäkööt se, että se jouduttaa yhteisluettelon rakentamista.

Asia tuli esiin, kun eräästä toisesta maakuntakirjastosta oltiin yhteydessä minuun, kun sekä Pirkanmaan PIKI:stä että meiltä Varsinais-Suomen Vaskista kopioluetteloiunti oli lakannut toimimasta. Syy on ilmeisesti kuitenkin eri kuin yllä kuvasin.


⋮
// ***245+248 ALKAA TÄSTÄ***
245I1           | = 0) Then RegMatch(1) Else S;
                                    RegReplaceTable('pieni-isoksi-merkkijonon-alussa.tbl');
                                    If (%000/7/ = 'p' And RegFind('[Aa]rkisto') < 0) 'Arkistoaineisto';
                                    '[' + S + ']'
245$b           | 1', Strict);
                                    If (NextSub($a, '=1') = 'a') ReplaceOcc ('$a' By ' ;$b', '=2', Strict);
                                    ReplaceOcc ('$a' By ' ; ', '>1', Strict);
                                    If (NextSub($a, '=1') != 'a' And Not ExistsIn(S, $b)) ReplaceOcc ('$r' By ' =$b', '=1', Strict);
                                    Replace ('$r' By ' = ', Strict);
                                    Replace ('$t' By '. ', Strict);
                                    ReplaceOcc ('$c' By ' / ', '>1', Strict); Replace ('$c' By ' /$c', Strict);
                                    If (ExistsIn(S, $c)) Replace ('$d' By ' / ', Strict); ReplaceOcc ('$d' By ' / ', '>1', Strict); Replace ('$d' By ' /$c', Strict);
                                    Replace ('$e' By ' ; ', Strict);

                                    If (PreviousSub($n, '=1') = 'h' Or PreviousSub($p, '=1') = 'h') MoveBefore('np', $h, 'np', '', '', ' :| /| ;|.| =');

                                    If ($c Precedes $p And PreviousSub($p, '=1') = 'n') ReplaceOcc ('$p' By ', ', '=1', Strict);
                                    If ($c Precedes $p And PreviousSub($p, '=1') != 'n') ReplaceOcc ('$p' By '. ', '=1', Strict);

                                    If ($c Precedes $p And PreviousSub($p, '=2') = 'n') ReplaceOcc ('$p' By ', ', '=2', Strict);
                                    If ($c Precedes $p And PreviousSub($p, '=2') != 'n') ReplaceOcc ('$p' By '. ', '=2', Strict);

                                    If ($c Precedes $n) Replace ('$n' By '. ', Strict) Else Replace ('$n' By '.$n')
// Info: Käsitellään 248
248$g           | 1', Strict) Else ReplaceOcc ('$D' By ' / ', '>1', Strict);
                                    RegReplace ('($D.*)$B', '\\1 : ', 'g');
                                    RegReplace ('($D.*)$R', '\\1 = ', 'g');
                                    RegReplace ('($D.*)$C', '\\1. ', 'g');
                                    If (Exists(@245$d) Or Exists(@248$d)) Then
                                    {
                                      while (RegFind ('$D.*$E') >= 0)
                                      {
                                        RegReplace ('($D.*)$E', '\\1 ; ', 'g');
                                      };
                                    }
                                    Else
                                    {
                                      while (RegFind ('$D.*$E') >= 0)
                                      {
                                        RegReplace ('($D.*)$E', '\\1 / ', 'g');
                                      };
                                    }

                                    // Info: Jos $n/$p on ennen $b:tä tai $b:tä ei ole, siirretään $n/$p $a:n perään
                                    If (RegFind('$b.*$[np]') < 0) MoveAfter('np', $a, 'np', '', '', ' : | / | ; |. | = ');

                                    // Info: G:n (n) ja H:n (p) vlimerkit
                                    Replace ('$G' By '.$G', Strict);

                                    // Info: Siirretään g ja h oikeille paikoille
                                    If (PreviousSub(@245$n, '>=1') != 'c' And PreviousSub(@245$p, '>=1') != 'c' And ExistsIn(S, $c)) MoveBefore('GH', $c, 'np', '', '', ' :| /| ;|.| =', 'BR');
                                    If ((Not ExistsIn(S, $n)) And (Not ExistsIn(S, $p)) And (Not ExistsIn(S, $b))) MoveAfter('GH', $a, 'np', '', '', ' :| /| ;|.| =', 'BR');
                                    Replace ('$G' By '$n');
                                    Replace ('$H' By '$p');

                                    If (ExistsIn(S, $c))
                                    {
                                      If (Exists(@245$d)) Then Replace ('$D' By ' ; ', Strict) Else Replace ('$D' By ' / ', Strict);
                                    }
                                    Else Replace ('$D' By ' /$c', Strict);

                                    If (Not ExistsIn(S, $b)) ReplaceOcc ('$B' By ' :$b', '=1', Strict);
                                    If (Not ExistsIn(S, $b)) ReplaceOcc ('$R' By ' :$b', '=1', Strict);
                                    Replace ('$B' By ' : ', Strict);
                                    Replace ('$R' By ' = ', Strict);
                                    Replace ('$C' By '. ', Strict);

                                    If (ExistsIn(S, $b)) MoveBefore('h', $b, 'h', '', '', ' :| /| ;|.| =') Else If (ExistsIn(S, $c)) MoveBefore('h', $c, 'h', '', '', ' :| /| ;|.| =');

                                    For (OCC From 1 To 3) While (PreviousSubIn(S, $n, '=OCC') = 'c' Or PreviousSubIn(S, $p, '=OCC') = 'c') {
                                      If (PreviousSubIn(S, $p, '=OCC') = 'c') {
                                        If (RegFind(S, '$c.*\\.$') < 0) ReplaceOcc('$p' By '. ', '=OCC', Strict) Else ReplaceOcc('$p' By ' ', '=OCC', Strict);
                                      }
                                      Else ReplaceOcc('$p' By ', ', '=OCC', Strict);
                                      If (RegFind(S, '$c.*\\.$') < 0) ReplaceOcc('$n' By '. ', '=OCC', Strict) Else ReplaceOcc('$n' By ' ', '=OCC', Strict);
                                    };

                                    RegReplaceTable('pieni-isoksi-osakentan-alussa.tbl')

Z48             | 245             | If (RegFind(D, '\\.\$') < 0) D + S Else D;
                                    Pvalimerkitys();
// ***245+248 PÄÄTTYY TÄHÄN***
⋮

Voihan tämän tehdä käsinkin, mutta voisi olla kiva että tietokone tekisi nämä luetteloijan puolesta.

Arvioi tämä:

Posted in kirjasto Tagged aurora, automaatio, axiell, axiell aurora, finmarc, formatti, index-data, kansalliskirjasto, kirjasto, konversio, kopioluettelointi, luettelointi, marc, marc konversio, marc21, metadata, ohjelmointi, origo, pallas, pallaspro, poiminta, tietokone, usemarcon, yaz, yaz proxy, z39.50

Abstrakti silmäys kahteen kirjastoon (sis. emansipatorista ATK-nostatusta)

Posted on 2 tammikuun, 2011 by mace

1

Tämä kirjoitus käsittelee ATK:ta. Uskon että automaattisella tietojen käsittelyllä olisi kirjastoille annettavaa. Olen kaavaillut jotain menetelmää visualisoida kirjastokokoelmia. Olen onnistunut keräämään aiheesta muutaman datasetin, mutta varsinainen työ on jäänyt tekemättä, uloslukien analyysi Helsingin kaupunginkirjaston aihepakettien ajallisesta kattavuudesta. Sitäpaitsi en tiedä tilastoanalyysistä yhtikäs mitään. Mutta pyrkimyksenäni on ollut todistaa, että sitä voidaan tehdä heti kun haluamme.

Minusta tällainen on tärkeää.

Tänään jostain syystä innostuin, ja laadin kuvatukset kahden suunnilleen saman kokoisen Varsinais-Suomalaisen yleisen kirjaston kokoelmien luokkien jakautumisesta.

Kirjasto #1

Erään kirjaston kokoelman luokkajakauma

Suurimmat luokat ovat

  1. 84.2 (suomenkielinen kaunokirjallisuus)
  2. 85.3 (sarjakuvat)
  3. 85 (sadut. kuvakirjat. sarjakuvat)
  4. 85.1 (sadut)
  5. 82.2 (suomenkieliset runot)
  6. 99.1 (elämäkerrat. muistelmat)

Kirjasto #2

Erään toisen kirjaston kokoelman luokkajakauma

Toisen kirjaston kokoelma näyttää tältä, ja suurimmat luokat ovat

  1. 84.2 (suomenkielinen kaunokirjallisuus)
  2. 85.22 (suomenkieliset kuvakirjat)
  3. 78.8911 (rock)
  4. 85.32 (suomenkieliset sarjakuvat)
  5. 78.891 (popmusiikki)
  6. 85.12 (suomenkieliset sadut)

Näistä on leikattu pois kaikki luokat, joissa on alle 100 tietuetta. Voisi olla hyödyllisempää rajoittaa esim. luokan syvyyden perusteella vaikkapa pääluokkiin tai yhteen desimaaliin. Huomaa, että tässä olevien kuvajaisten värit eivät korreloi toistensa kanssa, vaikka vertailua ajatellen se olisi erittäin mukavaa. Lisäksi pikaisesti laatimani kuvajaiset ovat karseita lukea (voit kuitenkin avata kuvat isompina niitä klikkaamalla) ja ohjelmakoodissakin olisi paljon kehitettävää… itse asiassa laatimani ohjelma on erittäin karu, eikä edes piirrä noita kaavioita automaattisesti vaan tein ne itse taulukkolaskentaohjelmassa. Mutta kaavioiden tekeminen ohjelmallisesti ei todellakaan ole mikään ongelma. Niitä voisi laatia esim. GC-ohjelmointikirjastoa (ilmainen ja avointa lähdekoodia) tai gnuplotia (ilmainen ja avointa lähdekoodia) käyttäen. Molempiin löytyy tietenkin Perl-rajapinta (ilmaisia ja avointa lähdekoodia).

Käyttäjäystävällisyyden vuoksi nuo yleisen kymmenluokituksen (YKL) numeeriset kentät voisi suoraan automaattisesti muuntaa luokkien nimiksi; se onnistuisi ykl.kirjastot.fi -palvelua käyttäen. Kuvioiden tuijottelu olisi hauskempaa.

Käytin tähän MARC-siirtomuodossa olevia tietokantadumppeja, ensimmäisessä on noin 200 000 tietuetta ja toisessa 280 000. Molemmat sisältävät osakohteet. Poimin kummastakin dataläjästä 054‡a -kentät ja laskin eri arvojen määrät. Tuon datan käsittelyyn menee pieneltä, kohta pari vuotta vanhalta miniläppäriltäni noin 15 minuuttia yhteensä.

Mitä näistä voidaan päätellä? Ei ehkä mitään. Mutta ehkä jotain. Ainakin voidaan päätellä se (no tämänhän kaikki jo varmasti tietävätkin), että kokoelmanhallinnan työkaluja voi kehittää itse helposti ja ilmaiseksi. Ideoita ja työkaluja riittää niin paljon kuin haluaa. Lisäksi voidaan päätellä, että luetteloinnin on oltava hyvää, jotta tässä — tai tiedonhaussa yleensäkään on mitään järkeä. Mutta senkin me tiedämme jo erittäin hyvin.

Tuollaiset kuvajaiset voitaisi hyvin helposti (=automaattisesti ja halvalla) tehdä viikottain jokaiselle suomalaiselle kirjastolle. Ajan oloon nähtäisi miten kokoelmat ovat eläneet. Todella hyödyllistä olisi tehdä rinnalle vastaava analyysi asiakkaiden tekemistä lainoista ja katsoa miten ne korreloivat kirjaston kokoelmien kanssa.

Meillä on ollut kaikki tähän tarvittavat työkalut ilmaiseksi saatavilla vuosikausia. Vuosikymmeniä jopa! Itse käytin tällä kertaa Perliä (ilmainen ja avointa lähdekoodia), MARC::Record -moduulia (ilmainen ja avointa lähdekoodia), OpenOffice Calcia (ilmainen ja avointa lähdekoodia), Gimpiä (ilmainen ja avointa lähdekoodia), geditiä (ilmainen ja avointa lähdekoodia) sekä GNU/Linuxiin (ilmainen ja avointa lähdekoodia) perustuvaa Ubuntua (ilmainen ja avointa lähdekoodia). Koneelliseen käsittelyyn kehitetty MARC-luettelointiformaatti meillä on ollut olemassa 1960-luvulta.

Tätä ominaisutta et muuten löydä Axiell Aurora tai Innovative Millenium -järjestelmistä.

[edit 02.01.2011 katso myös Anna-Liisan Kirjasto-kaapelilla aloittama Tilastot kokoelmien hoidon tukena (credit: mace)]

Arvioi tämä:

Posted in Ave amator! Morituri te salutant!, kirjasto Tagged aineisto, analyysi, atk, automaatio, avoin lähdekoodi, axiell, axiell aurora, data, innovative, innovative millenium, kirjasto, kokoelma, luokka, marc, metadata, ohjelmointi, openoffice, perl, tilasto, visualisointi, ykl, yleisten kirjastojen luokitusjärjestelmä

Uusi kategoria: ”Avē amator! Moritūrī tē salūtant!”

Posted on 24 marraskuun, 2010 by mace

0

Jean-Léon Gérôme: Ave Caesar Morituri te Salutant (1859). Kuva on Wikipedia Commonsista. Kiitos.

Otin blogissani käyttöön uuden kategorian: Ave amator! Morituri te salutant! Tuohon kategoriaan laitan kirjoituksia, joissa käsittelen omalle alallemme läheisiä, jopa keskeisiä juttuja, joita tekevät aivan muut kuin me kirjastoammattilaiset.

Päällimmäisenä mieleen tulevat Open Data -puuhailijat, abandonware -ihmiset, reCAPTCHAn kehittäjät, avoimen lähdekoodin tekijät ja tukijat, EFFi, lukupiireihin osallistuvat, wikipedistit tietenkin, Open Library:n väsäilijät, Archive.orgin parissa toimivat, LibraryThingin loistavat tyypit, WikiLeaks, Creative Commonsin tukijat, warettajat ja piraatit, irkkaajat ja foorumeilla norkoilijat, vanhan liiton BASIC-aktivistit, kaupunginosayhdistysten kirjastoharrastajat, bookcrossaajat, erilaiset tutkijat ja kirjoittajat. Yleisesti ottaen kaikki, jotka rakkaudella ja antaumuksella käyttävät aikaansa ja resurssejaan maailman parantamiseen sellaisin keinoin, jotka minä katson ”kirjastomaisiksi”. Joukko on valtava ja yhä kasvamaan päin.

 

Avē amator! Moritūrī tē salūtant! on latinaa ja tarkoittaa ”Ole tervehditty, amatööri, kuolemaan menevät tervehtivät sinua!”.

Amatööri muodostuu kantasanasta amator, ja siis rakkaudesta. Suomen kielen harrastaja perustuu tietenkin hartauteen, siis omistautumiseen ja sielukkuutteen. Yksikään kirjastoalan ammattinimike ei perustu tällaisiin lähtökohtiin. Nykyisenlaisena tuntemamme yleisen kirjaston juuret ovat kuitenkin juuri tällaisessa kansalaistoiminnassa. TJEU.

Kävin läpi kaikki 224 blogikirjoitustani ja luetteloin niistä 47 tuohon kategoriaan. Niiden otsikot ovat tässä:

  1. Galleriat, kirjastot, arkistot, museot ja Wikipedia yhdessä ovat ❤
  2. Minkähänlaista olisi ihan oikea kirjastotyö pelien parissa?
  3. E-prujun lukija
  4. Kirjastoammattilainen Googlen käyttöliittymänä
  5. On elämä lainaa vainen
  6. Suomen kirjastoseura 100v
  7. Marcin on kuoltava
  8. Cory Doctorow: Näin kirja tuhotaan (niin&näin  65)
  9. HelMet ja Open Data
  10. Chic kirjastopeura pikkumustassaan
  11. Free Software Foundation–Hyvyyden puolesta, pahuutta vastaan
  12. Tavallinen ihminen: “Kirjasto on (kulttuurin) logistiikkafirma”
  13. Kohan suomennos on nyt jossain vaiheessa
  14. Digiaineiston arkistoinnista NY Timesissä
  15. Antti Eskola: Uhka, toivo ja vastarinta
  16. Kaukolainausta p2p-tyyliin
  17. Suomennetaas piruuttaan toi Koha
  18. Kirjapiraatin tunnustukset
  19. Kindle on oikeasti tietokone
  20. Barthes ei-lukuhalusta (ja kirjastosta)
  21. Annoin Wikipedialle 50€, anna sinÀkin
  22. Blogipikkujoulut tuloo!
  23. Historiallinen hetki kirjasto-kaapelilla
  24. Kiitos lainaamisesta ja vuokraamisesta
  25. reCAPTCHA on nerokas!
  26. WikiRakkautta
  27. Miten ihminen voi auttaa omaa kirjastoaan?
  28. Meistä on televisiosarjaksikin
  29. Linda harmittaa kansalaisia
  30. Avoimia oppiresursseja
  31. Avoin lähdekoodi, jakaminen ja riisto. Ja kirjastot tietty
  32. Lukupiiri nykyajan tyyliin
  33. Meanwhile on Wikipedia
  34. Erään e-kirjan tarina
  35. TTVK: Kirjojen vuokraus on kuin Pirate Bay
  36. Qaiku vastaa niinkuin jaikuun huudetaan
  37. Kirja(t) kiertoon pölyä keräämästä
  38. Haastatteluni Sula Pinta -podcastissa
  39. Muutama kirjastolaisia kiinnostava puheohjelma
  40. Re: Tulevaisuuden uhkakuva?
  41. Kirjastolaisten pyhät kirjat ja annotointi
  42. Re: Verta, leimoja ja kontaktimuovia
  43. Nimimerkit pois keskustelusta
  44. Sosiaalinen web on kaksisuuntainen katu
  45. Eilinen Jaikumiitti
  46. Kirjastojen asiakkailleen tarjoamat tietoverkot
  47. Jaiku

Kiitos Ulla Ikäheimolle avusta latinan kielen kanssa.

Arvioi tämä:

Posted in Ave amator! Morituri te salutant!, kirjasto Tagged abandonware, aktivismi, amatööri, amatööri harrastus, ammattilaisuus, ave amator morituri te salutant, ave caesar morituri te salutant, bloggaaminen, effi, etymologia, harrastaja, historia, jean-léon gérôme, kansalaistoiminta, kategoria, kirjasto, kirjastoaate, kirjastohistoria, kirjastolainen, luettelointi, metadata, piratismi, rakkaus, riippumaton asiantuntija, tulevaisuus, ulla ikäheimo, viranomainen, virantoimitus, virkamies, warez

EuropenaLocal, KDK ja Europeana -läppää videolla

Posted on 12 lokakuun, 2010 by mace

0

Syyskuun puolessavälissä pitämässämme EuropeanaLocalin kansallisessa kokouksessa tehtiin myös pari ohjelmaa Kirjastokaistalle. Ensinnäkin minä haastattelin Mary Rowlattia (05:45) siitä mitä Europeana ja EuropeanaLocal ovat ja miksi kirjastojen, museoiden ja arkistojen pitäisi olla siitä kiinnostuneita ja toisekseen Kirjastokaista jututteli EuropeanaLocal- sekä KDK-porukoita (04:45).

Blogissani on aiempia juttuja aiheesta tagilla europeanalocal. Lisäksi syyskuun kokouksessa pidetty keskusteluosuus tuli tallennettua videolle (31:45), joten laitoin senkin nettiin mikäli jotakuta kiinnostaa.

Arvioi tämä:

Posted in kirjasto Tagged anna-maria soininvaara, ari rouvari, digitaalinen kirjasto, digitointi, e-aineisto, europeana, europeanalocal, kansallinen digitaalinen kirjasto, kdk, kirjasto, kirjastokaista, kirjastopalvelut, mary rowlatt, metadata, tapani sainio, virva nousiainen-hiiri

Marcin on kuoltava

Posted on 7 syyskuun, 2010 by mace

11

Kirjastopiireissä alkaa olla jo lynkkausmentaliteetti: Marcin on kuoltava. Helsingissä kesällä pidettyssä ELAG 2010 -konferenssissa alkoi jo olla jengillä mitta aika täysi.

Tässä välissä keksittiin ARPANET, levykkeet, mikrotietokoneet, Internet, tietoyhteiskunta ja open linked data. Sosiaalidemokraattinen, pohjoismainen hyvinvointiprojekti tuli ja meni. Samoin CD-levy. Rakennettiin paljon hienoja kirjastoja, joille ei enää tehdä edes homeremontteja. Tuohon aikaan mahtuu helposti täysimittainen ura luetteloijana, vaikka olisi suoraan oppikoulun penkiltä alkanut luetteloinnin eikä olisi eläessään tehnyt päivääkään muuta työtä. Tieteenalammekin vaihtoi nimeään kahdesti. Kuhn, Derrida, Baudrillard, McLuhan. Suomeen syntyi se sukupolvi, joiden lapsista tulivat diginatiivit.

Onko edes mahdollista haaveilla maailmasta ilman Marcia? Millainen se edes voisi olla? Jotain tämän kaltaista kenties? En minä sinänsä Marcia vihaa erityisesti. Pois se minusta. Mutta olisi hauska haaveilla että meillä kirjastoilla olisi jotain vaihtoehtoja. Ihan edes leikillään. Jos Marcin tappaisi ihan vaan leikillään, niin millainen kirjasto rakentuisi? Unelmoin siitä, että kirjastot tekisivät internetistä jotenkin paremman paikan. Toisivat lisäarvoa, olisivat jotenkin merkityksellisiä. Ihan millä tahansa tavalla.

Mitä tapahtuisi, jos workshopattaisi sellaisten tyyppien kanssa jotka tietävät mitä käsitteet tietokone tai internet tarkoittavat, mutta jotka eivät koskaan olisi kuulleetkaan Marcista? (huom oikeesti tsekkaa noi linkit ja tee se päätelmä jonka niistä voi tehdä).

Vietän mielelläni Helsingin kaupunginkirjasto 150-vuotisjuhlaa. Marcin 150-vuotisjuhlan viettämisestä en tule nauttimaan.

Arvioi tämä:

Posted in Ave amator! Morituri te salutant!, kirjasto Tagged diginatiivi, elag, elag2010, helsingin kaupunginkirjasto, historia, innovaatio, internet, juhla, kehitys, kirjasto, kirjastohistoria, kuolema, linked data, marc, marc must die, metadata, open linked data, tappaminen, tietoyhteiskuntahistoria, vaino

Europeana Data Provider Agreement -suomennos

Posted on 30 elokuun, 2010 by mace

0

Suomennutimme EuropeanaLocal -hankkeen nimissä Europeana Data Provider Agreementin.

Käännös löytyy KirjastoWikistä, ja kaipaa vielä siivoilua ja kenties termien muuttamista (digitalisointi→digitointi tms.).

Europeana -toimiston kanssa asioidaan englannin kielisellä sopimuksella, joka on siis tuon Europeana Aggregators’ Handbookin liitteenä. Tämän suomennoksen tarkoitus on madaltaa muistiorganisaatioiden (l. kirjastojen, arkistojen ja museoiden) kynnystä lähteä mukaan viemään aineistoa Euroopan yhteiseen digitaaliseen kirjastoon Europeanaan. Ajattelin, että Europeana ja Euroopan komission on vähemmän pelottava jos asiasta päättävät voivat saada sopimuksesta edes viitteellisen version myös äidinkielellään.

Aineistoja toimitetaan ko. palveluun eri reittejä, mutta sopimus on yhteinen joten tämä suomennos palvelee myös Europeana Travelin, APENETin, KDK:n ym. kautta toimittavia suomalaisia organisaatiota.

Järjestämme 13. päivä Helsingissä kokoontumisen, jossa kerromme tarkemmin miten seudulliset sekä alueelliset aineistot saadaan toimitettua Europeanaan. Katsomme tuolloin myös tätä sopimusta.

Arvioi tämä:

Posted in kirjasto Tagged apenet, digitointi, europeana, europeana aggregators' handbook, europeana data provider agreement, europeana travel, europeanalocal, immateriaalioikeudet, kansallinen digitaalinen kirjasto, käännös, kääntäminen, kdk, kirjasto, kirjastowiki, lisensointi, lisenssi, metadata, suomennos, suomentaminen, terminologia

Suomen EuropeanaLocal live

Posted on 1 heinäkuun, 2010 by mace

4

EuropeanaLocalEkat EuropeanaLocalin kautta toimitetut suomalaisaineistot on nyt näkyvillä Euroopan digitaalisessa kirjastossa Europeanassa. Kyseiset aineistot on pienen pieni määrä (50 kpl) teoksia Helsinki-kokoelmasta, jotka digitoitutettiin Kansalliskirjaston digitointikeskuksessa. Käy tarkastelemassa miltä ne näyttävät Europeanassa (kansikuvia lataaminen Europeanaan on tätä kirjoittaessa vielä meneillään).

Europeana -logo

Europeana

Vaikka olen kirjoittanut (tilittänyt?) aiheesta aiemminkin, niin vielä jankattakoot, että EuropeanaLocal on eräs Europeanan lukuisista satelliittiprojekteista, jotka keräävät aineistoa tähän Yhteen Suureen Digitaaliseen Kirjastoon. Mukana ovat kaikki EU:n jäsenmaat, Suomesta EuropeanaLocalia edustaa Helsingin kaupunki, käytännössä kaupunginkirjasto. Vielä vuoden verran, kesään 2011 asti jatkuvassa hankkeessa rakennetaan keinot, joilla muistiorganisaatiot eli kirjastot, arkistot ja museot voivat toimittaa aineistojaan Europeanaan. Lisätietoa EuropeanaLocalin omilta sivuilta ja KirjastoWikistä.

Juhlaruno Helsingin suomalaisen tyttökoulun rakennuksen vihkiäisissä 27.09.1844

Juhlaruno Helsingin suomalaisen tyttökoulun rakennuksen vihkiäisissä 27.09.1844

Helsingin kaupunginkirjasto on tässä vaiheessa siis toimittanut nuo muutamat Helsinki-kokoelman teokset ikäänkuin pesämunaksi ja samalla todistetaan että homma toimii. Katso esimerkiksi Juhlaruno Helsingin suomalaisen tyttökoulun rakennuksen vihkiäisissä 27.09.1844 (sama teos HelMetissä).

Muuta EuropeanaLocalin kautta toimitettua aineistoa on niinikään vaatimaton joukko aiemmin digitoitua musiikkia. Se ei tosin ole edes alueellisesti tai seudullisesti merkittävää, vaan mukana siksi, että Helsingin kaupunginkirjastolla olisi edes jotain annettavaa. Tarkoitus oli saada myös Rikhardinkadun kirjastossa sijaitsevan RikArt -taiteilijakirjakokoelma, mutta niiden toimitus on toistaiseksi viivästynyt RikArtin sivustopäivityksen vuoksi. Uskon että mukaan saadaan saadaan ajan mittaan muutakin aineistoa (ehkä Sinun aineistojasi 😉

Europeanaan kulkee aineistoja monia muitakin reittejä pitkin kuin EuropeanaLocalia, esim. Kansalliskirjasto on vienyt suuren määrän vanhoja sanomalehtiä. Tulevaisuudessa tämän kaltainen toiminta tapahtunee pitkälti Kansallisen Digitaalisen Kirjaston KDK:n siipien suojissa.

EuropeanaLocal etsiikin paraikaa sopivia aineistoja maailmalle vietäväksi. Tämän satelliittihankkeen fokuksena ovat siis muistiorganisaatioiden paikallisesti- tai seudullisesti arvokkaat, digitoidut tai syntyjään digitaaliset kulttuuriperintöaineistot. 13.09.2010 järjestämme Helsingissä tapahtuman, jossa asiasta voidaan tarkemmin keskustella ja sopia jatkosta. Luonnollisesti sitä ennenkin ovat yhteydenotot erittäin tervetulleita. Yhteystiedot löytyvät KirjastoWikistä.

Briefly in english (skipping the fundamentals of EuropeanaLocal)

The first materials to make it to the European digital library Europeana via our national EuropeanaLocal -process are finally live. The first items are 50 digitized publications of the Helsinki-collection, quite a typical local collection of Helsinki city library. We have also submitted a small amount of digitized classical music to Europeana, but they’re not really within the scope of EuropeanaLocal. Submitting of a collection of artists’ books called RikArt has unfortunately been postponed for now. We are holding our national meeting on 13.9.2010, and hope to get more contributions then.

Arvioi tämä:

Posted in kirjasto Tagged arkisto, digitointi, e-aineisto, eurooppa, europeana, europeanalocal, helsinki, helsinki-kokoelma, kansallinen digitaalinen kirjasto, kdk, kirjasto, marc21, metadata, muistiorganisaatiot, museo, palvelu, rikart

Artikkelien selaus

← Vanhemmat artikkelit

Viimeisimmät kommentit

ดูหนังโป๊ออนไลน์: Jean-Noël Jeanneney: Google–An…
Keitä meillä palvell…: Oletko kirjaston asiakas vai…
mace: Open Access Button – raportoi…
Hannu: Open Access Button – raportoi…
Kalle: Mitä on tietokannan ja datan…
mace: Helsingin kaupungin tietokesku…
Heikki Poroila: Sillävälin internetissä: musii…
Erja: Paljon onnea tämä blogi 5…
mace: E-kirjat kotiinkuljetettuina
mace: Hesari 18.02.2013: ”Kirj…
Liina: Hesari 18.02.2013: ”Kirj…
Kari Blomster: Four Shades Of Grey
Kari Blomster: Trancend Lex Karpela
Jarppi: Mitä on tietokannan ja datan…
Petri: Mitä on tietokannan ja datan…
helmikuu 2023
ma ti ke to pe la su
 12345
6789101112
13141516171819
20212223242526
2728  
« Maa    

Arkistot

  • maaliskuu 2014 (4)
  • tammikuu 2014 (2)
  • marraskuu 2013 (7)
  • lokakuu 2013 (2)
  • syyskuu 2013 (1)
  • elokuu 2013 (2)
  • heinäkuu 2013 (7)
  • toukokuu 2013 (6)
  • huhtikuu 2013 (4)
  • maaliskuu 2013 (4)
  • helmikuu 2013 (3)
  • tammikuu 2013 (4)
  • joulukuu 2012 (5)
  • marraskuu 2012 (4)
  • lokakuu 2012 (4)
  • syyskuu 2012 (5)
  • elokuu 2012 (2)
  • heinäkuu 2012 (1)
  • kesäkuu 2012 (3)
  • toukokuu 2012 (3)
  • huhtikuu 2012 (3)
  • maaliskuu 2012 (3)
  • helmikuu 2012 (1)
  • tammikuu 2012 (7)
  • joulukuu 2011 (5)
  • marraskuu 2011 (6)
  • lokakuu 2011 (4)
  • syyskuu 2011 (6)
  • elokuu 2011 (2)
  • heinäkuu 2011 (11)
  • kesäkuu 2011 (6)
  • toukokuu 2011 (3)
  • huhtikuu 2011 (8)
  • maaliskuu 2011 (7)
  • helmikuu 2011 (12)
  • tammikuu 2011 (9)
  • joulukuu 2010 (13)
  • marraskuu 2010 (12)
  • lokakuu 2010 (10)
  • syyskuu 2010 (8)
  • elokuu 2010 (8)
  • heinäkuu 2010 (11)
  • kesäkuu 2010 (10)
  • toukokuu 2010 (14)
  • huhtikuu 2010 (9)
  • maaliskuu 2010 (10)
  • helmikuu 2010 (8)
  • tammikuu 2010 (13)
  • joulukuu 2009 (7)
  • marraskuu 2009 (15)
  • lokakuu 2009 (13)
  • syyskuu 2009 (7)
  • elokuu 2009 (6)
  • heinäkuu 2009 (4)
  • kesäkuu 2009 (3)
  • toukokuu 2009 (3)
  • huhtikuu 2009 (4)
  • maaliskuu 2009 (5)
  • helmikuu 2009 (4)
  • tammikuu 2009 (4)
  • marraskuu 2008 (3)
  • lokakuu 2008 (7)
  • syyskuu 2008 (3)
  • elokuu 2008 (4)
  • kesäkuu 2008 (4)
  • toukokuu 2008 (4)
  • huhtikuu 2008 (13)
  • maaliskuu 2008 (3)

twitter -twiitit

  • @npseaver @MichHockenhull ✌️ 2 weeks ago
  • @DooleyMurphy Already mostly gone 🎣 The baby goes out with the bath water... it's a shame but let's face it this w… twitter.com/i/web/status/1… 2 weeks ago
  • @HHenriikka Big heart to this place 3 weeks ago
  • lowercase sts #STS https://t.co/2n6SFz9tw6 3 weeks ago
  • @HHenriikka Amazing place! I went on an impromptu, snackless, improvised 30km and 1000m elevation hike up and down… twitter.com/i/web/status/1… 3 weeks ago

Flickr

Vibes :wavy_dash::wavy_dash::wavy_dash:. Reading mathematical concepts of Hamiltonian Monte CarloMathieu and others from Sciences Po médialab developer team presenting performance measures after a week of Hyphe programming retreat at AAU TANT-LabYou organize a voyage to the end of the world, and naturally you take some nice furries inboard :blush:. #uncertainarchives #vestindienOrit Halpern presenting a narrative of the "demo", evoking in me strong sensations of sympathy and gratitude for those before us and their excitement about ideas, change, learning, art, future, possibilities and interventions. "The Smart Mandate: InfrastrBirkan Taş talking about narrative life of data, starting with the case of #ItGetsBetter. "Cripping Time: A Hopeful Endeavour". #data #statistics #uncertainarchivesSome outrageously unnecessary, and popular story of software, particularly #AI catches your attention. You trace the references and read the original paper "Multi-agent Reinforcement Learning in Sequential Social Dilemmas" (https://arxiv.org/abs/1702.0303
More Photos

RSS Tutustumiani kirjoja

  • On tapahtunut virhe; syötteen palvelin ei luultavasti vastaa. Yritä myöhemmin uudestaan.

Blogroll

  • Cycling for libraries
  • Digitaalinen kirjasto
  • First Monday
  • Garfield minus Garfield
  • Heikin blogi
  • I can has cheezburger?
  • if:book
  • Informaatikko irrallaan
  • Informaatiomuotoilu
  • Labs.kirjastot.fi
  • Parlamenttikirjasto
  • Re-public
  • Sorvipenkin äärellä
  • Sula Pinta
  • Tuhat sanaa
  • Verkostouutiset

RSS qaiku -qaikausut

  • On tapahtunut virhe; syötteen palvelin ei luultavasti vastaa. Yritä myöhemmin uudestaan.

RSS jaiku -jaikausut

  • On tapahtunut virhe; syötteen palvelin ei luultavasti vastaa. Yritä myöhemmin uudestaan.

RSS del.icio.us

  • On tapahtunut virhe; syötteen palvelin ei luultavasti vastaa. Yritä myöhemmin uudestaan.

Meta

  • Rekisteröidy
  • Kirjaudu sisään
  • Sisältösyöte
  • Kommenttisyöte
  • WordPress.com

Blog Stats

  • 125 121 hits
Suomen kirjastoseura
Free Software Foundation Europe -donor
EFFI-tukija
Pidä blogia WordPress.comissa.
Privacy & Cookies: This site uses cookies. By continuing to use this website, you agree to their use.
To find out more, including how to control cookies, see here: Cookie Policy
  • Seuraa Seurataan
    • Riippumaton asiantuntija
    • Liity 40 muun seuraajan joukkoon
    • Already have a WordPress.com account? Log in now.
    • Riippumaton asiantuntija
    • Mukauta
    • Seuraa Seurataan
    • Kirjaudu
    • Kirjaudu sisään
    • Ilmoita sisällöstä
    • Näytä sivu lukijassa
    • Hallitse tilauksia
    • Pienennä tämä palkki