Riippumaton asiantuntija

Päävalikko

Siirry sisältöön
  • Etusivu
  • About
  • Minusta

Daily Archives: 19 marraskuun, 2011

Artikkelien selaus

Kaksi avoin data -sovellusta tällä viikolla: tuplakontrolli ja VuFind

Posted on 19 marraskuun, 2011 by mace

2

Metadataa. Kirjastotyön apuprosessien ytimessä!

Turun ja naapurikuntien kunnankirjastojen Vaski-kirjastokimppa julkaisi aineistotietokantansa avoimena datana vähän aikaa sitten. Avoimen datan idea on, että hyödyllinen annetaan esteettä kaikkien käyttöön. Tällainen ajattelu sopii erinomaisesti kirjastoihin. Yksi hauska puoli avoimessa datassa on se, että data on silloin myös meidän itsemme käytössä. Tämä ei ole ollenkaan itsestäänselvää – normaalisti voimme itsekin käsitellä MARC-tietueitamme vain yhdellä työkalulla, nimittäin kirjastojärjestelmällämme. Vaskissa käytämme Axiellin PallasProta, jolla ei voi tehdä kaikkea. On tärkeää päästä dataan käsiksi monin eri tavoin, ja monien eri tahojen toimesta.

Tässä kaksi casea, joissa kuluneella viikolla hyödyin siitä, että minulla (kuten kakikilla maailman ihmisillä) on esteetön pääsy luettelointidataamme.

Case 1: tuplakontrollia

Duplikaattiongelma. Lulz

Täällä Vaskissa me valmistaudumme vaihtamaan PallasPron toiseen Axiell-tuotteeseen, Auroraan. Samassa tietokantaamme tulee mukaan lisää kirjastoja, ja siirrymme FinMARC -luettelointiformaattista MARC21:een. Anna valvoo ja suunnittelee sitä, yhdessä muiden luetteloijien ja Axiellin kanssa.

Vaski, kuten muutkin kirjastotietokannat ovat sangen sotkuisia monellakin tapaa. Esimerkiksi yhdestä teoksesta saattaa olla useita luettelointitietueita (ns. tuplia (tai tripliä (tai quadruplia (ad nauseaum)))). Ne ovat tietokannan käytön kannalta ärsyttäviä, ja niitä yritetään nyt siivoilla pois.

Tein Annalle tällaisen Perl-ohjelman, joka etsii tuplia ISBN-koodin perusteella (joka on tallennettu kenttään 021‡a):

#!/usr/bin/perl
# lists ISBN-codes which appear in more than one MARC record

use MARC::Batch;

my $file = "vaski-kunnostettu.mrc";
my $batch = MARC::Batch->new('USMARC', $file);

$batch->strict_off();
# First, let's create a magnificient hash or arrays, with ISBNs as keys, and
# lists of record ids as values
while ($record = $batch->next()) {
	for my $field ($record->field('021')) {
		my $isbn = $field->subfield('a');
		push(@{$recsperisbn{$isbn}}, $record->field('001')->data());
	}
	++$i;
}

# then let's see through the hash, and print all the ISBNs which appear in more
# than one record, and list all the records ids per ISBN too
while (my ($key, $value) = each(%recsperisbn)) {
	if (@$value > 1) {
		print($key, ": ");
		foreach $recid (values($value)) {
			print($recid,",");
		}
		print("\n");
	}
}

Tämä ohjelma käy järjestyksessä läpi kaikki tietueemme, ja muodostaa kaikista esiintyvistä ISBN-koodeista listan missä kaikissa tietueissa se esiintyy. Lopuksi se tulostaa kaikkien sellaisten tietueiden tunnisteen (kentästä 001), joiden ISBN esiintyy useammassa kuin yhdessä tietueessa. Näitä löytyi reilu 15 000. Anna arvioikoot, mitkä niistä voisi yhdistää keskenään. Yllä oleva Perl-ohjelma on rakennettu MARC::Record ja MARC::Batch -ohjelmointikirjastojen päälle, jotka ovat ilmaisia, standardin mukaisia ja avointa lähdekoodia.

Case 2: verkkokirjaston pystyttäminen

VuFind

Toinen tämänviikkoinen näpertelyn kohde on VuFind. Se on täysiverinen verkkokirjasto-ohjelmisto, verrattavissa esim. KDK-hankkeessa pilotoitavana olevaan ExLibriksen Primoon. Hakumoottorina VuFind käyttää Solria. Vain paras on kyllin hyvää! Sanomattakin selvää, että sekä VuFind että Solr ovat avointa lähdekoodia ja vapaasti käytettävissä.

Taustajärjestelminä VuFind voi suoraan käyttää Alephia, Voyageria, Innovativen Milleniumia, avoimen lähdekoodin eXtensible Catalogia, Kohaa ja Evergreeniä, OCLC PICAa ynnä muita. Kuten erittäin hyvin tiedämme, me suomalaiset yleiset kirjastot olemme marginalisoituneita kansainvälisistä kollegoistamme omine Axiell-järjestelminemme, mutta VuFindin ja Axiellin järjestelmien väliin voi kyllä rakentaa yhteyden. Tämä tapahtuu laatimalla ohjelma, jota VuFindissa kutsutaan ILS -ajuriksi. Toisessa päässä, eli Axiellin kirjastojärjestelmän päässä käytetään Axiell Web Services -rajapintaa, joka on useiden suomalaisten Axiellin tuotteita käyttävien kirjastojen käytettävissä.

Viikin kampuskirjaston eViikki -palvelu

Suomessa VuFind on käytössä ainakin Helsingin yliopiston Viikin kampuskirjastossa, jonka palvelu on nimeltään eViikki. Maailmalta löytyy paljon kirjastoja, jotka ovat valinneet VuFindin.

En perjantaina jaksanut alkaa säätämään virallisen tietohallinnon kanssa tai ehdottelemaan mitään toimiryhmien perustamista ja kerran kuukaudessa pidettäviä pullakahvikokouksia, joten laitoin omin nokkineni palvelimen pystyyn Amazonin EC2 -pilveen. Se oli asiaan jo ennalta tutustuneena oikeastaan pöyristyttävän helppoa ja siihen meni alle tunti. VuFindin olen aiemmin asentanut omalle läppärilleni, mutta nyt pystyttämääni palvelimeen indeksoin myös Vaskin bibliografisen datan ja katsoin järjestelmää muutenkin tarkemmin. Datamme on FinMARCia, mutta olen konvertoinut sen itse MARC21:ksi Kansalliskirjaston ylläpitämillä konvertointisäännöillä sekä USEMARCON-ohjelmalla (kiitos Ulla, Ere ym.). Näitä Axiellkin käyttää kun teetätämme heillä konvertointityötä.

Hyvältä ja selkeältä näyttää toi VuFind kyllä 🙂

Laadukas viikko takana 🙂

Advertisement

Arvioi tämä:

Posted in kirjasto Tagged avoin data, avoin lädekoodi, avoin lähdekoodi, axiell, axiell aurora, axiell web services, deduplikointi, evergreen, eviikki, extensible catalog, finmarc, helsingin yliopiston kirjasto, isbn, kansallinen digitaalinen kirjasto, kdk, kirjasto, kirjastojärjestelmä, kirjastojärjestelmät, kirjastotietokanta, koha, luettelointi, marc, marc konversio, marc21, metadata, näyttöluettelo, opac, pallaspro, perl, politiikka, solr, tietohallinto, tietojärjestelmä, tietojenkäsittely, tietokanta, tietokantahuolto, tuplakontrolli, turun kaupunginkirjasto, usemarcon, vaski, viikki, vufind, xc

Artikkelien selaus

Viimeisimmät kommentit

ดูหนังโป๊ออนไลน์: Jean-Noël Jeanneney: Google–An…
Keitä meillä palvell…: Oletko kirjaston asiakas vai…
mace: Open Access Button – raportoi…
Hannu: Open Access Button – raportoi…
Kalle: Mitä on tietokannan ja datan…
mace: Helsingin kaupungin tietokesku…
Heikki Poroila: Sillävälin internetissä: musii…
Erja: Paljon onnea tämä blogi 5…
mace: E-kirjat kotiinkuljetettuina
mace: Hesari 18.02.2013: ”Kirj…
Liina: Hesari 18.02.2013: ”Kirj…
Kari Blomster: Four Shades Of Grey
Kari Blomster: Trancend Lex Karpela
Jarppi: Mitä on tietokannan ja datan…
Petri: Mitä on tietokannan ja datan…
marraskuu 2011
ma ti ke to pe la su
 123456
78910111213
14151617181920
21222324252627
282930  
« Lok   Jou »

Arkistot

  • maaliskuu 2014 (4)
  • tammikuu 2014 (2)
  • marraskuu 2013 (7)
  • lokakuu 2013 (2)
  • syyskuu 2013 (1)
  • elokuu 2013 (2)
  • heinäkuu 2013 (7)
  • toukokuu 2013 (6)
  • huhtikuu 2013 (4)
  • maaliskuu 2013 (4)
  • helmikuu 2013 (3)
  • tammikuu 2013 (4)
  • joulukuu 2012 (5)
  • marraskuu 2012 (4)
  • lokakuu 2012 (4)
  • syyskuu 2012 (5)
  • elokuu 2012 (2)
  • heinäkuu 2012 (1)
  • kesäkuu 2012 (3)
  • toukokuu 2012 (3)
  • huhtikuu 2012 (3)
  • maaliskuu 2012 (3)
  • helmikuu 2012 (1)
  • tammikuu 2012 (7)
  • joulukuu 2011 (5)
  • marraskuu 2011 (6)
  • lokakuu 2011 (4)
  • syyskuu 2011 (6)
  • elokuu 2011 (2)
  • heinäkuu 2011 (11)
  • kesäkuu 2011 (6)
  • toukokuu 2011 (3)
  • huhtikuu 2011 (8)
  • maaliskuu 2011 (7)
  • helmikuu 2011 (12)
  • tammikuu 2011 (9)
  • joulukuu 2010 (13)
  • marraskuu 2010 (12)
  • lokakuu 2010 (10)
  • syyskuu 2010 (8)
  • elokuu 2010 (8)
  • heinäkuu 2010 (11)
  • kesäkuu 2010 (10)
  • toukokuu 2010 (14)
  • huhtikuu 2010 (9)
  • maaliskuu 2010 (10)
  • helmikuu 2010 (8)
  • tammikuu 2010 (13)
  • joulukuu 2009 (7)
  • marraskuu 2009 (15)
  • lokakuu 2009 (13)
  • syyskuu 2009 (7)
  • elokuu 2009 (6)
  • heinäkuu 2009 (4)
  • kesäkuu 2009 (3)
  • toukokuu 2009 (3)
  • huhtikuu 2009 (4)
  • maaliskuu 2009 (5)
  • helmikuu 2009 (4)
  • tammikuu 2009 (4)
  • marraskuu 2008 (3)
  • lokakuu 2008 (7)
  • syyskuu 2008 (3)
  • elokuu 2008 (4)
  • kesäkuu 2008 (4)
  • toukokuu 2008 (4)
  • huhtikuu 2008 (13)
  • maaliskuu 2008 (3)

twitter -twiitit

  • @Diogo_PH22 @snezanalawrence @NunoGrancho @SWBdejong @EASST2022Madrid @BricolageYumYum @4sWeb ☀️🥰 5 days ago
  • @Diogo_PH22 @snezanalawrence @NunoGrancho @SWBdejong @EASST2022Madrid @BricolageYumYum @4sWeb The snow further Nort… twitter.com/i/web/status/1… 5 days ago
  • @Diogo_PH22 @snezanalawrence @NunoGrancho @SWBdejong @EASST2022Madrid @BricolageYumYum @4sWeb Oh yes it's dark alri… twitter.com/i/web/status/1… 1 week ago
  • @catladylib Shut off the alarm as fast as possible! 🔕 3 weeks ago
  • @fstflofscholars When book cover design still existed... 1 month ago

Flickr

Vibes :wavy_dash::wavy_dash::wavy_dash:. Reading mathematical concepts of Hamiltonian Monte CarloMathieu and others from Sciences Po médialab developer team presenting performance measures after a week of Hyphe programming retreat at AAU TANT-LabYou organize a voyage to the end of the world, and naturally you take some nice furries inboard :blush:. #uncertainarchives #vestindienOrit Halpern presenting a narrative of the "demo", evoking in me strong sensations of sympathy and gratitude for those before us and their excitement about ideas, change, learning, art, future, possibilities and interventions. "The Smart Mandate: InfrastrBirkan Taş talking about narrative life of data, starting with the case of #ItGetsBetter. "Cripping Time: A Hopeful Endeavour". #data #statistics #uncertainarchivesSome outrageously unnecessary, and popular story of software, particularly #AI catches your attention. You trace the references and read the original paper "Multi-agent Reinforcement Learning in Sequential Social Dilemmas" (https://arxiv.org/abs/1702.0303
More Photos

RSS Tutustumiani kirjoja

  • On tapahtunut virhe; syötteen palvelin ei luultavasti vastaa. Yritä myöhemmin uudestaan.

Blogroll

  • Cycling for libraries
  • Digitaalinen kirjasto
  • First Monday
  • Garfield minus Garfield
  • Heikin blogi
  • I can has cheezburger?
  • if:book
  • Informaatikko irrallaan
  • Informaatiomuotoilu
  • Labs.kirjastot.fi
  • Parlamenttikirjasto
  • Re-public
  • Sorvipenkin äärellä
  • Sula Pinta
  • Tuhat sanaa
  • Verkostouutiset

RSS qaiku -qaikausut

  • On tapahtunut virhe; syötteen palvelin ei luultavasti vastaa. Yritä myöhemmin uudestaan.

RSS jaiku -jaikausut

  • On tapahtunut virhe; syötteen palvelin ei luultavasti vastaa. Yritä myöhemmin uudestaan.

RSS del.icio.us

  • On tapahtunut virhe; syötteen palvelin ei luultavasti vastaa. Yritä myöhemmin uudestaan.

Meta

  • Rekisteröidy
  • Kirjaudu sisään
  • Sisältösyöte
  • Kommenttisyöte
  • WordPress.com

Blog Stats

  • 125 176 hits
Suomen kirjastoseura
Free Software Foundation Europe -donor
EFFI-tukija
Pidä blogia WordPress.comissa.
Privacy & Cookies: This site uses cookies. By continuing to use this website, you agree to their use.
To find out more, including how to control cookies, see here: Cookie Policy
  • Seuraa Seurataan
    • Riippumaton asiantuntija
    • Liity 40 muun seuraajan joukkoon
    • Already have a WordPress.com account? Log in now.
    • Riippumaton asiantuntija
    • Mukauta
    • Seuraa Seurataan
    • Kirjaudu
    • Kirjaudu sisään
    • Ilmoita sisällöstä
    • Näytä sivu lukijassa
    • Hallitse tilauksia
    • Pienennä tämä palkki