Osallistuin 3.-4.12.2009 EuropeanaLocal -hankkeen puolivälikokoukseen, joka pidettiin Puolan Poznanissa. Kolmivuotinen hanke on siis puolivälissä, ja nyt pidettiin sekä hallinnollinen kokous torstaina, että tekninen työpaja perjantaina. Kokous pidettiin Poznań Supercomputing and Networking Centerin (PSNC) tiloissa, joka vastannee kotimaista CSC:tä.
Ensimmäisenä päivänä käytiin läpi projektin sujumista. Ensimmäinen vuosi sujui pitkälti valmistelujen ja organisoinnin merkeissä, toinen vuosi on toteuttamisen aikaa ja kolmantena keskiöön nousee tiedon levittäminen. Hanke on tähän mennessä edennyt hyvin. Euroopan komissio oli heinäkuussa 2009 tehdyn raportoinnin yhteydessä tyytyväinen asiain tilaan (sorry ei julkinen linkki). Osallistujille maksettavasta rahoituksesta toinen osuus, 48% kokonnaisrahoista on vastikään maksettu. Aiemminhan saatiin 32% ja projektin lopussa saadaan vielä puuttuvat 20%. Rahoista tuli kokouksen aikana puhetta pariin eri kertaan, merkittävimmin kun Mary Rowlatt (MDR Partners) puhui myönnettyjen rahojen käyttötarkoituksen muuttamisesta. Rahaa voi siirtää matkustuskuluista henkilökuntakuluihin ja päinvastoin, mutta muutoksista on hyvä ilmoittaa MDR:lle eteenpäin raportointia varten.
Tämä projektin toinen vuosi on siis implementoinnin aikaa. Tämä koostuu ensinnäkin repositorion pystyttämisestä ja toisekseen metadatan mappaamisesta Europeanan omaan dataformaattiin, Europeana Semantic Elementsiin (ESE). Ensimmäiset partnerit syöttävät metadataa Europeanaan asti vuoden 2010 alussa ja kesään 2010 mennnessä kaiken pitäisi tältä osin olla valmista. Europeanan seuraava versio Rhine, tulee käyttöön heinäkuussa 2010 ja tuolloin mukana pitäisi olla 10 miljoonaa objektia. Suomeen olen pystyttänyt repositorion päättyneen syksyn aikana ja Helsingin kaupunginkirjaston toimittamalle materiaalille on mappaus tehty. Se vaatii vielä hieman viilausta ja odottelen myös RikArt -sivuston uudelleenrakentamista. Lisäksi työn automatisoinnissa on vielä tekemistä, haluan siitä niin automaattisen kuin mahdollista. Minulle on tiedossa on neuvottelua, suunnittelua ja ohjelmointia.
EuropeanaLocaliin liittyvä kansallinen kokous on aikaisimmissa maissa jo tulossa, Ruotsissa aivan näinä hetkinä ja muutamassa muussakin paikassa päivämäärät on jo sovittu. Ehdotin että paikallisista kokouksista koottaisi kattava lista EuropeanaLocalin sivustolle, parissa olisin erittäin kiinnostunut käymään.
Poznanissa kertailtiin myös syitä miksi koko hanke on olemassa. Tämän selvästä artikuloinnista on hyötyä, kun hanketta perustellaan kansallisesti ja uusia sisällöntoimittajia mukaan houkutellessa. Todettiin myös, että EuropeanaLocal on hanke eikä pidemmän päälle kestävä malli. Hanke päättyy siis kesällä 2011 ja tuon jälkeen EU ei enää rahoita toimintaa. Suomessa tilanne on hyvä sillä EuropeanaLocal voidaan (toivoni=suunnitelmieni mukaan) integroida Kansalliskirjaston ja Opetusministeriön Kansalliseen Digitaaliseen Kirjastoon (KDK), joka rakentuu vuoden 2011 aikana.

Väkeä
Kuten todettu, Rhinen julkaisun aikoihin (heinäkuu 2010) tavoitteena on 10 miljoonaa digitaalista objektia. Nykyisellään Europeanassa on noin 4.5 miljoonaa objektia ja mikäli EuropeanaLocalin osallistujat onnistuvat toimittamaan antamiensa tietojen mukaan, saadaan tuo 10 miljoonaa kyllä täyteen. Numeroiden tuijottelu nyt on aina vähän mitä sattuu ja Europeanaa varten on kohtapuolin tulossa ohjeitusta siitä, miten objektit lasketaan. Esimerkkinä Poznanissa käytettiin esim. sitä ovatko valokuvatun kolikon molemmat puolet eri objekteja, vai onko kolikko sinänsä yksi objekti. Toinen ilmeinen esimerkki on se, onko viisisataasivuinen digitoitu kirja yksi vai viisisataa objektia. Laskemiseen on siis toivottavasti tulossa kohta ohjeistusta.
Tulevaisuudessa lisää objekteja saadaan Europeanaan joko siten että nyt mukana olevat partnerit toimittavat lisää tavaraa tai hankitaan lisää partnereita. Suomen osalta tilanne on se, että mukaan yritetään saada muita Helsingin kaupungin virastoja sekä muita organisaatioita. Helsingin kaupunki (kaupunginkirjasto) toimii kansallisena aggregaattorina, eli kerää metatietoa objekteista, käsittelee ne sopivaan muotoon yhteistyössä partnereiden kanssa ja toimittaa ne Europeanaan. Lisäksi kaupunginkirjasto toimittaa itse nelisensataa objektia (viitisenkymmentä digitoitua äänitettä sekä RikArt -taidekirjakokoelman). Mukana on toistaiseksi Helsingistä aika sattumanvaraista aineistoa, strategiselle kokoelmanhallinnalle tulee tarvetta kunhan tekninen ja organisatorinen perusta on saatu kuntoon.
Mainittujen neljän miljoonan objektin osalta tilanne on edelleen se, että niistä 3.5 miljoonaa on kuvia (77%) ja 20% on tekstiä. 82% sisällöstä tulee vain neljästä maasta, vaikka kaikki Euroopan Unionin maat ovat mukana. Lisäksi vaikka objekteeja tulee noin tuhannesta organisaatiosta, todellisuudessa 70% tulee vain neljästä. Aineisto on siis erittäin epätasaisesti jakautunutta ja nyt käynnissä olevat Europeanan satelliittiprojektit yrittävät kerätä sitä laajemmin. EuropeanaLocal on näistä yksi ja tuo mukaan alueellisia ja paikallisia kirjastoja, museoita, arkistoja yms. Tilanne on sikäli kiusallinen, että Europeanan syntyimpulssina oli ranskalaisten tympääntyminen siihen, että Googlessa on niin paljon anglomateriaalia (kts. arvioni Ranskan kansalliskirjaston Jean-Noël Jeanneneyn pamfletista Google–And the Myth of Universal Knowledge vuodelta 2005). Suutarin lapsilla ja niin edelleen… Poznanissa Irlannin kirjastoneuvoston (tms.) edustaja esitti huolensa siitä, että aineisto ei välttämättä pääse näkyville Europanaan vaikka sitä sinne haluttaisi toimittaakaan. En tiedä mikä tämä tilanne tarkalleen on, mutta Europeanan edustajat Robina Clayphan sekä Vanessa Proudman lupasivat selvitellä asiaa. Hyvä että Europeanan edustajia olikin paikalla, kokouksen mittaan tuli esiin kaikenlaisia kysymyksiä ja pyyntöjä sinnepäin välitettäväksi.
Mukaan EuropeanaLocaliin on vastikään tullut pari uutta maata, nimittäin Turkki (wtf!) sekä Serbia. Molempien edustajat olivat paikalla Poznanissa ja esittäytyivät. Vaikka nämä kaksi maata eivät ole Euroopan Unionin jäseniä, AccessIT -hankkeen puitteissa heillä on kuitenkin mahdollisuus olla mukana Europeanassa.
Käyttäjätutkimuksesta
Europeanan käyttäjistä puhuttiin myös. Keväällä 2009 tehtiin kysely johon saatiin 3204 vastausta. Vastauksia saatiin 54 maasta, mutta puolet niistä tulivat vain viidestä maasta. Yleisesti ottaen käyttäjiltä saatiin positiivista palautetta ja he osoittivat uskollisuutta Europeanaa kohtaan. Suunnitteilla on nyt toinen käyttäjätutkimus. Siitä on kaavailtu kaksivaiheista ja vaiheita on suunniteltu eri kohderyhmille. Ensimmäisessä vaiheessa mukana ovat sisällön toimittajat ja vaihe kerää tietoa tulevaa Rhine-julkaisua varten. Mukaan on kyselty 10-12 toimittajamaata ja Suomeakin kyseltiin. Emme nähdäkseni kuitenkaan ole sopiva toimija tähän kyselyyn, sillä edellytyksenä on että nämä nykyiset toimijat ovat jo aktiivisia aggregaattoreita paikallisella ja kansallisella tasolla. Me emme vielä ole. Jokatapauksessa tässä tutkimusvaiheessa pohjana on Functional Specification of Europeana Rhine Release -dokumentti sekä Europeanan aiempi käyttäjätutkimus.
Tutkimuksen toisessa vaiheessa tutkitaan loppukäyttäjiä. Mukaan on tarkoitus ottaa käyttäjiä kaikista 27 maasta, ja koota heistä 18-20 ryhmää. Tutkimuksen muotoa ei ole vielä päätetty, se voisi mahdollisesti perustua käyttäjillä teetettäviin tiedonhankintatehtäviin sekä niihin liittyviin haastatteluihin. Kokouksessa nostettiin esiin tarve toteuttaa tutkimus käyttäjien omilla kielillä ja että olisi tärkeää saada tutkimusapua esim. sosiologeilta käyttäjien samplaamiseen ja kyselyjen rakentamiseen. Europeanalla on olemassa oma ryhmä käyttäjien tutkimiseen.
Käyttäjätutkimus on suunniteltu ajoitettavaksi siis siten että ensimmäinen vaihe pyörisi vähän ennen Rhinen julkaisua ja toinen alkutalvesta 2010 myöhemmin julkaistavaa Danubea varten. Tällöin EuropeanaLocalin myötä tuodut aineistot ovat jo mukana Europeanassa.
Europeanan haaraprojekteja
Käytiin läpi Europeanan haaraprojekteja, joita on koko ajan meneillään useita. Näiden kuvailu tekstitse on ärsyttävää (ja vielä ärsyttävämpää luettavaa), mutta tässä nyt mainittakoot immateriaalioikeuksien selvittämistä käsittelevä ARROW (johon viitattiin Haagissa pidetyssä LIBER-EBLIDA Workshop of Digitalisation of Library Material -työpajassakin useita kertoja), sekä alkamaisillaan olevat HOPE, CARARE ja ASSETS -hankkeet. HOPE kerää tietoa 19. ja 20. vuosisadan kansalais-, naisasia- ja työväenliikkeistä, maahan- ja maastamuutosta, pasifismista sekä kolonialismista. CARARE kerää tietoa arkealogiasta ja arkkitehtuurista ja ASSETS kehittää multimedian etsimismenetelmiä, rankkausalgoritmeja ja sensemmoista. EuropeanaConnect kehittelee datamalleja ja toivottavasti sieltä suunnasta kuullaan jotain SKOSsista.
Osa aggregaattori-hankkeista on ns. pimeitä, eli niille ei tule omaa portaalia (eli sivustoa eli webbikäyttöliittymä) loppukäyttäjää varten, vaan niiden tekemä työ tulee näkyväksi Europeanassa. EuropeanaLocal on yksi näistä, samoin EuropeanaTravel. Joillekin, kuten Biodiverstiry Heritage Librarylle (BHL-Europe) sensijaan tulee myös oma portaali. Aggregaattoreita varten on olemassa Aggregator Handbook ja niiden idea on siirtää hallinnollista taakkaa pois Europeanan harteilta kansallisesti, paikallisesti tai muutoin perustettaviin ja ylläpidettäviin elimiin.
Yksi merkittävä Europeanan hanke on Europeana Content Checker jota olen itsekin jo käyttänyt. Se on työkalu, jolla sisällön toimittajat ja aggregaattorit voivat testata että heidän aineistonsa näkyy oikein Europeanan käyttöliittymässä. Monilla EuropeanaLocalin partnereilla onkin seuraavaksi ohjelmassa metadatansa ja sen mappaus- ja normalisointityön tarkistaminen ECC:llä. ECC muistuttaa paria pientä yksityiskohtaa lukuunottamatta varsinaista Europeanaa.
EuropeanaLocalin jälkeen?
Suomen EuropeanaLocalin osalta tulevaisuus on siis valoisa, mikäli yhdistyminen KDK:hon saadaan järjestettyä. Kaikissa maissa ei tilanne ole kuitenkaan näin otollinen, vaan siellä joudutaan miettimään mitä käy kesän 2011 jälkeen kun EU:n rahoitus päättyy. Kansalliskirjastojen muodostama The European Library kerää varoja mukana olevilta osallistujilta, mutta tämä ei varmistikaan ole pienten, paikallisten osallistujien mukaan houkuttelua ajatellen hyvä malli. Maltalla hankkeen rahoitusta on järjestelty siten, että EuropeanaLocalin myötä koottavaa aineistoa toimitetaan maksutta (lue: EU:n rahoilla) Europeanaan, mutta muilta siitä voidaan veloittaa. Maltan EuropeanaLocal -edustaja ei ole viranomaistaho vaan sikäläinen yritys.
EuropeanaLocalin aikana luodaan rakenteita, joiden omistus- ja hallintosuhteista joudutaan jossain vaiheessa päättämään.
ESE ja EDM metadataformaateista
Europeanan oma metadataformaatti ESE l. Europeana Semantic Elements on evolvoitunut pitkin EuropeanaLocalin elinkaarta, mutta on nyt vakiintunut version 3.2 myötä. Vastikään julkaisiin pieni tarkennus 3.2.1. ESE on siis Europeana-portaalin prototyyppiä varten kehitetty, melko lättänä (flat) siirtomuoto. Se koostuu 37 Dublin Core kentästä sekä 12 Europeanan omasta kentästä. Joissain paikoissa ESE:ä on käytetty kansallisen metadataformaatin pohjana, vaikka tiedossa on ettei ESE ole ongelmaton eikä todellakaan täydellinen.
ESEn korvaamista varten on kehitteillä Europeana Data Model EDM joka on ESEä rikkaampi ja kehittyneempi ja yrittää kuvailla objektia paremmin. Europeanassahan ei siis ole mukana varsinaista objektia vaan Europeana käsittelee vain metadataa, ja EDM yrittää olla aiempaa parempi surrogaatti (”korvike”) varsinaiselle objektille. Mukaan on nyt tulossa enemmän oikeaa semantiikkaa esim. Europeanassa ylläpidettävien auktoriteettitietueiden myötä sekä mahdollisesti jonkinlaisen ontologian kautta. Tämä ei tietenkään tule olemaan aivan yksinkertaista mutta sisällön tarjoajille on tiedossa automaattinen polku ESE:stä EDM:ään. EDM:ää kehitellään Danube -julkaisua silmällä pitäen. EDM:stä puhuttaessa viitattiin Yahoo!:n SearchMonkey -palvelun datamalliin.

Katunäkymä Poznańissa
Puhuttiin myös erilaisten sanastojen lisensoinnista, erityisesti Getty -paikkatietokannan lisensoinnista. Jotkut EuropeanaLocalissa mukana olevat sisällön tarjoajat nimittäin kehittelevät tapoja rikastaa metadataa paikkatiedolla ja joku paikkatietokanta, miel. ontologia on silloin tarpeellinen. Jos ymmärsin oikein, voi Europeanan kautta päästä mukaan blanket-licensing -malliin. Olen itse promonnut Creative Commons -lisensoitua GeoNames -palvelua yhtenä vaihtoehtona ja nostin sen esiin Poznanin kokouksessakin. Metadatan rikastamista onkin useasti korostettu EuropeanaLocalin yhteydessä, mutta on vielä hyvin epäselvää mitä se voisi tarkoittaa eikä siihen ole mitään sen tarkempia suosituksia. Tällaista työtä nyt tekevät sisällön toimittajat toimivat esimerkkeinä muille.
Metatietoformaateista vielä sen verran, että nostettiin (jälleen) esille se, että pitää tietää mitä jokin metatieto käsittelee. Esimerkiksi mikä vuosiluku on merkityksellinen kun kuvaillaan digitoitua valokuvaa patsaasta. Onko digitaaliseen objektiin liittyvä päivämäärä digitoinnin, valokuvaamisen vai patsaan julkaisun päivämäärä? Vai kenties jotain muuta, esim. patsaan aiheeseen liittyvä päivämäärä? Dublin Coressa periaatteena on että luodaan joukko tietueita (yksi kertoo digitoinnista, toinen valokuvaamisesta, kolmas patsaasta, neljäs patsaan aiheesta jne.) ja ne sidotaan toisiinsa DC:n relaatiokentillä. Kts. Using Dublin Core, kappale 1.2 What is Dublin Core? Tämän mallin toteuttaminen jää usein huomiotta, kun siirrytään jostain muusta tietomallista Dublin Coreen. Europeana korostaa, että sisällön tuottajien pitää luettelointi- ja mappausprosessissa ajatella mitä loppukäyttäjä mahtaa haluta, mutta tämä ei suoranisesti ratkaise kysymystä. Tässä onkin hyvää mietiskelyn aihetta 🙂
Sisäisistä työkaluista
Poznanissa puhuttiin myös EuropeanaLocalin omista sivuista. sekä niiden pienoisesta uudistamisesta. Ehdotin että rekisteröitymisen takana olevia sisältöjä siirretään julkiselle puolelle niin paljon kuin suinkin mahdollista. Ilokseni sisäiseen keskustelufoorumiimme viitattiin myös lukuisia kertoja ja sekä Mary, Rob Davies että Runar houkuttelivat sinne mukaan kaikkia asianosaisia. Olen itse lietsonut ja liehitellyt sen puolesta monessa yhteydessä ja kirjoitellut sinne kaikenlaista ja laittanut MARC→ESE mappauksiamme näkyviin ja kertonut käyttämistämme työkaluista ja teknologiasta ja yritän saada muitakin tekemään samoin. Ei voi olla niin, että pan-eurooppalaisessa projektissa mukana olevat toimijat keskustelevat keskenään vain kerran puolessa vuodessa pidettävissä kokouksissa. Uskon että foorumi lähteekin kukoistamaan.
Foorumin ja yllä mainitun Europeana Content Checkerin lisäksi on otettu käyttöön EventLog, johon EuropeanaLocal -partnerit raportoivat mukaan tuomistaan kokoelmista ja niiden työstämisen etenemisestä. Pitääkin itse muistaa syöttää sinne meidän omat tiedot.
EuropeanaLocaliin liittyvää bibliografiaa keräillään ja tiedot hankkeen maininnoista artikkeleissa ja seminaareissa ovatkin tervetulleita. Niitä on kohtapuolin täältä Suomestakin tiedossa. EuropeanaLocalin aiemmassa raportissa olikin jo jonkinlainen listaus niitä, toivottavasti saadaan ne mukaan tuonne EuropeanaLocalin webbisivuille myös. Kyseltiin olisiko kukaan kiinnostunut pitämään EuropeanaLocalin omaa blogia tai Twitteriä, mutta vapaaehtoisia ei ollut. Blogihan oli aiemmin ja sivustolle kerätään kyllä uutisia.
Tiedossa
Mary Rowlattin alustuksella käytiin läpi mitä EuropeanaLocalin suhteen on tiedossa. Hän tiivistikin ne kahteen kohtaan, nimittäin sisältöön ja kansallisiin tapaamisiin.
Jokainen mukana olevista 27:stä maasta järjestää yhden kansallisen tapaamisen, jossa on mukana paikallinen aggregaattori sekä käyttäjiä ja mahdollisesti myös EuropeanaLocalin hallinnollista väkeä. Kokous on sekä Europeanan paikallista markkinointia että paikallisten aineistojen mukaanhoukuttelua. Itse olisin tosiaan kiinnostunut käymään muutamassa tällaisessa kansallisessa tapaamisessa. Suomen tapaamisesta ei vielä ole tarkkaa tietoa, mutta se pidettänen Mikkelissä Kansalliskirjaston digitointi- ja mikrokuvauslaitoksessa ensimmäisellä vuosineljänneksellä 2010. Tammikuussa pitäisi olla tarkkaa tietoa asiasta ja siellä esitellään ainakin aiheeseen liittyvää dokumentaatiota (esim. Europeana Content Strategy) sekä EuropeanaLocaliin liittyvä repositorio ja miten pääsee mukaan. Suomessa on vireillä myös eri muistiorganisaatioiden (kirjastot, arkistot ja museot=KAM) digitointi-intoa kartoittava tiedonkeruu.
Kansallisen tapaamisen lisäksi tiedossa on jossain vaiheessa siis siirtyminen ESE:stä EDM:ään ja lisää teknisiä työpajoja keväällä 2010. Toivottavasti jossain kauniissa paikassa missä on mukava sää ja hyvää ruokaa 🙂 Maltaa ja Espanjan Madridia ehdotettiin, samoin Ruotsia ja Belgiaa. Puolassa en ole tätä reissua ennen käynyt, mutta Poznan oli kyllä erittäin mukavan oloinen kaupunki. Opiskelijoita on kaupungin väkiluvusta 1/6 ja Berliiniinkin on parin tunnin junamatka. Sää oli sumuinen ja puolihyinen, mutta minusta oikein sopiva Puolaan. Kuvia reissusta yleisesti on kuvasetissäni Poznań ja varsinaisesta kokouksesta setissä EuropeanaLocal midterm meeting.