Tietojen siirtäminen MuseumPlus-järjestelmään (päivitetty 23.5.2017)
Uuteen kokoelmahallintajärjestelmään siirtyminen sisältää useita työvaiheita, joista yksi haastavimmista on tietojen siirtäminen uuteen järjestelmään. Tämän ohjeistuksen tarkoituksena on kertoa tietojen siirrosta ja sen vaiheista sekä siitä, miten tiedot on järjestelmään tallennettu. Lisäksi annetaan käytännöllisiä neuvoja siitä, kuinka museo voi valmistautua tietojen siirtoon eli tietokannan tarkistamiseen ja siivoamiseen. Tavoitteena on, että näiden neuvojen avulla siirtoprosessin kestoa voidaan lyhentää ja tuloksia parantaa.
Migraatio
Suurin yksittäinen työvaihe on vanhan kokoelmahallintajärjestelmän tietojen siirtäminen uuteen järjestelmään, eli migraatio. Migraatiolla tarkoitetaan prosessia, jonka lopputuloksena museon aineisto siirtyy nykyisestä kokoelmahallintajärjestelmästä uuteen.
Kokoelmahallintajärjestelmien tietojen tallennus
Suomessa on käytössä lukuisia erilaisia museoiden kokoelmahallintaan tarkoitettuja järjestelmiä. Jokaisella järjestelmällä on oma tapansa tallentaa tietoa ja esittää sitä. Edes saman kokoelmahallintajärjestelmän eri museoissa käytössä olevat kopiot eivät aina ole kaikilta osiltaan identtisiä. Eri museoilla voi olla käytössään esimerkiksi räätälöityjä omia kenttiä, joita varten on voitu tietokantaan luoda yksittäisten kenttien ohella kokonaan uusia tietokantatauluja. Useimmissa järjestelmissä on jonkinlainen käyttöliittymä, jonka avulla järjestelmiin tallennettua tietoa lisätään, päivitetään ja selataan. Itse tieto on tallennettuna järjestelmän tietokantaan. Siirrettäessä tietoja järjestelmästä toiseen siirretään siis tietoja tietokannasta toiseen.
Tietokanta voidaan useimmiten erottaa kokoelmahallintajärjestelmästä ja siirtää irrallisena, ilman muuta järjestelmää. Tietojen siirron onnistumisen kannalta on välttämätöntä, että näin voidaan tehdä. Tietokanta voidaan erottaa esimerkiksi tietokantadumppina tai exporttina.
Tietokantadumppi tarkoittaa tietokannasta otettua tarkkaa kopiota. Dumpissa on tallella sekä samat tiedot kuin alkuperäisessä tietokannassa että sama rakenne. Dumppi on luettavissa samoilla menetelmillä kuin alkuperäinen tietokanta.
Exportilla tarkoitetaan tietojen viemistä ulos järjestelmästä jossain muussa kuin siinä muodossa, jossa ne on tallennettu järjestelmään. Tällainen tiedosto voi olla esimerkiksi Microsoftin Excel-työkirja tai xml-tiedosto. Export-tiedosto voidaan viedä helposti esimerkiksi toiseen järjestelmään tai vaikkapa ulkoiseen verkkopalveluun (LIDO-export). Exportoinnin asemesta suosittelemme tietokannan toimittamista Kookos-palveluille tietokantadumppina, sillä exportoinnissa menetetään useimmiten tietokannan alkuperäinen rakenne eikä kaikkia tietokannan kenttiä välttämättä saada mitenkään export-tiedostoon mukaan. Kookos-palvelut vastaa tietokantadumpin muuntamisesta siirtokelpoiseen Access-muotoon.

Kansallisgallerian arkistotietokanta Access-muodossa
Jokainen tietokanta on rakennettu tietyn mallin mukaan, jota kutsutaan tietomalliksi. Tietomalli tarkoittaa niitä edellisessä kappaleessa mainittuja rakenteita, joihin käyttäjän syöttämät tiedot on tallennettu. Tietomallin perustana voi olla jokin museoiden luettelointia varten kehitetty yleinen malli, kuten CIDOC-CRM tai esimerkiksi museon itsensä kehittämä malli. Tietomallit eivät useimmiten ole suoraan yhteensopivia toistensa kanssa, mikä pitää huomioida siirrettäessä tietoa järjestelmästä toiseen.
- Tieto siirretään suoraan vanhan kokoelmahallintajärjestelmän kentästä uuden kokoelmahallintajärjestelmän kenttään. Tämä on tavoista ehdottomasti yksinkertaisin, nopein ja tehokkain. Ihanteellisessa maailmassa kaikki kentät siirtyisivät tällä tavalla. Mutta koska järjestelmien tietomallit eroavat toisistaan, usein huomattavastikin, ei suora siirto tule aina kyseeseen. Suoran siirron mahdollistamiseksi kokoelmahallintajärjestelmän kentässä tulisi olla tallennettuna vain yhden tyyppistä tietoa. Tällaista tietoa voisi olla esimerkiksi omaan kenttäänsä tallennettu toimijan sukunimi.
- Vanhan kokoelmahallintajärjestelmän kentästä siirretään tietoja kahteen tai useampaan uuden kokoelmahallintajärjestelmän kenttään. Tämä on vähintäänkin monimutkaista ja usein käytännössä mahdotonta toteuttaa automaattisesti. Tilanteet, joissa vanhan kokoelmahallintajärjestelmän kenttään on tallennettu useita tietoja tai useamman kuin yhden tyyppisiä tietoja, käsitellään aina yksilöllisesti. Tällaisia ovat esimerkiksi tilanteet, joissa yhteen kenttään on tallennettu useita asiasanoja tai samaan kenttään sekä henkilön etunimi että sukunimi. Joitakin vinkkejä tällaisten kenttien käsittelyn helpottamiseksi annetaan aineiston esivalmisteluohjeita käsittelevässä luvussa.
- Useita vanhan kokoelmahallintajärjestelmän kenttiä siirretään yhteen uuden kokoelmahallintajärjestelmän kenttään. Tähän ei kannata pyrkiä, vaan ihannetilanteessa uudessa järjestelmässä olisi jokaiselle tiedolle oma kenttänsä. Tietoja kannattaa yhdistää vain silloin kun vanhassa kokoelmahallintajärjestelmässä on useita kenttiä, joille kaikille ei löydy vastinetta uudesta järjestelmästä. Esimerkki tällaisesta tilanteesta on jos vanhaan järjestelmään on tallennettu tietoja toimijan elämäkerrasta useisiin eri kenttiin, mutta uudessa järjestelmässä on vain yksi kenttä toimijan elämäkertatiedoille.
- Museon käyttämässä nykyisessä kokoelmahallintajärjestelmässä, josta tiedot viedään ulos joko tietokantadumppina (parempi vaihtoehto) tai vaihtoehtoisesti jossain nykyisen järjestelmän mahdollistamassa export-tiedostomuodossa.
- Tietokantadumppi (tai vaihtoehtoisesti erillinen export-tiedosto) viedään Access-muotoon Kookos-kokoelmahallinnan toimesta. Tietokanta tullaan siirtämään Access-muodossa MuseumPlus-järjestelmään. Access-muodossa olevaa tietokantaa täytyy useimmiten muokata vastaamaan paremmin MuseumPlus-järjestelmän tietomallia. Tietojen siirtymistä uuteen järjestelmään verrataan aina ensisijaisesti tätä Access-tietokantaa vastaan testauksen yhteydessä.
- Uudessa järjestelmässä tuotannossa.
- lista kentistä, joiden sisältö halutaan siirtää
- kuvaus siitä, mitä sisältöä kussakin kentässä on
- Mikäli kenttä sisältää usean eri tyyppisiä tietoja, joita tulisi jakaa uudessa kokoelmahallintajärjestelmässä eri kenttien kesken, tulee näiden tietojen olla aina samassa järjestyksessä ja erotettuna toisistaan aina samalla tavalla, esimerkiksi samalla välimerkillä. Jos kenttä vaikkapa sisältää aina tietoja muodossa 'Etunimi, Sukunimi' on se mahdollista jakaa siirtovaiheessa automaattisesti kahteen osaan; etunimeen ja sukunimeen. Jos kenttä sisältää em. muodon lisäksi tietoja myös muodossa 'Sukunimi, Etunimi' tai 'Etunimi;Sukunimi' ei automaattinen jakaminen enää olekaan niin yksinkertaista. Useimmiten päästään parempaan lopputulokseen mikäli tiedot, jotka halutaan näkyviin uudessa järjestelmässä useamman kentän välille, jaetaan useampaan kenttään jo ennen siirtoa. Tämä jakaminen voidaan tehdä joko nykyisessä kokoelmahallintajärjestelmässä tai dumpissa/exportissa. Mikäli jako tehdään nykyisessä järjestelmässä, on se museon vastuulla. MuseumPlus-tiimi voi olla apuna, jos jako tehdään dumpissa/exportissa.
- Kenttien sisältöjä tulee yhdenmukaistaa niin paljon kuin mahdollista, jotta tiedot siirtyisivät oikeisiin kenttiin MuseumPlus-järjestelmään. Esimerkiksi väärään kenttään tallennettu tieto tulee siirtää oikeaan kenttään (esimerkiksi mittatietoja on materiaalitiedoille tarkoitetussa kentässä, kirjallisuusviitteitä on tallennettu kahteen eri paikkaan, kenttä sisältää sinne kuulumattomia tietoja, samasta termistä on käytetty useita eri kirjoitusmuotoja ym.) ja siivota sisältöjä niin, että tietyssä kentässä on vain sinne kuuluvaa tietoa.
- Järjestelmissä käytetään usein vapaatekstikenttiä, joihin on sovittu tallennettavan jokin tietty termi. Tällaisissa tapauksissa termien tulisi olla aina samat. Esimerkiksi näyttelyä tyypiteltäessä käytetään vain yhtä termiä (kuten näyttely) ja muut kirjoitusasut (kuten näyttelyt, näyt., Näyttelyitä) muokataan käytettäväksi termiksi.
- Mikäli vanhaan järjestelmään on tallennettu tietoja julkaisuista tai näyttelyistä, olisi hyvä varmistua, että niiden tiedot ovat kirjoitettu kaikissa tapauksissa samalla tavalla. Samoin toimijoiden tiedot on syytä tarkistaa ja varmistua siitä, että yhdellä toimijalla on vain yksi tietue vanhassa järjestelmässä. Päällekkäiset samaa toimijaa kuvailevat toimijatietueet on hyvä poistaa. Samannimiset toimijat erotetaan toisistaan lisäämällä mahdollisuuksien mukaan muita tietoja toimijasta (syntymä- ja kuolinajat, muut nimet, historiatiedot jne).
- Vanhassa järjestelmässä esiintyvät aikatiedot tulisi yhdenmukaistaa. Hyvä muoto aikojen esittämiseen on ISO 8601, eli VVVV-KK-PP tai VVVVKKPP. Mikäli museo on käyttänyt systemaattisesti jotakin muuta muotoa aikatietojen tallentamiseen, käytetään museon käyttämää muotoa. Tärkeintä on, että muoto on aina sama. MuseumPlus-järjestelmässä on omat kenttänsä alkamispäivämäärälle, päättymispäivämäärälle, alkamisvuodelle, päättymisvuodelle ja kenttä aikatiedon tekstuaaliseen esittämiseen.
- Asiasanoja ja luokitusjärjestelmien luokkia tallennetaan joissakin järjestelmissä vapaatekstikenttään. Museon on hyvä varmistaa, että tietojen tallentamisessa käytetään aina samaa välimerkkiä (esimerkiksi pilkkua). Näin tietojen siirrossa on mahdollista erottaa tiedot toisistaan.
Migraatio = Prosessi, jonka lopputuloksena museon aineisto siirtyy nykyisestä kokoelmahallintajärjestelmästä uuteen.
Tietokanta = Yleisnimitys paikasta, jossa järjestelmään tallennettu tieto sijaitsee.
Tietokantadumppi = Tietokannasta otettu tarkka kopio.
Tietue = Järjestelmään tallennettu tietokokonaisuus, esim. valokuva, henkilö tai kulttuurihistoriallinen esine.
Yhdenmukaistaminen = Tietojen muuttaminen samaan muotoon.