Skip to main content

Avoin TKI-toiminta Haaga-Heliassa: Aineistonhallinta

Aineistonhallinnalla tarkoitetaan sitä, että tutkimusaineistot (data) ja niihin liittyvä kuvaileva tieto (metatieto, metadata) on luotu, tallennettu ja järjestetty siten, että aineisto säilyy käyttökuntoisena ja luotettavana ja että tietosuoja ja tietoturva on varmistettu aineiston koko elinkaaren ajan.
Tältä sivulta löydät suosituksia aineistonhallintaan Haaga-Helian TKI-toiminnassa ja linkkejä aineistonhallinnan työkaluihin. Sivua voi lisäksi hyödyntää itseopiskelumateriaalina aineistonhallintaan tutustumisessa.
Tukea aineistonhallintaan antavat TKI-palvelut ja Kirjasto- ja tietopalvelut.

Aineistonhallintaa tukevat palvelut

Fairdata.fi

Kansallinen palvelukokonaisuus aineistonhallintaan, aineistojen kuvailuun ja turvalliseen säilytykseen sekä merkittävien tietoaineistojen pitkäaikaissaatavuuden turvaamiseen. Fairdata-palvelut järjestää opetus- ja kulttuuriministeriö ja toimittaa CSC-Tieteen tietotekniikan keskus Oy.


Muita palveluita

TKI -aineistonhallinnan hyödyt

Data on altis monenlaisille vaaroille aina inhimillisistä erehdyksistä luonnonkatastrofeihin.

Hyvällä aineistonhallinnalla varmistetaan tutkimusaineiston säilyvyys, löytyvyys, saavutettavuus, ymmärrettävyys ja uudelleenkäytettävyys. Tästä on hyötyä sekä tutkijalle, organisaatiolle, tieteelle, rahoittajalle että koko yhteiskunnalle.

  • Tutkija löytää omat aineistonsa
  • Datan avaaminen tuo tutkijalle enemmän näkyvyyttä, lisää viitauksia ja on osa täten osa meritoitumista
  • Organisaatioissa tiedetään, millaisia aineistoja hankkeissa on kerätty ja miten ne saa käyttöön
  • TKI:n vaikuttavuus ja näkyvyys parantuvat
  • Mahdollistaa toistettavuuden -> luotettavuus, läpinäkyvyys
  • Nopeuttaa tutkimusta ja vähentää päällekkäistä työtä
  • Mahdollistaa esim. pitkittäistutkimukset
  • Rahoittajan on helpompi seurata resurssien käyttöä ja kohdentaa niitä
  • Lisää kaupallisia innovaatioita

Tutkimusaineiston hallinta Haaga-Heliassa

Yhä useammat rahoittajat edellyttävät, että rahoitushakemukseen sisältyy aineistonhallintasuunnitelma, jossa kerrotaan, miten hanke hankkii ja käyttää tietoaineistoja, mitkä ovat aineistojen omistus- ja käyttöoikeudet, miten tietoaineistoja tullaan säilyttämään sekä miten tietoaineistoja avataan muille tutkijoille hankkeen aikana ja sen päätyttyä. TKI-hankkeiden aineistojen hallinnointi varmistaa, että ammattikorkeakouluissa tehtävä tutkimus on mahdollisimman korkeatasoista, vaikuttavaa, läpinäkyvää sekä toistettavissa olevaa.

Aineistojen hallinnointi on välttämätöntä kaikilla TKI-prosessin tasoilla ja se tulee varmistaa prosessin alusta lähtien. Hankkeille tuleekin jo suunnitteluvaiheessa tehdä aineistonhallintasuunnitelma. Suomen tutkimusorganisaatioille on kehitetty tätä varten oma työkalu, DMP Tuuli.

Haaga-Helian hankkeissa tutkimusdatan ensisijaisena tallennuspaikkana suositellaan käytettäväksi OKM:n ja CSC:n tarjoamia aineistohallinnanpalveluita ja Haaga-Helian sisäisiä suojattuja verkkolevyjä, tai hankepartnerien kanssa sovittuja ja aineistonhallinnan kannalta turvallisia tallennuspalveluita.  Suosituksia päivitetään ja tarkennetaan, kun kansalliset ja organisaatiotason TKI-toiminnan aineistohallinnan ratkaisut kehittyvät.

IDA on OKM:n tarjoama turvallinen tutkimusaineiston säilytyspalvelu korkeakouluille sekä Suomen Akatemian rahoituksella toimiville tutkijoille. IDA mahdollistaa myös yhteistyöhankkeet eri organisaatioiden välillä. Pysyvien tunnisteiden avulla IDA-palveluun tallennettuun tutkimusdataan voidaan linkittää tutkimuksen tuottamista julkaisuista sekä jakelukanavien viitteiden linkityksistä. IDA tarjoaa mahdollisuuden myös tutkimusaineistojen pitkäaikaissaatavuuteen (PAS).

Huomaathan kuitenkin, että henkilösensitiivinen data on tallennettava tutkimussuunnitelmassa määriteltävään turvalliseen palveluun. Mikäli tutkimusdata sisältää henkilösensitiivistä dataa, sitä ei lähtökohtaisesti saateta avoimeen käyttöön. Tutkimusaineiston avaamista harkittaessa täytyy aina myös arvioida sitä, onko aineiston avaaminen eettisesti, juridisesti ja liiketaloudelliset reunaehdot huomioiden mahdollista.

Tutkimusaineistojen avaaminen ja avoimet tutkimusmenetelmät ovat yksi avoimen TKI -toiminnan näkyvimpiä muotoja avoimen julkaisemisen lisäksi. Aineiston avaaminen lisää tutkimuksen läpinäkyyvyyttä ja vaikuttavuutta. Aineiston avaamisessa jatkokäyttöön suositellaan esim. Creative Commons –lisenssiä, jolloin tutkija voi määrittää datan jatkokäytön avoimuutta: http://creativecommons.fi/.

Hyödynnettäessä avoimesti jaettavaa tutkimusdataa on aineiston lähde ja tekijät merkittävä julkaisuun hyvän tavan mukaisesti.

Mikä on tutkimusaineistoa?

Avoin tiede ja tutkimus-hankkeessa (2014-2017) tuotettu Datanhallinnan opas määritteli tutkimusaineiston seuraavasti:

Tutkimusaineistoilla tarkoitetaan niitä resursseja, joita tutkija tuottaa tai joita hän käyttää tutkimusprosessin aikana. Tutkimusaineistot voivat olla aineellisia tai aineettomia. Jotta aineisto olisi tutkimukseen kelpaavaa, siihen täytyy liittyä tietoja ainakin sen alkuperästä.Esimerkiksi datan liitteeksi tarvitaan kuvailevaa ja teknistä tietoa siitä mitä informaatiota se sisältää. Siksi tutkimusdataan liittyy paljon tietoa siitä, miten se on rakenteistettu ja koodattu, miten se on syntynyt ja miten sitä on käsitelty. Nämä tiedot on aina syytä tallentaa esimerkiksi metatietoihin, koodikirjoihin ja/tai muuhun dokumentaatioon.
Yhdessä datan kanssa tästä kokonaisuudesta muodostuu tutkimusaineisto.
 
Tyypillisiä aineistoja ovat
- kysely- ja haastatteluaineistot
- erilaiset mittaus- ja havainnointiaineistot
- muut video-, kuva-, ääni- ja tekstiaineistot
 
Pitkäaikaissäilytyksessä on huomioitava soveltuvat tiedostomuodot siirrettävyyden ja säilytettävyyden varmistamiseksi. Säilytyskelpoisia tiedostomuotoja on sellaiset formaatit, joissa tietosisällön säilyminen ja ymmärrettävyys voidaan taata pidemmällä aikavälillä. Tällaisia tiedostomuotoja ovat mm. Comma Separated Values (CSV), Extensible Markup Language (XML), Open Document Format (ODF) ja Plain Text (muotoilematon tekstitiedosto). Siirettäviä tiedostomuotoja ovat sellaiset, joita käytetään yleisesti KDK PAS-ratkaisuja hyödyntävissä organisaatioissa ja joissa säilytettävää aineistoa on runsaasti, esimerkiksi Microsoft Officen tiedostomuodot ja Portable Document Format (PDF). Lisätietoa KDK:n ohjeista: http://www.kdk.fi/images/tiedostot/KDK-PAS-tiedostomuodot-v1.4.pdf
 
Tutkimusaineiston kuvailuun on tärkeää kiinnittää huomiota. Kuvailemalla sisältö, muuttujat ja metodologiat varmistetaan aineiston käyttökelpoisuus. Metadata on kuvailevaa tietoa datasta, josta ilmenee olennaiset datan ominaisuuksien tiedot. Kuvailutiedoissa voidaan myös kertoa aineiston käyttöoikeuksiin liittyvistä tekijöistä. Hyvin kuvailtu aineisto on myös paremmin löydettävissä ja vaikuttaa tutkimuksen näkyvyyteen. Lisätietoa Tietoarkiston aineistonhallinnan oppaasta: http://www.fsd.uta.fi/aineistonhallinta/fi/aineiston-kuvailu-ja-metadata.html

DMP Tuuli

Tuuli on suomalaisten tutkimusorganisaatioiden käyttöön kehitetty yhteinen aineistonhallintatyökalu, joka helpottaa aineistonhallintasuunitelman tekemistä ja toteuttamista. Kirjaudu sisään ja tutustu!

Creative Commons

Creative Commons logo

Aineiston avaaminen lisää tutkimuksen läpinäkyyvyyttä ja vaikuttavuutta. Aineiston avaamisessa jatkokäyttöön suositellaan Haaga-Heliassa esim. Creative Commons –lisenssiä, jolloin tutkija voi määrittää datan jatkokäytön avoimuutta. Tutustu lisenssiin ja sen tarjoamiin vaihtoehtoihin: http://creativecommons.fi/

Ohjeita ja oppaita

Tutkimusdataan viittaaminen

Tutkimusdataan viitataan kuten muihinkin lähteisiin, artikkeliin tai kirjallisuuteen. Tavoitteena on, että aineiston alkuperäinen tuottaja  tulee huomioitua. Viittausohjeita löytyy niin data-arkistojen verkkosivuilta kuin kustantajien kirjoitusohjeista.

Tietoarkisto: aineistoon viittaaminen