Skip to Main Content

Avoin ja vastuullinen TKI-toiminta Haaga-Heliassa: Tutkimusaineistot ja aineistonhallinta

Yhteydenotot

Vastuulliseen ja avoimeen TKI-toimintaan liittyvissä kysymyksissä voit ottaa yhteyttä Haaga-Helian keskitettyyn avoimen tki-toiminnan tukeen (att-tukeen) tai tutkimuspalveluihin. Keskitetty att-tuki ohjaa kysymykset tarvittaessa edelleen tutkimuspalveluihin, kirjastoon, IT-palveluihin, opetuksen avoimuudesta vastaavalle, laki- ja tietosuoja-asiantuntijoille tai Haaga-Helian monialaiselle koordinaatioryhmälle.

att-tuki@haaga-helia.fi

rdi.services@haaga-helia.fi

Hankkeen valmistelu

Tutkimusdatapolitiikkamme kuvaa TKI-toiminnassa syntyvän datan hallinnan perusperiaatteet, linjaukset ja vastuut Haaga-Heliassa.

Tutkimusdatapolitiikan ja siihen liittyvien ohjeiden tavoitteena on luoda selkeät pelisäännöt tutkimusdatan elinkaaren hallintaan, eli keräämiseen, esittämiseen, dokumentointiin, kuvailuun, säilytykseen ja poistamiseen Haaga-Heliassa.

Tutkimusdatapolitiikka ohjaa tutkimusta tekeviä toimimaan tämän hetken aineistonhallinnan vaatimusten, hyvän tieteellisen käytännön, avoimen tieteen ja tutkimuksen linjausten sekä voimassa olevan lainsäädännön mukaisesti.

Tavoitteemme on mahdollistaa myös Haaga-Heliassa tehtävän tutkimuksen laaja-alainen yhteiskunnallinen vaikuttavuus. Vaikuttavuuden kannalta on tärkeää, että tutkimusaineistomme ovat niin avoimia kuin mahdollista ja niin suljettuja kuin tarpeen. Jos aineiston avaaminen ei ole perustellusta syystä mahdollista, on tavoitteemme kerätä organisaatiotasoisesti tieto datasta sekä mahdollisuuksien mukaan julkaista avoimesti aineiston metadata. Lisäksi tutkimusdatapolitiikka pyrkii selventämään sekä organisaation että kunkin dataa käsittelevän roolin ja vastuut.

Seuraamme datapolitiikan toteutumista sekä kansallisia ja kansainvälisiä tutkimusdatanhallinnan suosituksia ja tutkimusdatan elinkaareen hallintaan liittyviä kansallisten palveluiden kehittymistä ajantasaisesti.

Lue Haaga-Helian tutkimusdatapolitiikka kokonaisuudessaan sekä tarkemmat ohjeet alla olevista linkeistä.

Aineistonhallinta on osa vastuullisesti toteutettua TKI-hanketta ja aineistonhallinnan elinkaari seuraa TKI-hankkeen prosessimallia hankkeen valmistelusta toteutukseen, tulosten hallinnasta niiden julkaisemiseen ja avaamiseen sekä liiketoiminnallisen potentiaalin hyödyntämiseen. Aineistonhallinta tukee tutkimuksen läpinäkyvyyttä, luotettavuutta ja toistettavuutta sekä projektin aikana että sen jälkeen.

Aineistonhallinta kattaa TKI-hankkeen

  • Tutkimusdatan hallinnan suunnittelun (esim. aineistoon liittyvät luvat ja sopimukset, pääsy- ja käyttöoikeudet, käytettävät kansiorakenteet, tiedostomuodot, aineiston elinkaari)
  • Säilyttämisen ja tarvittavan suojaamisen hankkeen aikana ja sen jälkeen (suojattavien tietojen käsittely, henkilötietojen käsittely, aineistojen jaetun käytön alustaratkaisut, aineistojen tuhoaminen)
  • Aineiston kuvailun ja ymmärrettäväksi tekemisen tutkimuksen aikana ja sen jälkeen (esim. tiedostojen nimeämisen käytännöt, muuttujien ja menetelmien dokumentointi, versionhallinta)
  • Aineiston tai ainakin sen metadatan avaamisen (datarepositoriot, kuvailutyökalut)

Hyvä aineistonhallinta on osa hyvää tieteellistä käytäntöä ja varmistaa, että hankkeessa noudatetaan rahoittajien ja lainsäädännön tutkimusaineistoille asettamia vaatimuksia.

Jo hankkeen valmisteluvaiheessa on olennaista, että valmistelijoilla on hyvä käsitys kerättävästä aineistosta ja siihen liittyvistä tutkimuseettisistä ja lainsäädännöllisistä kysymyksistä sekä aineiston käsittelyn infrastruktuuritarpeista.

Haaga-Helia tarjoaa tukea hankkeen aineistonhallinnan palvelutarpeiden ja aineistonhallinnan riskien tunnistamiselle hankkeen valmisteluvaiheessa. Hankkeen palvelutarpeiden kartoittamiseksi valmistelija täyttää alla olevan lomakkeen, joka toimii varsinaisen aineistonhallintasuunnitelman luonnoksena, ja toimittaa sen tukipalveluille. Vaihtoehtoisesti valmisteluvaiheessa tehdään alustava aineistohallintasuunnitelma, mikäli rahoittaja näin edellyttää.

Tutkimuseettisen neuvottelukunnan (TENK) tutkimuseettisen ohjeen hyvästä tieteellisestä käytännöstä ja sen loukkausepäilyjen käsittelemisestä, eli HTK-ohjeen, tavoitteena on edistää ja antaa malli hyvälle tieteelliselle käytännölle.

Hankkeiden aineistonhallinnan, tutkimusaineistojen keräämisen, käsittelyn ja tallentamisen kannalta keskeisiä HTK:n lähtökohtia ovat mm.

  • Tutkimukseen sovelletaan tieteellisen tutkimuksen kriteerien mukaisia ja eettisesti kestäviä tiedonhankinta- ja tutkimusmenetelmiä, jotka eivät vaaranna tutkittavien ja tutkijoiden terveyttä ja turvallisuutta.
  • Tutkija kunnioittaa tutkittavien perusoikeuksia, ihmisarvoa ja itsemääräämisoikeutta, sekä materiaalista ja immateriaalista kulttuuriperintöä ja biodiversiteettiä.
  • Tutkimus suunnitellaan ja toteutetaan ja siitä raportoidaan sekä siinä syntyneet tietoaineistot tallennetaan tieteelliselle tiedolle asetettujen vaatimusten edellyttämällä tavalla.

Käytännössä HTK:n näkökulmasta on myös varmistettava, että ennen aineiston keräämisen aloittamista on

  • tutkimusluvat
  • tutkimustiedote osallistujille ja osallistujien suostumukset tutkimukseen
  • henkilötietojen käsittelyn kuvaus, henkilötietojen käsittelyn riskien- ja vaikutustenarvio, osallistujien suostumukset henkilötietojen käsittelyyn
  • tarvittaessa tehty eettinen ennakkoarviointi
  • sovittu aineiston omistajuudesta ja oikeuksista sen jatkokäyttöön (ml. mahdollisesti tutkimuksessa syntyvä tekijänoikeuksien alainen aineisto)
  • tunnistettu aineistoon liittyvä ajantasainen lainsäädäntö esimerkiksi tietosuojaan, salassapitoon tai tekoälyn käyttöön liittyen ja varmistettu niiden noudattaminen

HTK-ohje antaa myös menettelyohjeet hyvän tieteellisen käytännön loukkaamista koskevien epäilyjen käsittelemiseksi. HTK-loukkaus voi olla vilppinä, eli tahallisena harhauttamisena, tai törkeinä laiminlyönteinä tai holtittomuutena ilmenevää piittaamattomuutta hyvästä tieteellisestä käytännöstä.

TENKin laatimassa ihmiseen kohdistuvan tutkimuksen eettisissä periaatteissa kuvataan niitä eettisiä periaatteita, joita tulee noudattaa humanistisessa ja yhteiskuntatieteellisessä tutkimuksessa sekä esimerkiksi tekniikan alan ihmiseen kohdistuvassa tutkimuksessa. Näitä periaatteita noudetetaan myös yritysten ja muiden tahojen kanssa tehtävässä tutkimusyhteistyössä, ja tarvittaessa on pyydettävä ihmistieteiden eettisen toimikunnan lausunto ennen tutkimuksen ja aineistonkeruun aloittamista.

Eettinen ennakkoarvio on tehtävä aina kun:

  1. tutkimukseen osallistumisessa poiketaan tietoon perustuvan suostumuksen periaatteesta
  2. tutkimuksessa puututaan tutkittavien fyysiseen koskemattomuuteen
  3. tutkimus kohdistuu alle 15-vuotiaisiin ilman huoltajan erillistä suostumusta tai informointia, jonka perusteella huoltajalla olisi mahdollisuus kieltää lasta osallistumasta tutkimukseen
  4. tutkimuksessa tutkittaville esitetään poikkeuksellisen voimakkaita ärsykkeitä
  5. tutkimuksessa on riski aiheuttaa tutkittaville tai heidän läheisilleen normaalin arkielämän rajat ylittävää henkistä haittaa (trauma, masennus, unettomuus)
  6. tutkimuksen toteuttaminen voi merkitä turvallisuusuhkaa tutkittaville tai tutkijalle tai heidän läheisilleen

Eettisissä periaatteissa kuvataan myös lasten ja vajaakykyisten ihmisten tutkimukseen liittyviä eettisiä periaatteita.

Haaga-Helia on mukana pääkaupunkiseudun ammattikorkeakoulujen yhteisessä ihmistieteiden eettisen ennakkoarvioinnin toimikunnassa. Eettiset ennakkoarvioinnit toteutetaan tämän toimikunnan kautta keskitetysti.

Tutkimuksen eettisen ennakkoarvioinnin tarpeen arvioi ensisijaisesti tutkija / tutkimusryhmä.

Tutustu Haaga-Helian ohjeisiin ja ole yhteydessä Tutkimuspalveluihin, kun pohdit, tarvitsetko tutkimushankkeessasi eettistä ennakkoarviointia tai jos haluat lisätietoa eettisestä ennakkoarvioinnista.

Data on altis monenlaisille vaaroille aina inhimillisistä erehdyksistä luonnonkatastrofeihin.

Hyvällä aineistonhallinnalla varmistetaan tutkimusaineiston säilyvyys, löytyvyys, saavutettavuus, ymmärrettävyys ja uudelleenkäytettävyys. Tästä on hyötyä sekä tutkijalle, organisaatiolle, tieteelle, rahoittajalle että koko yhteiskunnalle.

  • Tutkija löytää omat aineistonsa
  • Datan avaaminen tuo tutkijalle enemmän näkyvyyttä, lisää viitauksia ja on osa täten osa meritoitumista
  • Organisaatioissa tiedetään, millaisia aineistoja hankkeissa on kerätty ja miten ne saa käyttöön
  • TKI:n vaikuttavuus ja näkyvyys parantuvat
  • Mahdollistaa toistettavuuden -> luotettavuus, läpinäkyvyys
  • Nopeuttaa tutkimusta ja vähentää päällekkäistä työtä
  • Mahdollistaa esim. pitkittäistutkimukset
  • Rahoittajan on helpompi seurata resurssien käyttöä ja kohdentaa niitä
  • Lisää kaupallisia innovaatioita

Hankkeen toteuttaminen

Projektin käynnistämiseen liittyy useita aineistonhallinnan toimia. Aineistonhallintasuunnitelman vastuuhenkilöksi nimetään Haaga-Heliassa yleensä projektipäällikkö, mutta vastuuhenkilö voi olla myös joku muu. Viimeistään tässä vaiheessa on tunnistettava tarpeet aineiston suojaamiseen ja henkilötietojen käsittelyyn liittyviin sopimuksiin ja dokumentaatioon, sekä sovittava aineiston keruuseen, käsittelyyn ja tallentamiseen liittyvät yksityiskohdat. Projektin toteuttamisvaiheeseen kuuluu

  • aineistonhallintasuunnitelman tekeminen
  • tutkimuslupien hankkiminen
  • tutkittavien informointi ja suostumuksen hankkiminen osallistumiseen ja tarvittaessa henkilötietojen käsittelyyn
  • tarvittavien tallennusratkaisujen hankkiminen ja hyödyntäminen
  • sopimusten laatiminen (esim. yhteistyösopimukset, sopimukset tekijänoikeuksista, yhteisrekisterisopimus, sopimus tietojenkäsittelystä)
  • tarvittavien aineiston käsittely-ympäristöjen hankkiminen ja hyödyntäminen, dokumentoinnin prosessien sopiminen.

Tarvittavat mallipohjat sekä sopimuspohjat esimerkiksi hankkeen IPR-sopimuksiin löytyvät Tutkimusdatapolitiikan ohjeista ja TKI-hankkeen sopimussivulta.

Haaga-Heliassa tutkimus- ja kehityshankkeilta edellytetään aineistonhallintasuunnitelman tekemistä organisaation ja mahdollisen rahoittajien ohjeita noudattaen. Aineistojen hallinnointi on välttämätöntä kaikilla TKI-prosessin tasoilla ja se tulee varmistaa prosessin alusta lähtien. Aineistohallintasuunnitelmien tekeminen on oletusarvoisesti vastuutettu projektipäälliköille.

Tutkimusdataa ovat TKI-hankkeissamme tuotetut, muokatut ja käytetyt aineistot, joihin hankkeen tulokset perustuvat. Tutkimusdataa ovat myös itse aineistojen lisäksi aineiston kontekstia, aineistokokonaisuutta tai havaintoyksikköä kuvailevat metatiedot.

Aineistonhallintasuunnitelmassa kerrotaan mm.

  • miten hanke hankkii ja käyttää tietoaineistoja
  • mitkä ovat aineistojen omistus- ja käyttöoikeudet
  • miten tietoaineistoja tullaan säilyttämään sekä
  • miten tietoaineistoja avataan muille tutkijoille hankkeen aikana ja sen päätyttyä.

Aineistonhallintasuunnitelma kuvaa aineiston teknistä ja hallinnollista käsittelyä, ja siinä tulisi osoittaa erityisesti näihin liittyvien riskien huomioimista ja hallintaa. Tässä mielessä aineistonhallintasuunnitelman voi mieltää riskienhallintadokumentiksi. Aineistonhallintasuunnitelma on elävä dokumentti, johon voi palata ja sitä voi tarkentaa hankkeen aikana.

Haaga-Heliassa aineistonhallintasuunnitelmien työkaluksi suosittellaan joko rahoittajan toimittamaa omaa aineistonhallintasuunnitelman pohjaa, Haaga-Helian omaa pohjaa, tai DMPTuulin yleistä aineistonhallintasuunnitelman pohjaa.

Tutkimuspalvelut tukee hankkeen valmistelua, aloittamista ja aineistonhallinnan suunnittelua sekä ohjaa tarvittaessa muiden tukipalvelujen, kuten juristin ja tietosuojavastaavan puoleen.

Aineistonhallintasuunnitelma tallennetaan hankehallintajärjestelmään.

Jos haluat tutkimuksessasi käyttää Haaga-Helian henkilökunnalta, opiskelijoilta tai alumneilta hankkimaasi tietoa eli tutkimusdataa, tarvitset tähän tutkimusluvan. Tutkimuslupa on Haaga-Helian lupa lähestyä sen henkilökuntaa, opiskelijoita ja/tai alumneja tutkimukseen liittyvissä asioissa, eikä se korvaa tutkittavan suostumusta osallistua tutkimukseen. Jos tietoja hankitaan suoraan tutkittavilta henkilöiltä haastatteluin, kyselyin tai muilla vastaavilla tavoilla, päätöksen tutkimukseen osallistumisesta tekee kukin henkilö itse.


Haaga-Helian tutkimuslupa ei ole tutkimuksen eettinen ennakkoarviointi. 

Organisaation tutkimuslupaa ei kuitenkaan tarvita seuraavissa tilanteissa:

  • Haaga-Helian omaan kehittämistyöhön liittyvät kyselyt henkilökunnalle (esim. Henkilöstöpalveluiden, Laatupalveluiden jne. tekemät kyselyt)
  • Sellaiset laadulliset tutkimukset, joissa haastateltavien määrä on pieni (alle 5)

Tutkimuslupaa haetaan täyttämällä tutkimuslupahakemus ja toimittamalla se sähköpostilla Tutkimuspalveluille. Tutkimuslupiin ja niiden hakemiseen liittyvissä kysymyksissä voit olla yhteydessä Tutkimuspalveluihin.

Informointi tutkimuksesta

Kaikissa ihmisiä tutkivissa tieteissä keskeinen eettinen periaate on informoida tutkittavia tutkimuksen aiheesta ja tavoitteista, käytetyistä menetelmistä, tutkimusaineiston käsittelystä ja jatkokäytöstä. Informoinnin tarkoitus on saada tutkittavat ymmärtämään mihin he suostuvat, jotta he voivat antaa suostumuksen tutkimukseen osallistumiselle.

Koska suostumus tutkimukseen osallistumiselle annetaan sen perusteella, miten tutkimuksesta on informoitu, tutkimuksesta informointi muodostaa käytännössä suostumuksen sisällön. Informointi muodostaa perustan sille, miten tutkija saa aineistoa käyttää siinä tutkimuksessa, johon aineisto on kerätty tai jatkotutkimuksissa.

On tärkeää jo tutkimuksen suunnitteluvaiheessa ja valmisteluvaiheessa pohtia aineiston arvoa ja jatkokäyttömahdollisuuksia tai sen kertaluonteisuutta puoltavia seikkoja, jotta aineiston käsittelystä voidaan informoida tutkittavia oikein. Informoinnin lähtökohtana siis on tutkimussuunnitelman osana oleva aineistonhallintasuunnitelma ja kyseisen tutkimuksen erityispiirteet.

Tutkittavien informoinnin sisältö ja tarkkuus riippuu aineistosta ja tutkimuksen tavoitteista.

Haaga-Heliassa tutkimuspalvelut ylläpitää yhdessä tietosuojavastaavan kanssa ohjeita ja valmiita pohjia, jotka ovat hankkeiden käytettävissä suostumuksen pyytämisessä ja aineiston keräämisen kohteen informoinnissa.

 

Informointi henkilötietojen käsittelystä

Mikäli tutkimuksen yhteydessä kerätään henkilötietoja, tutkimukseen osallistuville tulee kertoa tämä selkeästi sekä pyytää lisäksi erillinen suostumus erityisesti henkilötietojen käsittelyyn. Henkilötietojen kerääminen edellyttää tiedoille rekisterinpitäjää, ja henkilötietojen käsittelyä koskevien tietojen antaminen on rekisterinpitäjän velvollisuus. Rekisterinpitäjästä on enemmän tietoa kohdassa Suojattavan aineiston käsittely.

Tutkittavien tulee informoinnin perusteella ymmärtää, millä perusteella henkilötietoja kerätään ja käsitellään, kuinka heitä koskevia henkilötietoja kerätään, käytetään, luovutetaan, säilytetään ja muulla tavoin käsitellään.

Yleisenä edellytyksenä on, että henkilötietojen käsittelyä koskevat tiedot annetaan tutkittaville tiivisti esitetyssä, läpinäkyvässä, helposti ymmärrettävissä ja saatavilla olevassa muodossa selkeällä ja yksinkertaisella kielellä. Rekisterinpitäjällä on osoitusvelvollisuus siitä, että informointi on suoritettu tietosuoja-asetuksen edellyttämässä laajuudessa.

Haaga-Heliassa tutkimuspalvelut ylläpitää yhdessä tietosuojavastaavan kanssa ohjeita ja valmiita pohjia, jotka ovat hankkeiden käytettävissä suostumuksen pyytämisessä henkilötietojen käsittelyyn ja aineiston keräämisen kohteen informoinnissa.

Lisäksi hankkeissa kuvataan (määräaikainen) henkilötietojen käyttö siihen tarkoitetulla lomakkeella, joka toimitetaan tietosuojavastaavalle.

Haaga-Helia on velvollinen noudattamaan julkisuuslakia, ja salassapidon tulee perustua siihen tai muuhun erityislakiin. Salassapidettäviä tietoja ovat mm. liike- ja ammattisalaisuudet, yksityisten ihmisten yksityisyyden suojan piiriin kuuluvat tiedot sekä turvallisuusjärjestelyihin, tiloihin, tietoturvaan ja varautumiseen liittyvät tiedot.

(Tulossa: kansallinen suojausluokitus?)

Jotta pystyisi käsittelemään tietoaineistoja asianmukaisesti, tulee tunnistaa, millaista tietoa hankkeessa aiotaan kerätä. Aineiston vastuullinen ja lainmukainen käsittely on suunniteltava jo ennen kuin tietoja ryhdytään keräämään.

Mikäli tutkimusdata sisältää suojattavaa aineistoa, sen käsittelyssä tulee noudattaa lainsäädännön lisäksi Haaga-Helian suojattavien aineistojen käsittelyn ohjeen mukaisia sääntöjä ja rajoituksia. Käsittelytoimet tulee myös dokumentoida, esimerkiksi kuvaamalla ne aineistonhallintasuunnitelmassa.

 

Henkilötietojen käsittely

Henkilötietoja ovat sellaiset tiedot, joiden perusteella henkilö voidaan tunnistaa suoraan tai välillisesti esimerkiksi yhdistämällä yksittäinen tieto johonkin toiseen tietoon, joka mahdollistaa tunnistamisen.

  • Suoria tunnisteita ovat mm. henkilön koko nimi, henkilötunnus, sormenjälki, kasvokuva, ääni, käsin tehty allekirjoitus.
  • Vahvoja epäsuoria tunnisteita ovat mm. osoite, puhelinnumero, harvinainen ammattinimike tai virka-asema, yksilöivät tunnisteet kuten tietokoneen IP-osoite.
  • Epäsuoria tunnisteita ovat mm. sukupuoli, ikä, tehtävänimike, kansallisuus, työpaikka tai koulu.

Erityisiä henkilötietoryhmiä ovat mm. etninen alkuperä, poliittiset mielipiteet, uskonnollinen tai filosofinen vakaumus, terveyttä koskevat tiedot ja seksuaalinen suuntautuminen ja käyttäytyminen, geneettiset ja biometriset tiedot henkilön tunnistamista varten. Erityisiksi henkilötiedoiksi lasketaan myös esimerkiksi päihdehuollon tai lastensuojelun asiakkuus tai henkilön rikostuomioihin liittyvät tiedot. 

Erityisten henkilötietoryhmien käsittely tutkimuksessa on lähtökohtaisesti kielletty ja edellyttää aina rekisteröidyn nimenomaista suostumusta.

Jos aineistoa käsittelee joku muu kuin tutkimusta tekevät, on käsittelystä tehtävä tietojenkäsittelysopimus. Käsittelytoimien alihankintaan on käytettävissä valmis sopimusmalli, jota muokataan eri tapauksiin sopivaksi juristin kanssa.

Henkilötietojen käsittelyssä tulee huomioida mm.

  • Henkilötietojen käsittelyn lainmukaisuus.

  • Läpinäkyvyys; tutkittavien informointi henkilötietojen käsittelystä ja suostumuksen pyytäminen.

  • Täsmällisyys; käsiteltävien tietojen tulee olla virheettömiä, ajantasaisia ja käyttötarkoitukseensa nähden riittäviä.

  • Käyttötarkoitussidonnaisuus; tutkittaville on yksilöitävä henkilötietojen käyttötarkoitus ja määriteltävä eri tahojen roolit tietojen käsittelyssä.

  • Tietojen minimointi; on kerättävä vain tutkimuksen kannalta tarpeellisia henkilötietoja.

  • Säilytyksen rajoittaminen; henkilötietoja säilytetään vain siltä osin kuin on tarpeellista.

  • Tietoturvallisuus; luottamuksellisuuden, eheyden ja saatavuuden varmistaminen.

 

Rekisterinpitäjä ja käsittelyn peruste

Henkilötietojen kerääminen hankkeessa edellyttää aina rekisterinpitäjää, joka vastaa ja ohjeistaa henkilötietojen käsittelystä ja suojausmenetelmistä. TKI-toiminnassa rekisterinpitäjyys vaihtelee tapauskohtaisesti rahoitusmuodon sekä toimijaverkon mukaan. Yleensä rekisterinpitäjä on organisaatio, joka  vastaa aineiston keräämisestä. Yleisluontoinen määrittely rekisterinpitäjyydestä on usein yhteistyösopimuksissa. Kaupallisessa kehittämistoiminnassa asiasta sovitaan toimeksiantosopimuksessa.

Myös yhteisrekisterinpitäjyys on mahdollista, jolloin hankekumppanit yhdessä määrittelevät henkilötietojen käsittelyn tarkoitukset ja käsittelytavat. Tällöin on solmittava yhteisrekisterinpitäjyyssopimus ennen tietojen keräämisen aloittamista ja ennen tutkittavien informointia henkilötietojen käsittelystä.

Henkilötietojen käsittelylle täytyy aina olla laista löytyvä käsittelyperuste. Valittua käsittelyperustetta ei voi vaihtaa käsittelyn alettua, ja käsittelyperuste vaikuttaa siihen, millaisia oikeuksia rekisteröidyllä on suhteessa rekisterinpitäjään. Hankkeissa käsittelyperuste on yleensä yleisen edun mukainen tehtävä tai suostumus.

Rekisterinpitäjän velvollisuus on myös informoida rekisteröityjä henkilötietojen käsittelyn kokonaisuudesta, ks. osio Tutkittavien informointi tutkimuksesta ja henkilötietojen käsittelystä.

 

Henkilötietojen käsittelyn riskienarviointi, vaikutusten arviointi sekä DPIA

Ennen henkilötietojen keräämistä tulee arvioida käsittelyn riskit. Riskiarviointi tehdään rekisteröidyn näkökulmasta, ja siinä otetaan laajasti huomioon erilaiset rekisteröidyn oikeuksiin ja vapauksiin kohdistuvat riskit (esimerkiksi taloudelliset vahingot, rikoksen uhriksi joutuminen, sosiaaliset vahingot kuten mainehaitta, syrjityksi tai maalitetuksi joutuminen).

Arviointi lähtee liikkeelle käsittelyyn liittyvien riskien tunnistamisesta ja listaamisesta. Tämän jälkeen arvioidaan kunkin riskin osalta toteutuneen riskin vaikutusten vakavuus.

Mikäli tutkimuksen yhteydessä suoritetaan sellaista henkilötietojen käsittelyä, johon liittyy korkea riski (esim. käsitellään arkaluonteisia henkilötietoja), käsittelytoimista voidaan joutua laatimaan yleisen tietosuoja-asetuksen mukainen vaikutustenarviointi (data protection impact assessment, DPIA).

DPIAn tarkoituksena on toimia riskienhallinnan apuvälineenä korkeariskisessä henkilötietojen käsittelyssä sekä varmistaa henkilötietojen käsittelyn periaatteiden ja rekisteröidyn oikeuksien riittävä toteutuminen ottaen huomioon käsittelyn korkea riskitaso. Tietosuojavastaavaa tulee konsultoida DPIAn tarpeen arvioimiseksi, ja tietosuojavastaavan tulee aina olla mukana DPIAn laadinnassa.

 

Aineiston pseydonymisointi ja anonymisointi

Joskus aineisto on tarpeen pseudonymisoida tai anonymisoida, eli joko muuttaa siten, että sen tietoja ei enää ilman aineistoon sisältymätöntä lisätietoa pysty yhdistämään tiettyyn luonnolliseen henkilöön (pseydonymisointi) tai siten, että tietoja edes muualta saatavan lisätiedon avulla pystytä yhdistämään tiettyyn luonnolliseen henkilöön (anonymisointi).

  • Tietosuojavastaava neuvoo pseudonymisoinnin ja anonymisoinnin osalta. Tietosuojavastaava myös päivittää ohjetta aineiston suojaamisesta. Tutustu ohjeeseen.
  • Tietohallinto auttaa pseudonymisoinnissa ja anonymisoinnissa sovittujen resurssien puitteissa. Anonymisointi ja pseudonymisointi voivat joissain tapauksissa olla vaativia käsittelytoimia, joiden tarvitsemat resurssit tulisi tunnistaa jo hankkeen toteutusta suunniteltaessa. Tietohallinto konsultoi tällaisten tapausten suunnittelussa, yhteys IT-palvelujen kautta.
  • Mikäli aineisto on kerätty erikoismittalaitteilla jossakin Haaga-Helian labissa, voit tutkimusta tekevä olla yhteydessä lab manageriin.

Henkilötietojen käsittelyn mallipohjat ja dokumentit

Haaga-Helian mallipohja tutkittavien informointiin ohjaa hanketoimijaa henkilötietojen käsittelyperusteen valinnassa. Mallipohja sisältää myös tietosuojaselosteen mallipohjan, jota on käytettävä, jos tutkimuksessa käsitellään henkilötietoja. Sen lisäksi täytetään lomake henkilötietojen määräaikaisesta käytöstä, joka toimitetaan tietosuojavastaavalle.

Jos hankkeessa muodostetaan hankekumppaneiden kesken yhteisrekisteri, on tehtävä sopimus yhteisrekisterinpitäjyydestä. Jos hankkeessa henkilötietojen käsittelyyn käytetään kolmansia osapuolia, jotka käsittelevät henkilötietoja rekisterinpitäjän lukuun, on heidän kansaan lisäksi tehtävä henkilötietojen käsittelysopimus.

Tietosuojavastaava tarjoaa apua henkilötietojen käsittelyyn, rekisterinpitäjyyteen ja vaikutustenarviointiin liittyvissä kysymyksissä.

Käsittelyssä tarvittavien ohjelmistojen hankinta ja hyödyntäminen sekä aineiston käsittely

Aineiston analysointi vaatii sopivat ohjelmistot. Useimmin käytettäviin ohjelmistoihin on lisenssejä valmiina, mutta joskus on tarpeen hankkia uusi lisenssi.

  • IT-helpdesk neuvoo ohjelmistojen käyttölisenssien hankinnassa

  • Uuden sovelluksen tai laitteiston hankinnassa hyödynnetään Haaga-Helian IT-hankintojen toimintamallia

  • Haaga-Helian yhteisten työkalujen käyttöön liittyvissä teknisissä kysymyksissä ja ongelmissa tukee IT-palvelut, varsinaista käytön tukea saa erikseen nimetyiltä kyseisen työkalun vastuuhenkilöiltä

Jos aineistoa käsittelee joku muu kuin tutkimusta tekevät, on käsittelystä tehtävä tietojenkäsittelysopimus. Käsittelytoimien alihankintaan on käytettävissä valmis sopimusmalli, jota muokataan eri tapauksiin sopivaksi juristin kanssa.

 

Aineiston laadunvarmistus ja mahdollinen eheyttäminen

Tutkimusaineistojen koostamisessa täytyy usein siirtää aineistoja eri ympäristöjen välillä ja yhdistää eri lähteistä saatavia aineistoja. Siirtojen jälkeen tulee varmistaa aineiston eheys. Kaikkien aineistojen kohdalla tulee käydä läpi mahdolliset puuttuvat arvot ja suunnitella niiden asianmukainen käsittely. Eri aineistoja yhdistettäessä pitää varautua toimenpiteisiin, joilla yhdenmukaistetaan erilaiset koodaustavat, tiedostomuodot tai muut teknologiaeroista johtuvat poikkeavuudet.

Aineiston eheyttäminen voi olla joskus resursseja vaativaa. IT-palvelut konsultoi teknisissä kysymyksissä.

Tutkimusdatan elinkaareen kuuluu monia vaiheita: aineistonkeruun suunnittelu, aineistonkeruun ja analyysin aktiivivaihe, arkistointi, tuhoaminen tai avaaminen ja jatkokäyttöön saattaminen elinkaaren lopussa.

Sopivan infrastruktuurin valintaan kullekin elinkaaren vaiheelle vaikuttaa monta seikkaa: aineiston suojattavuus, tekniset ja juridiset reunaehdot, yhteistyötarpeet ja käyttäjähallinta, sekä näiden ratkaisujen kustannukset. Nämä tekijät voivat tuottaa keskenään ristiriitaisia vaatimuksia, mutta hyvällä suunnittelulla tilanne voidaan hallita.

Tutkimusdatan talletuspaikka määritellään aineistonhallintasuunnitelmassa.Tallennuspaikan valintaan vaikuttavat ainakin seuraavat seikat:  

  • Aineiston tietosisältö (sisältääkö data suojattavaa tai muuten pääsyrajoitettua aineistoa). Raakadata ja siitä prosessoidu data voidaan tallentaa eri paikkoihin.  
  • Tutkimusryhmän yhteistyötarpeet (onko ulkopuolisia kumppaneita, joiden täytyy päästä käsiksi alkuperäiseen tai muokattuun dataan)  
  • Rahoittajien tai mahdollisten muiden osapuolten vaatimukset esim. tietoturvasta ja aineiston julkisuudesta 

Tallennuspaikan suunnittelussa huomioi, että

  • Tutkimusdataa ei tallenneta tutkijan/käyttäjän henkilökohtaiseen verkkolevyn kotihakemistoon, vaan käytetään Haaga-Helian ohjeistamia tallennuspaikkoja.
  • Aineistoja ei tallenneta kuluttajapalveluihin (esim. Dropbox) edes tilapäistä tarvetta varten. Henkilökohtaisia pilviresursseja ei saa käyttää (esim. Google Drive).  
  • Suojattavaa aineistoa ei tule tallentaa ulkoisille tallennusvälineille (muistitikut, ulkoiset kiintolevyt yms.).  
  • Aineistoja ei luovuteta tai lähetetä ilman sen omistajan lupaa. Luovutukset dokumentoidaan.

Suojattavia tietoja sisältävälle aineistolle turvallisin tallennus- ja käsittelypaikka on Haaga-Helian oman tallennusjärjestelmän hanketta varten perustettu levyjako/kansio (esim. henkilöstön tiedostopalvelimella tai erillisellä tki-palvelimella).

Jos tutkimusryhmässä on Haaga-Helian ulkopuolisia jäseniä, joiden pitää päästä dataan käsiksi, voidaan aineiston tallennuksessa käyttää pilvipalveluita, kuten esim. Microsoft Teams tai Sharepoint, Haaga-Helian oman tallennusjärjestelmän sijaan.

Tarvittaessa aineiston tallennuksessa voi käyttää myös CSC:n aineistohallintapalveluita (esim. IDA).   

Aineiston tallennukseen liittyviin kysymyksiin saat apua TKI-palveluista ja teknisiin kysymyksiin IT-palveluista. 

(Tulossa:tallennuspaikat eri tilanteissa taulukkomuodossa)

Tutkimusaineiston sisällönkuvailu voidaan jakaa

  • tutkimuksen aikaiseen aineiston sisällönkuvailuun ja
  • tutkimuksen valmistumisen jälkeiseen julkaisuvaiheen aineiston sisällönkuvailuun.

Metadata mahdollistaa sekä ihmisille että koneille tutkimusdatan ymmärtämisen, löydettävyyden, hallinnon ja käytön. Organisaatiotasolla metatiedot ja kuvailutiedot ovat tärkeitä, jotta tiedettäisiin mitä tutkimusdatoja Haaga-Helialla on ja miten niitä voidaan käyttää. Aineiston kuvailun puuttuminen voi aiheuttaa huonoimmassa tapauksessa sen, että edes tutkija itse ei enää pysty vaikkapa tutkimuksessa olleen tauon jälkeen käyttämään aineistoaan. Metadatan tuottamista onkin kuvattu palveluksi tulevaisuuden käyttäjille – myös tutkijalle itselleen.

Tutkimuksen aikana kuvataan esimerkiksi tiedostojen nimeämisen käytäntö, kansiorakenne, muuttujat ja niiden koodaukset, ja muut tutkimuksen teon kannalta olennaiset tiedot. Näin ollen metadatan tuottaminen ja tutkimuksen dokumentointi jatkuu koko aineistonhallinnan ja TKI-projektin elinkaaren ajan.

Hyvää nimeämiskäytäntöä käytetään johdonmukaisesti, se on lyhyt ja koostuu merkityksellisestä tiedosta, välttää erikoismerkkejä, hyödyntää versiointia, noudattaa päivämääräformaattia, välttää isojen ja pienten kirjainten käyttöä merkitysten välittämiseksi. Kansioiden nimeämisessä pätevät samat hyvät käytännöt, kuin tiedostojenkin nimeämisessä.

Kansiorakenteen suunnittelussa kannattaa välttää liian syvälle meneviä hierarkioita ja liian täyteen tiedostoja pakattuja kansioita, sillä nämä vaikeuttavat halutun tiedon löytämistä. Epäselvien luokittelujen käyttö ja tiedostojen kopioiminen tai säilyttämien useassa kansiossa johtaa helposti versionhallinnan ongelmiin. Tiedostojen ja kansioiden nimeäminen tukee myös tiedoston haettavuutta kansiorakenteessa.

Muuttujien ja niiden koodaamisen kuvaaminen tarkoittaa käytännössä esimerkiksi listaa muuttujista, niiden datatyypeistä ja sallituista arvoista. Muuttujien koodaamisen kuvaaminen tarkoittaa lyhyesti sallittujen arvojen selitettä. Esimerkiksi Tietoarkistossa on julkaistu tutkimusaineistoja, jotka havainnollistavat hyvin muuttujien ja niiden koodaamisen kuvaamista, sekä sitä, miksi ne ovat olennaisia aineiston ymmärtämisen kannalta (Tietoarkisto: Kansalaispulssi 16/2021).

Muut tutkimuksen kannalta olennaiset tiedot kuvataan esimerkiksi Readme-tiedostossa, joka sisältää perustiedot projektista, aineistokokonaisuuksista ja niiden rakenteesta, käytetyistä menetelmistä (ml. ohjelmistot, koodi) ja olennaisista tiedostoista.

Tutkimuksen päätyttyä tuotetaan kuvaus aineistosta, tekijöistä, sijainnista, jatkokäyttöoikeuksista ja muista aineiston hallinnoimiselle, käytettävyydelle ja löytymiselle tärkeista tiedoista.

Kaikki Haaga-Helian hankkeissa kertyneet tutkimusdatat kuvaillaan Qvaimeen.

Kirjasto tukee Qvaimen käytössä ja silloin kun data tai kuvailutiedot julkaistaan avoimelle julkaisualustalle (esim. IDA, Zenodo tms.)

Hankkeen päättäminen

Hankkeen päättämisvaiheessa aineistosta on huolehdittava aineistonhallintasuunnitelman mukaisesti. Keskeisiä toimia ovat mm.

  • kertyneen aineiston kartoittaminen
  • toimeksiantajan tai rahoittajan vaatimusten sekä tutkimustiedotteessa mainittujen toimenpiteiden loppunsaattaminen
  • aineiston arkistointi, pitkäaikaistallennus, avaaminen tai poistaminen
  • aineiston jatkokäytön mahdollistaminen
  • aineiston metadatan luominen ja julkaiseminen (Qvain)

Hankkeen päättämisvaiheen vastuita:

  • Projektipäällikkö ja hankkeen toimijat vastaavat siitä, että aineistot viedään nimettyihin paikkoihin tutkimuksen aikana ja tutkimuksen jälkeen aineistohallintasuunnitelman, rahoittajan vaatimusten ja Haaga-Helian omien linjausten mukaisesti. Toimeksiannoissa noudatetaan toimeksiantajan kanssa sovittua käytäntöä.
  • IT-palvelut vastaa siitä, että hankkeilla on pitkäaikaiseen tallennukseen soveltuva tallennuspaikka aineistolle.
  • Kirjasto tukee aineistoa kuvailevien tietojen (Qvain) julkaisemisessa sekä aineiston julkaisemisessa silloin, kun aineisto halutaan viedä yleiselle, avoimelle julkaisualustalle.
  • IT-palvelut neuvoo datan perusteellisessa, palauttamattomassa tuhoamisessa. Projektipäällikkö vastaa siitä, että aineisto, joka on sovittu tuhottavaksi, tuhotaan palauttamattomasti.
  • Tutkimusaluejohtaja päättää pitkäaikaissäilytetyn tutkimusaineiston arvonmäärityksestä ja jatkosäilytys-/poistopäätöksestä sen jälkeen, kun säilytyksen ensimmäinen määräaika on umpeutunut.

Lähtökohtaisesti Haaga-Helian tarjoamat aineiston tallennusratkaisut toimivat tallennuspaikkana myös TKI-hankkeen päätyttyä hankekohtaisesti määritellyn säilytysajan. Vertaisarvioidun julkaisun raakadata on säilytettävä 5 vuotta. Tarpeen mukaan voi myös hyödyntää CSC:n tarjoamia keskipitkän tallentamisen (IDA) tai pitkäaikaistallentamisen (PAS) ratkaisuja.

Kun Haaga-Helia ei toimi henkilötietoa sisältävän aineiston rekisterinpitäjänä, tai kun käsitellään muuta suojattavaa aineistoa, on tarpeen poistaa aineisto Haaga-Helian tallennusratkaisuista heti sen käytön päätyttyä. Tällöin projektipäällikön tai datasta vastaavan tutkijan vastuulla on huolehtia datan asianmukaisesta poistamisesta.

Joissain tapauksissa voidaan säilyttää esim. anonymisoitu tai pseudonymisoitu versio alkuperäisestä aineistosta.

Aineiston pitkäaikaissäilytykseen ja poistamiseen liittyviin kysymyksiin saat apua Tutkimus- ja tietopalveluista ja teknisiin kysymyksiin IT-palveluista.

Tutkimusaineiston avaamisella ja julkaisemisella tarkoitetaan aineiston tai sen osan avaamista julkisesti saatavilla olevaksi ja käytettäväksi tiettyjen käyttöehtojen mukaisesti.

Tutkimusaineiston avaaminen perustuu ajatukseen, että tutkimusaineisto itsessään nähdään arvokkaana tutkimustuotoksena, joka meritoi tutkijaa ja viitattavana julkaistu aineisto lisää tutkijan vaikuttavuutta. Tutkimusaineiston julkaisu kertoo luottamuksesta tehdyn tutkimuksen laatuun ja tukee tutkimuksen läpinäkyvyyttä.

Aineiston julkaiseminen Haaga-Heliassa edellyttää, että julkaiseminen on otettu huomioon jo hanketta ja aineistonkeruuta suunniteltaessa niin aineiston sisällön, tarvittavien resurssien kuin aineistoon liittyvien oikeuksienkin näkökulmasta. Päätökset aineistojen avaamisesta Haaga-Heliassa tehdään perustuen avaamisen suunnitelmallisuuteen, aineiston merkittävyyteen ja laatuun, ja aineiston kaikinpuolin asianmukaiseen käsittelyyn.

Julkaisupaikkoina Haaga-Heliassa suositellaan lähtökohtaisesti CSC:n tarjoamia Fairdata-palveluita tai tutkimushankkeessa sovittuja ja rahoittajan hyväksymiä datan julkaisemisen palveluita. Myös kustantajilla saattaa olla yhä useammin vaatimuksia julkaisuun liittyvän aineiston säilyttämisestä ja avoimuudesta.

Huomionarvioista on, että FAIR-periaatteet eivät vaadi aineistojen avoimuutta, vaan sitä, että aineistoon pääsy on hallittu ja kuvattu sekä ihmisille että koneille ymmärrettävässä muodossa. Fairdata-palvelut tukevat myös erilaisten pääsyrajoitusten asettamista julkaistuille aineistoille (embargo, kirjautuminen fairdata-palveluihin, rajoitettu pääsy organisaation oman lupaprosessin kautta).

Vaikka aineistoja ei pystyisi perustellusta syystä avaamaan, kaikista TKI-hankkeiden tutkimusaineistoista julkaistaan kuvailutiedot Qvain-työkalulla.

 

Aineiston lisensointi

Creative Commons -lisensseillä (CC-lisenssi) voit määritellä, miten avoimesti verkkoon tuotettua aineistoa voidaan käyttää. CC-lisenssi kertoo siis aineiston käyttöehdot. CC-lisenssin avulla teoksen tekijä säilyttää tekijänoikeutensa ja määrittelee tavat, millä muut saavat kopioida, levittää ja käyttää kyseistä teosta.

Käytettävästä lisenssistä tulee sopia muiden hankekumppaneiden kanssa sekä varmistaa, onko rahoittajalla vaatimuksia lisenssin suhteen. Lisäksi mikäli aineistoon sisältyy muualta hankittuja osia, esimerkiksi kuvia, tulee huolehtia, että näiden CC lisenssi tai käyttöehdot ovat yhteensopivat aineistolle valittavan CC lisenssin kanssa.

Haaga-Helia suosittelee, että aina kun mahdollista käytettäisiin vähintään CC BY-SA -lisenssiä. Tutustu lisenssiin ja sen tarjoamiin vaihtoehtoihin.

Julkisin varoin tuotettujen ja avattujen tutkimusaineistojen uudelleenkäyttöä säädellään myös lailla (Laki julkisin varoin tuotettujen tutkimusaineistojen uudelleenkäytöstä 713/2021)

Kirjasto tukee aineiston ja sitä kuvailevien tietojen (metadatan) julkaisemisessa silloin, kun aineisto halutaan viedä yleiselle, avoimelle julkaisualustalle.

Kaikki Haaga-Helian hankkeissa kertyneet tutkimusaineistot kuvaillaan Qvaimeen.

  • Kuvailutietojen tallentamisesta vastaa projektipäällikkö tai tutkimusdatasta vastaava tutkija.
  • Tukea aineistojen kuvailuun antaa kirjasto.

Tutkimusaineistojen kuvailu on keskeinen tekijä pyrittäessä toteuttamaan FAIR-periaatteita, jotka ohjaavat tutkimusaineistojen hallintaa Haaga-Heliassa.

FAIR-periaatteet tukevat aineiston löydettävyyttä (Findable), saatavuutta (Accessible), yhteentoimivuutta (Interoperable) ja uudelleenkäytettävyyttä (Re-Usable). FAIR-periaatteet tukevat siis paitsi aineistojen löydettävyyttä, myös erilaisten digitaalisten objektien yhdistämistä toisiinsa ja niiden hallinnan ja käytön automatisointia, eikä FAIR-periaatteita ole mahdollista toteuttaa ilman metadataa.

Huomionarvioista on, että FAIR-periaatteet eivät vaadi aineistojen avoimuutta, vaan sitä, että aineistoon pääsy on hallittu ja kuvattu sekä ihmisille että koneille ymmärrettävässä muodossa.

Metatieto voi olla aineiston löydettävyyttä tukevaa, kuvailevaa, hallinnollista ja rakenteellista metatietoa, joka voidaan käytännössä aina avata julkisesti saataville. Metatieto voi kuitenkin olla myös käyttörajattua, esimerkiksi aineiston käsittelyyn käytetyt mallit tai koodi.

Metatietoa tuotetaan siis monella eri tasolla ja monesta eri näkökulmasta: hanke (hankkeen tavoiteet, tarkoitus, mitä tutkittiin), aineistokokonaisuudet (mitä eri aineistokokonaisuudet sisältää, miten ne kerättiin, käsiteltiin, analysoitiin), tiedostot (mitä tiedosto sisältää tai miten se rakentuu), muuttujat (muuttujien ja arvojen selitteet), käytetyt menetelmät ja ohjelmistot (esim. koodia kommentoitu riittävästi, ohjelmiston tai laitteen asetukset), hallinta (aineiston tekijyys, omistajuus, käyttöoikeudet ja -rajaukset).

On suositeltavaa noudattaa oman tutkimusalan käytäntöjä ja mahdollisia metadatastandardeja aineiston kuvailussa ja metatietojen tuottamisessa.

 

Saavutettavuusseloste / Accessibility Statement