Kanta-Häme

Tiedon kalleus voi haitata tutkimusta

 
Ruutu, jonka sivu on 250 metriä pitkä, on perusyksikkö geoinformatiikan tutkijalle. Monet hänen tarvitsemansa tiedot ovat saatavissa tämänkokoisille karttaruuduille jaoteltuina. 
 
Tutkija voi tarkastella esimerkiksi sitä, paljonko ja minkä ikäistä väestöä ruudun kokoisella alueella asuu, moniko heistä käy töissä, millä alalla ja missä, minkä kokoisia ja tyyppisiä taloja alueelta löytyy ja minkä verran asuntokunnilla on käytettävissään rahatuloja.
 
Aivan yksityiskohtaisia tietoja tutkija ei käyttöönsä saa. Muuttujasta riippuen tieto voidaan salata, jos karttaruutuun osuu esimerkiksi vain muutama henkilö tai tulonsaaja. Siitä huolimatta paikkatiedon avulla on mahdollista löytää varsin tarkkoja alueellisia eroja.
 
Yksi ongelma tässä kuitenkin piilee: yhdyskuntarakennetta koskeva tieto on kallista.
 
– Data on avointa, jos sinulla on paksu lompakko, tiivistää Oulun yliopiston maantieteen yksikön johtaja, geoinformatiikan professori Jarmo Rusanen
 
Hän on tuskaillut tiedon kalleuden kanssa työssään jo pitkään. Hänen mukaansa se vaikeuttaa tutkimuksen tekemistä ja asettaa yliopistot keskenään eriarvoiseen asemaan.
 
Ihmisen toimintaa koskevan tiedon keskeinen tuottaja on Tilastokeskus. Se tuottaa karttaruuduttaista tilastotietoa yhdyskuntarakenteen seurantajärjestelmästä (YKR). Kysymys on väestöä, ikärakennetta, työpaikkoja ja rakennuksia koskevasta monipuolisesta tiedosta.
 
Kun Oulun yliopiston maantieteen laitos hankki hiljattain YKR-aineiston käyttöönsä seuraaviksi kolmeksi vuodeksi, tietojen hinnaksi tuli 27 000 euroa lisättynä 24 prosentin arvonlisäverolla, yhteensä siis yli 33 000 euroa. Rusasen mukaan rahat saatiin kerättyä ”kissojen ja koirien kanssa” viiden eri projektin rahoituksesta.
 
– Ne olisi mielellään laitettu tutkimuksiin ja tutkijoiden palkkoihin.
 
Maantieteen opetusta järjestävistä neljästä yliopistosta tietojen yhteishankintaan osallistui Oulun lisäksi vain Itä-Suomen yliopisto. Helsinki ja Turku eivät pystyneet lähtemään mukaan.
Rusasen mielestä tilanne on epäreilu.
 
– Me kaksi, joilla on varaa hankkia aineisto, olemme ikään kuin monopoliasemassa. Pitäisi olla niin, että tieto olisi kaikkien käytettävissä ja sitten me tutkijat kisailisimme siitä, mitä pystymme tekemään sillä.
 
Rusasen kysymys kuuluu: onko järkevää, että julkisin varoin ylläpidetty laitos perii toiselta julkisin varoin ylläpidetyltä laitokselta hintaa, joka vaikeuttaa jälkimmäisen toimintaa?
 
Tilastokeskuksen tilastotuotannon ylijohtaja Timo Koskimäki ei lähde arvioimaan kuvion järkevyyttä.
 
– Se ei ole asia, joka on minun kommentoitavissani. Valtion maksuperusteasetus ja sen takana oleva lainsäädäntö sanovat, että näin se menee.
 
Tilastokeskus ei peri hintaa tiedosta sinänsä vaan sen muokkaamiseen tarvittavasta työstä. Lain mukaan hinnan on katettava tiedon räätälöinnistä syntyvät kustannukset. Voittoa Tilastokeskus ei Koskimäen mukaan ota.
 
YKR-aineiston toimituksista asiakkaille vastaa Tilastokeskuksen sijaan Suomen ympäristökeskus, mutta sen hinnoittelu perustuu tismalleen samaan maksuperustejärjestelmään.
 
Maantieteen laitoksen maksamaa noin 30 000:ta euroa Koskimäki luonnehtii tämäntyyppisen aineiston kohdalla tavanomaiseksi kustannukseksi.
 
– Joskus tieto saattaa tulla vielä selvästi kalliimmaksi – riippuu ihan siitä, kuinka paljon aineiston yhdistelyä ja muuta työtä meillä joudutaan tekemään. 
 
– Meidän kannaltammehan kysymys ei nimittäin koskaan ole valmiista paketista, vaan siihen on tehty erittelyt ja valittu muuttujat.
 
Erilaista ympäristöön liittyvää tietoa on nykyisin kohtuullisen hyvin vapaasti saatavilla. Myös Tilastokeskus on viime vuosina vapauttanut tietoa valtiovarainministeriöltä tähän tarkoitukseen saamansa rahoituksen turvin. Sen mahdollisesta jatkumisesta ei kuitenkaan ole tietoa.
 
Ihmisen toimintaa koskevan tiedon vapauttamiseen liittyy vielä yksi lisämutka: tietosuojakysymykset. 
 
Ihmistietoa ei Koskimäen mukaan voida jakaa avoimena datana niin kuin esimerkiksi ympäristötietoa. Tilastokeskus ei voi antaa tietoja jollekin taholle alusta alkaen käsiteltäviksi, vaan sen on itse muokattava ne tietosuojasäädösten edellyttämään muotoon.
 
– Ihmisten ja yritysten toimintaan liittyvässä tiedossa täytyy aina olla lupamenettely ja jokin viranomaistoimija mukana. Käytännössä siitä aiheutuu aina jonkinlaisia kustannuksia.
 
Jarmo Rusanen sanoo, ettei hän odota tietojen muuttuvan ilmaisiksi.
 
– Mutta mikä on oikeus ja kohtuus? Jos niihin menee tohtorikoulutettavan vuosipalkka, vähän ihmeelliseltä se tuntuu.
 
Rusasen mukaan suomalainen tietojärjestelmä on tarkka ja laadukas. Kansainvälisesti on erittäin harvinaista, että tutkijoilla on käytettävissään tietoa 250 metrin ruutukoolla.
 
Hänen mielestään erinomaisesta tietojärjestelmästä ei kuitenkaan oteta kaikkea irti, vaan eletään niin sanotun keskiarvoharhan varassa. 
 
Esimerkiksi kunnan päätöksenteossa saatetaan piirtää ympyrä koulua kuvaavan keskipisteen ympärille ja olettaa, että sillä alueella on 5 000 lasta tasaisesti sijoittuneina ja samanlaisten tieverkkojen päässä. 
 
Paikkatiedon avulla saataisiin kuitenkin esille alueiden sisäinen vaihtelu.
 
– Minusta yhteiskunta on tässä suurin kärsijä. Se kerää tietoja 20–30 rekisterilähteestä, mutta minkä takia päätöksenteko ei perustu parhaaseen mahdolliseen tietoon?