2/07

  • pääsivu
  • sisällys
  • Risto Nieminen on akatemiaprofessori TKK:ssa.
     
     

    Kolumni
    Risto Nieminen

    Tiede 2.0

    Informaatioteknologia, Internet erityisesti, on dramaattisesti muuttanut tieteentekemisen muotoja. Vaikka sähköposti on ollut käytössämme vain parikymmentä vuotta ja Web viisitoista, on täysin mahdotonta kuvitella vakavaa tietotyön tekemistä ilman niitä.

    Legendaarinen matemaatikko Paul Erdös vitsaili, että matemaatikko on kone, joka muuttaa kahvin teoreemoiksi. Tätä yleistäen tutkija on kone, joka muuttaa dataa ymmärrykseksi. Internetin ansiosta tutkijan käytettävissä oleva datan määrä kasvaa räjähdysmäisesti kaikilla tieteenaloilla. Verkossa on satoja gigatavuja biologien geenisekvenssejä, teratavuja tähtitieteen kuva-arkistoja, on-line-sensorien tuottamaa mittaustietoa ilmakehän tilasta, lingvistien kielikorpuksia ja paljon, paljon muuta. Julkaisutoiminta on nopeasti siirtynyt verkkoon, josta löytyy myös suunnaton määrä datasta jalostettua (tai vähemmän jalostettua) tietoa, Wikipedioista tieteentekijöiden blogikokoelmiin. Tehokkaat hakukoneet selaavat miljardeja verkkosivuja ja indeksoivat niiden sisältöä. Grid-teknologiaksi kutsutut ohjelmistot ja käyttöliittymät mahdollistavat verkon palvelujen entistäkin saumattomamman saatavuuden. Käynnissä on murros, jonka seurauksia emme vielä pysty näkemään mutta jonka tarjoamat mahdollisuudet ja haasteet tutkimustyölle ja tutkijakoulutukselle on syytä tunnistaa.

    Termillä “Web 2.0” on ryhdytty kuvaamaan teknologioita, sovelluksia ja liiketoimintamalleja, jotka ovat tehneet mahdolliseksi sellaiset Internetin menestystarinat kuin Google, Amazon, Skype, eBay, YouTube ja iTunes. “Tiede 2.0” sopii yleisnimeksi niille uusille tavoille tehdä tutkimusta, jotka hyödyntävät Internetiä, sen datavarantoja ja palveluita, virtuaalisista observatorioista proteiinitietokantoihin.

    Tiede 2.0 on neljäs paradigma tutkimustyön historiassa. Parituhatta vuotta sitten tiede perustui luonnosta tehtyihin havaintoihin. Muutama sata vuotta sitten mukaan tulivat ensin systemaattiset kokeet ja sitten teoriat, jotka mahdollistivat tulosten systematisoinnin ja ennusteet. Laskennallinen tiede ja tutkimus, kolmas paradigma, on vakiinnuttanut asemansa viime vuosikymmeninä. Se mahdollistaa monimutkaisten järjestelmien, kuten maapallon ilmaston, numeerisen simuloinnin. Neljäs paradigma on tutkimusmatkailu verkon välityksellä datan valtameressä. Dataa tuotetaan havainnoimalla, mittaamalla ja simuloimalla. Paradigma Tiede 2.0 siis yhdistää kolme muuta. Siitä käytetään myös muodikasta englanninkielistä nimeä eScience.

    Internetin antamat mahdollisuudet tuntuvat jo nyt huikeilta, kun se antaa sormenpäihimme globaalin kirjaston. Ihminen on kuitenkin auttamattoman hidas Webin selailussa. Tarvitaan nopeita tietokoneohjelmia, jotka pystyvät yhdistämään dataa monista lähteistä ja tunnistamaan yhteyksiä, jotka ihmiseltä jäisivät huomaamatta. Jo toteutuneita sovelluksia ovat metabolisten polkujen päättely geeni- ja proteiinitietokantojen avulla sekä kääpiötähtien tunnistaminen digitaalisista taivaankartoituksista.

    Tiede 2.0 tarvitsee uusia datan keräämisen ja automaattisen analyysin välineitä sekä ennakkoluulotonta koulutusta niiden käyttöön kaikilla tieteenaloilla. Kysymys on uudenlaisesta infrastruktuurista, jonka rakentamiseen, ylläpitoon ja luotettavuuteen on meidän kaikkien annettava panoksemme.

    Risto Nieminen