SEMANTTINEN WEB
Heikki Siljamäki, 20.2.2010, 13:17Semanttinen web: verkon seuraava vaihe kehittyy lupaavasti
Kuten nimi vihjaa, semanttisessa webissä on kysymys merkityksistä.
Webin seuraava aste ja netin tuleva pöhinämoottori kehittyy Suomessa lupaavasti.
”Suomi on semanttisessa webissä eturintamassa, osittain senkin takia, että pienessä maassa on helppoa kerätä yhteen kaikki keskeiset tahot – luoda kansallinen laboratorio”, kuvailee Aalto-yliopiston ja Helsingin yliopiston yhteisen semanttisen laskennan yksikön SeCon vetäjä, professori Eero Hyvönen (kuvassa).

SeCo on ollut vetovastuussa jo useamman vuoden kestäneessä, pääosin Tekesin rahoittamassa FinnOnto-tutkimusprojektissa, joka on osallistuvien organisaatioiden määrällä laskettuna Tekesin historian laajin hanke. Mukana on 38 kumppania.
Vuonna 2003 alkaneessa FinnOntossa on luotu semanttisen webin kansallinen infrastruktuuri, jonka ytimessä ovat yleinen suomalainen ontologia Yso, siihen sillatut muut ontologiat ja sanastot sekä näitä käyttäjille tarjoileva Onki-ontologiapalvelu.
Viimeisen parin vuoden aikana painopisteenä on ollut tämän infrastruktuurin hyödyntäminen web 2.0:n toiminnallisuuksia sisältävissä yhteisöllisissä palveluissa, joista ensimmäiset ovat jo käytössä.
Esimerkiksi Terveyden ja hyvinvoinnin laitoksen (THL) vetämänä kehitetty TerveSuomi-portaali yhdistelee eri viranomaisten tuottamaa terveysaineistoa älykkäällä tavalla ja tarjoaa sen käyttäjille samasta paikasta. Kulttuurisampo puolestaan sisältää kulttuurikohteita museoista, kirjastoista ja arkistoista semanttisessa verkossa.
Web vahvistuu metatiedoilla
Tällä hetkellä vaikkapa hakukone ei osaa välttämättä sanoa, viittaako ”nokia.jpg”-niminen tiedosto kaupunkiin vai kännykkään, mutta semanttisen webin työkalujen – kuten eri tietoresursseja kuvaavan metatiedon sekä käsitteiden välisiä suhteita määrittelevien ontologioiden – ansiosta kone voikin päätellä, kummasta kuvassa on kysymys. Ja toisaalta hakiessamme kuvia älypuhelimista, osaa semanttinen web tuoda esiin älypuhelin.jpg:n lisäksi vaikkapa iphone.jpg-tiedoston.
Semantiikalla palautteet hallintaan
Sonecta on yksi semanttisen webin teknologioita yrityssovellusten kehittämisessä hyödyntävistä suomalaisyhtiöistä. Tamperelaisyhtiössä on parhaillaan tekeillä semanttinen tietokanta yritysten käyttöön esimerkiksi palautteenhallinnassa.
”Tavoitteena on se, että tietokanta osaa antaa järkevän vastauksen luonnollisella kielellä esitettyyn kysymykseen. Sen sijaan että pitäisi selata pitkiä dokumenttilistoja, pitäisi tietokannan tuottaa raporttipaketti, joka näyttää ihmisen kokoamalta”, kuvailee toimitusjohtaja Samuli Zetterberg.
”Haluamme tehdä ohjelmistojen käyttämisestä yksinkertaisempaa ja ihmiskeskeisempää.”
Sonectan ajattelussa palautteenhallinta ymmärretään laajasti asiakastyytyväisyyden hallinnan lisäksi esimerkiksi työhyvinvoinnin tai strategian jalkauttamisen seuraamisen työvälineeksi. Yhtiö on kehittänyt myös web-pohjaisen kyselytyökalun, jonka kautta kerättävät tiedot integroituvat semanttiseen tietokantaan.
”Kun tiedon arkistointi tehdään tehokkaalla tavalla, saadaan ajan saatossa kerätystä tiedosta enemmän irti”, hän huomauttaa.
Palautteenhallinnan rinnalla Sonectassa on mietty muitakin sovellusalueita. Semanttiselle tietokanta-alustalle voisi löytyä käyttöä myös esimerkiksi hankintojen valmistelussa ja osaamisen johtamisessa, Zetterberg uskoo.
Erään määritelmän mukaan kyseessä onkin nykyisen webin laajennus, jossa informaatiolle annetaan hyvin määritelty merkitys, minkä ansiosta tietokoneiden ja ihmisten yhteistyö parantuu.
Ja kun koneet alkavat ymmärtää merkkijonojen merkityksiä – tai ainakin niiden välisiä yhteyksiä – voidaan samaa dataa käyttää helpommin yli sovellus- ja organisaatiorajojen.
Tämä näkyy hyvin vaikkapa TerveSuomi-portaalissa, johon yhdistetään eri terveysviranomaisten, kuten THL:n ja UKK-instituutin, tuottamia aineistoja eri aihepiireistä älykkäällä tavalla. Kun koneet osaavat hakea älykkäästi samasta aihepiiristä tuotettua materiaalia, vältytään sisällöntuotannossa päällekkäiseltä työltä, ja portaalin käyttäjälle tiedot löytyvät helpommin.
Toimivuutta semantiikalla
Julkishallinnon it-järjestelmät ovat olleet viime vuosina kovan kritiikin kohteina, ja sekä valtioneuvoston että eduskunnan puolella asetettiinkin viime vuonna vaatimus, että tietojärjestelmien yhteentoimivuutta on parannettava.
Osana tätä yhteentoimivuustyötä valtiovarainministeriössä katsotaan parhaillaan semanttisen webin tarjoamien työkalujen suuntaan.
”Tavoitteena on viedä tietoyhteiskuntaa infrastruktuurin tasolta kohti tiedon tasoa”, kuvailee erityisasiantuntija Olli-Pekka Rissanen.
”Tällöin kyseeseen tulevat semanttinen web ja ontologiat.”
Tietoarkkitehtuureihin liittyvää työtä tehdään varsin kiireisellä aikataululla, sillä yhteentoimivuuden suuntaviivoista on tarkoitus saada laki voimaan vielä tämän vaalikauden aikana. Työ linkittyy myös Sähköisen asioinnin ja demokratian Sade-ohjelmaan, jonka piirissä kehitetään sähköisiä palvelukokonaisuuksia esimerkiksi pientyönantajille.
Kunnat mukaan
Rissanen heittää esimerkkinä aloittelevan yrittäjän tilanteen: yrityksen perustamisen yhteydessä pitää olla yhteydessä useampaan viranomaiseen ja täyttelemään lomakkeita monessa paikassa.
Yhteentoimivuutta kehittämällä yrityksen perustamiseen liittyvää paperisotaa voidaan helpottaa. Ohjatussa kokonaisuudessa eri viranomaisten kanssa asioitaessa ei olisi pakko esimerkiksi kerta toisensa jälkeen täyttää yrityksen perustietoja.
”Kun puhutaan palvelukokonaisuuksien kehittämisestä, niin aina palataan yhteentoimivuuteen ja perustietovarantoihin”, Rissanen kuvaa.
Valtiovarainministeriön johdossa valmisteltavat yhteentoimivuuslinjaukset koskettanevat myös kuntia. Julkisen sektorin ontologioissa ja tietoarkkitehtuureissa ei voi olla kilpailua, vaan yksien arkkitehtuurien on katettava koko kenttä valtion keskushallinnosta kuntatasolle.
”Eduskunnan toive on tässä suhteessa täysin selvä: on tarkasteleva koko julkisen sektorin tietojärjestelmien yhteentoimivuutta”, Rissanen sanoo.
Kohti ubiikkipalveluita
Myös FinnOnto-hankkeelle on haettu jatkorahoitusta, ja uudessa Semanttisen jokapaikan palvelut -hankkeessa kehitetään muun muassa semanttista webiä hyödyntäviä kulttuuri- ja terveyspalveluita mobiilialueelle.
”Tavoitteena on saada Kulttuurisammon ja TerveSuomen palveluita mukautumaan sekä käyttäjän profiilin ja sosiaalisen kontekstin että käyttöpaikan ja -ajan mukaan”, kuvailee Eero Hyvönen.
Myös suomalaisen ontologiainfrastruktuurin kehittämistä jatketaan esimerkiksi luonnontieteen puolella.
Hyvösen mukaan FinnOnto-infra tarjoaa kiinnostuneille organisaatioille myös lähtökohdan omien täydentävien ontologioiden – vaikkapa omia tuotteita kuvailevien merkitysjärjestelmien – tekemiseen. Tähän mennessä FinnOnton piirissä on tehty yrityssovelluksia esimerkiksi Rautaruukille ja Wärtsilälle.
Semanttisen webin hanke on herättänyt kiinnostusta muuallakin ja esimerkiksi Suomenlahden eteläpuolella on käynnistynyt hieman vastaavanlainen EstOnto-hanke.
Tiedon uudet kokonaisuudet

Lähde: SeCo / Eero Hyvönen
Kaavio antaa makua siitä, kuinka semanttisen webin teknologioiden avulla on mahdollista yhdistää eri lähteistä tulevaa tietoa uudenlaisiksi kokonaisuuksiksi.
Esimerkkikaaviossa lähtökohtana voi pitää taiteilija Akseli Gallen-Kallelan maalaamaa muotokuvaa marsalkka Gustav Mannerheimista, josta on perustiedot museon tietokannassa (punaiset kentät).
Biografiakeskuksesta ja kirjastoista puolestaan löytyy henkilöhistorioihin liittyvää aineistoa (siniset kentät) ja Maanmittauslaitokselta paikkatietoa (vihreät kentät).
FinnOnto-hankkeessa on puolestaan kehitetty ylätason käsitteiden suhteita kuvaavia ontologioita (pinkit kentät).
Käyttämällä rdf-standardia (resource description framework) eri aineistojen sisällön kuvaukseen, voidaan kaikkien datalähteiden aineistot yhdistää semanttisesti yhdeksi kokonaisuudeksi.
Tällaisesta linkitettyjen, avoimien aineistojen yhdistelemisestä semanttisesti käytetään myös nimitystä web of data.
Jos kuva on Nokian kaupungista ja kuvassa näkyy Nokian puhelin ja vaikka Nokian Renkaat autossa, taitaa kellä tahansa jäädä sormi sinne suuhun.
Ainakin Gallen-Kallela esimerkki muistutti Wikipedian artikkelia, jossa kaikki (ko. "tyngän") sanat 'olla' sanaa lukuunottamatta ovat potentiaalisia linkkejä.
Pelkästään sanoja poimimalla ei kyllä päästä pitkälle. Mutta ilmeisesti tämä ei olekaan tarkoitettu etenemismalli.
Olen itse kaipaillut käännöskonetta, jossa sanastoon olisi liitetty minimissään se aihepiiri, jossa ko. sana useimmiten tai ainoastaan esiintyy. Ja sitten useampivaiheista käännöstä, jossa artikkeli- tms. kokonaisuus (jälleen minimissään) "fiksuin" tilastollisin keinoin yritetään tunnistaa johonkin aihepiiriin kuuluvaksi ja kääntää sitten sitä vastaan. Toisaalta, eipä se apu ole kovin suuri, kun ihmisille on kohtuullisen helppo hullunkurisestakin raakakäännöksestä assosioida, mitä serveerattu teksti itse asiassa tarkoittaa. Ihmisen on helppo tunnistaa 'toukokuun päivä' Mayday vaikkapa politiikan kiemuroista ulospääsyä koskevassa artikkelissa 'sos'-viestiksi kalenterin sijaan. Kummatkin voivat esiintyä samassa artikkelissa ja jopa sanaleikkinä.
Gallen-Kallela esimerkissä tuli jo parin tason jälkeen 'ihminen'-pallura. Joten matkaa siis on edelleen.
KOULUTUS
Tiina Siltala, 28.8.2010 15:15It-johtaminen on Suomessa lapsenkengissä
Tietohallintojohtamisen koulutus vahvistuu Suomessa tänä syksynä. »
KOULUTUS
Virpi Tynkkynen, 29.8.2010 12:12Ict-työläinen ei ole koskaan valmis
TTL:n mentorointiohjelmassa sekä aktori että mentori oppivat uutta. »
KOULUTUS
Aleksi Kolehmainen, 4.7.2010 17:12Tietoturva, olalle vie!
David Perry haluaa valistaa käyttäjiä armeijan mallilla – vähän kerrallaan mutta joka päivä. »
KULTTUURI
Jonna Vuokola, 3.7.2010 19:15Epäsovinnainen taide sopii yritysjohtajalle
Tiedon toimitusjohtajan Hannu Syrjälän mielestä kulttuuri on hyvä keino laajentaa näkökulmaa. »
VIESTINVÄLITYS
Annika Korpimies, 11.7.2010 15:19Aika jättää kirjepostista
Kun sähköposti jyrää kirjepostin, Itellan on pakko kehittää uusia tapoja tienata. »
KULTTUURI
Jonna Vuokola, 4.7.2010 12:04Kolme kysymystä elämästä – vastaajana Tiedon toimitusjohtaja
IHMISET
Tiina Siltala, 1.7.2010 20:15Mato Valtonen meni sekaisin netistä
Entinen wap-yrittäjä unelmoi kirjojen kirjoittamisesta ja ansaitsee elantonsa puhumalla. »
SOSIAALINEN MEDIA
Kari Ahokas, 22.3.2010 20:40Johtajien tietämättömyys jarruttaa yhteisömedian yrityskäyttöä
SEMANTTINEN WEB
Heikki Siljamäki, 20.2.2010 13:17Semanttinen web: verkon seuraava vaihe kehittyy lupaavasti
TERVEYS-IT
Johanna Puustinen, 13.2.2010 13:10Terveydenhuollon tietojärjestelmät ovat kroonisia potilaita
STARTUPIT
Anna Ruohonen, 6.2.2010 13:30Taantuma on oiva hetki perustaa yritys
Oletko harkinnut omat tivi-yrityksen perustamista? Taantuma on otollinen aika ryhtyä toimeen. »
Aiemmin verkkopalvelussa
MAAILMANMARKKINAT
Tiina Siltala, 19.10.2009 9:16Suomi-it kiinnostaa Kiinassa
Maailman nopeimmin kasvavasta maasta alkaa virrata investointeja Suomeenkin. »
Aiemmin verkkopalvelussa
UBIIKKI
Jonna Vuokola, 3.10.2009 11:07Ubiikkiyhteiskunta hiipii huomaamatta
Aiemmin verkkopalvelussa
MIKROBLOGIT
Jouni Junkkaala, 27.4.2009 8:05Viestinnän viimeisin vallankumous
Aiemmin verkkopalvelussa
WLAN
Juho Pentikäinen, 21.3.2009 13:35Näin nousee wlan
Verkkoinfra pitää suunnitella ennalta – ainakin suojellussa Finlandia-talossa. »

