SEMANTTINEN VERKKO
Ilari Sani, 14.5.2009, 11:30Google tietää kohta, että autossa on moottori
Google ottaa harppauksen kohti niin sanottua semanttista hakua. Hakujätti ei enää vain etsi sanoja tekstimassasta, vaan yrittää ymmärtää sivuilta löytyvää tietoa. Yhtiö julkisti tällä viikolla joukon uusia semanttisia toimintoja, ja loppukuusta seuraa kokonaan uudenlainen hakukone.
Ensimmäiseksi Google alkaa näyttää hakutuloksissa tekstinäytteiden lisäksi hyödyllistä lisätietoa. Esimerkiksi ravintolaa koskevassa hakutuloksessa voidaan suoraan näyttää ravintolan saamat arvostelut, hintaluokka ja sijainti.

Yksinkertaista semanttista tietoa hakutuloksessa: Google osaa laskea keskiarvon ravintolan saamista arvosteluista.
Toinen uutuus on, että englanninkielisen haun käyttäjät voivat lajitella tuloksia sivun tyypin ja päiväyksen perusteella. Googlesta on jo aiemmin löytynyt uutishaku, ja nyt voi hakea myös arvosteluja tai foorumikirjoituksia. Lisää erilaisia sivukategorioita on luvassa myöhemmin.
Google Squared niputtaa tiedot taulukoksi
Loppukuusta julkaistava Google Squared on täysin uudenlainen hakukone, joka etsii ja yhdistää tosiasioita ja näyttää ne tietokantamaisena taulukkona.
Googlen edustaja esittelee videolla TechCrunch-blogille, kuinka Google Squared löytää vaikkapa vuoristoratojen korkeudet.
Käyttäjä voi hakea Google Squaredilla esimerkiksi autoja. Ruudulle aukeaa taulukko jossa jokaisella rivillä on yksi automalli, ja sarakkeissa valmistaja, moottori, kulutus ja niin edelleen.
Google Squaredin näyttämät tiedot voivat tulla eri lähteistä – haku yhdistää parhaat palat eri sivuilta. Käyttäjä voi lisätä taulukkoon omia sarakkeita kuten "ohjattavuus", ja haku täyttää sen verkosta löytyvillä tiedoilla.
Google Squared on selvästi vastaus viime aikoina kohutulle Wolfram Alpha -hakukoneelle, joka sekin hakee tilastoja ja tosiasioita. Palveluiden merkittävin ero on, että Alphaan on syötetty joukko luotettuja tietokantoja, kun taas Google luottaa omaan tapaansa julkisen webin louhimiseen.
Kehittäjä, auta Googlea ymmärtämään sivujasti
Ihmisten kirjoittaman tekstin tulkitseminen ei ole tietokoneelle helppo tehtävä, vaikka Google onkin tehnyt tätä esimerkiksi etsiessään Maps-palveluuun katuosoitteita. Yhtiö pyytää nyt kehittäjiä merkitsemään sivuilleen tietoja tavalla, jota myös kone kykenee lukemaan.
Kehittäjä voi merkitä, mikä osa sivusta on esimerkiksi julkaisupäivä, hintatieto tai arvostelu. Googlen ymmärtämiä merkintätapoja ovat RDFa-standardi ja mikroformaatit, joissa molemmissa HTML-tageihin merkitään lisätietoa sisällön merkityksestä.

Esimerkki yhteystietojen merkitsemisestä hCard-mikroformaatilla. Kirjoittajan koko nimi ja työnantaja on merkitty tavalla, jota Google osaa suoraan tulkita.
RDFa ja mikroformaatit ovat esiintyneet verkossa joitakin vuosia. Niiden käyttö on kuitenkin ollut vähäistä, koska harva palvelu on hyödyntänyt niitä. Googlen siunauksen ansiosta semanttisten merkintöjen odotetaan yleistyvän ripeästi.

