TALLENNUS
Michael Friedenberg, 27.1.2012, 13:33Big data raivaa tietä Hadoopille
Maailmassa päivittäin kertyvä datamäärä räjähtää tunnetusti käsiin niin, ettei big dataa pystytä enää käsittelemään tavanomaisin konevoimin saati hyödyntämään järkevällä tavalla.
Arvioiden mukaan viime vuonna maailmassa tuotettiin dataa 1,8 zettatavun verran. Yksi zettatavu - kymmenjärjestelmässä 10 potenssiin 21 - on miljardi teratavua. Sitä paitsi tuotettu tieto on uutta, sillä 90 prosenttia siitä on kertynyt kahden viimeksi kuluneen vuoden aikana, Cio.com kirjoittaa.
Suurin osa datamäärän kasvusta johtuu järjestämättömän datan huikeasta lisääntymisestä.
Ohjelmistotalo Autonomyn toimitusjohtaja Mike Lynch arvioi jo viime vuoden HP Discover-konferenssissa, että it-maailma siirtyy poispäin konevoimin helposti käsiteltävästä järjestetystä datasta kohti järjestämättömän datan ulapoita.
Järjestämätöntä dataa pidetään ihmisläheisempänä tietona siksi, että se kertyy henkilöiden välisestä vuorovaikutuksesta esimerkiksi sosiaalisen median, sähköpostien, videoiden, audioiden ja kuvien kautta.
Isot it-yritykset näkevät big datassa valtavat markkinat. Esimerkiksi Hewlett-Packard osti elokuussa Ison-Britannian toiseksi suurimman ohjelmistoyhtiön, erittäin hyvin kannattavan Autonomyn reilulla seitsemällä miljardilla eurolla.
HP:n nykyjohto on sanonut, että se antaa tuoreen tiikerinpentunsa Autonomyn etsiä omillaan paikkansa markkinoilla.
Kaikki tykkäävät Apache Hadoopista
Edellä kuvaillut skenaariot raivaavat avoimen koodin Apache Hadoopille tietä menestykseen. Nopeilla laskutoimituksilla Cio.com listaa, että ainakin EMC, Microsoft, IBM, Oracle, Informatica, HP, Dell ja Cloudera ovat hiljan hypänneet Apachen Hadoop-kelkkaan.
Esimerkiksi Microsoft on päättänyt luopua omasta Dryad-nimisestä big data -projektistaan ja aikoo panostaa jatkossa avoimeen lähdekoodiin perustuvaan Hadoopiin.
Näiden lisäksi Amazon, Yahoo, comScore ja AOL käyttävät Hadoopia hyödyksi liiketoimissaan, koska avoimen koodin sovelluskehys pudottaa rajusti verkkoyhtiöiden tallennuskustannuksia.
Infineta Systemsin tuoreiden arvioiden mukaan tavanomaisen datan tallenuskustannukset ovat viisi dollaria gigatavua kohti. Saman datamäärän tallennus Hadoopissa maksaa vain neljännesdollarin gigalta.
Cio.com arveleekin, että useimmat toimitusjohtajat tajuavat tällaisia hintavertailuja erinomaisen hyvin.
Tutkimustalo Forrester puolestaan povasi viime lokakuussa, että tietovarastoteknologiaa rakentavat jätit ostavat jo kesään mennessä nykyään kuumimmat Hadoop-untuvikot pois markkinoilta. Ostajia ovat Teradata, Oracle, SAP ja HP.
Korvamerkittäviä kohteita ovat muiden muassa Cloudera, MapR Technologies, DataStrax, HStreaming ja Outerthought.
Käännös: Markku Pervilä
TYÖELÄMÄ
Ken Moore, 18.5.2012 9:30It-ansioluettelo pitää tehdä it-kielellä
Ansioluettelo on kuin käyntikortti tai kirjallinen tapa esittäytyä uudelle henkilölle. »
IT-ULKOISTUKSET
Aleksi Kolehmainen, 15.5.2012 12:18Tieto sai 35 miljoonan euron it-ulkoistuksen Suomesta
TIETOTURVA
Annika Korpimies, 4.5.2012 12:07Verkkorikollisuus ei ole iso uhka, uskovat suomalaisjohtajat
JÄRJESTELMÄUUDISTUKSET
Aleksi Kolehmainen, 8.5.2012 12:58Helsingin SAP-ongelmat johtuvat rajapinnoista
KOKONAISARKKITEHTUURI
Kari Ahokas, 6.5.2012 7:05Kokonaisarkkitehtuuri tulee julkishallintoon - "termi on kieltämättä hyydyttävä"