fredag 12. april 2013

Big Data er ….?

Ja, hva er egentlig Big Data? Big Data er i vinden. «Alle» snakker om Big Data. Men hva Big Data er, strides de lærde om.

En litt morsom kommentar fra Mark Marsden, en anerkjent internasjonal spesialist innen IT, på TDWIs BI Symposium i London i mars i år: «Big Data is like teenager sex: It’s exciting, everybody talks about it, but really «doing» it is rare. And even when practiced, it’s done in a very clumsy way!» La meg forsøke å forklare hva Big Data kan være.

Big Data er en ny metode for å utnytte komplekse data
Å utnytte data som støtter moderne virksomheters komplekse behov er utfordrende. Det opprinnelige konseptet datavarehus, der man lagrer og gjør spørring på strukturerte data, er i endring, i takt med økte mengder og økt kompleksitet i de dataene vi ønsker å omdanne til informasjon og kunnskap.

 

Økte mengder og økt kompleksitet drives ikke bare av data lagt inn av brukere i applikasjoner, men data generert av maskiner. Webanalyse, log-baserte data og sensornettverk er eksempler på maskingenererte data som brukes i moderne virksomheter.

Mange av disse dataene er tilgjengelige via API-er og/eller lagres i ikke-relasjonelle databaser fordi de ikke passer i tradisjonelle modeller, da volumet og variasjonen i dataene er for høyt.

Disse endringene skaper behov for nye verktøy og teknikker for å samle inn og behandle disse dataene. Dette krever nye lagringsmodeller, nye integrasjonsmodeller, ulike metoder og tilnærminger for å spore og administrere data. I hovedsak en total gjennomtenkning av datainfrastrukturen for å støtte virksomhetenes behov, fra tradisjonelt lagrede data til sanntids data i bevegelse.

Big Data handler om å utnytte store, komplekse datamengder på en rimeligere måte.
Å utnytte virkelig store datamengder på tradisjonelt vis er meget kostbart. Både mhp HW og lisenser.

Med Big Data er det kommet nye måter å utnytte standard HW på, og Open Source SW har helt andre prismekanismer enn tradisjonell SW.

Å utnytte store, komplekse datamengder er vår kompetanse.
Pentaho er en av teknologileverandørene som tidlig interesserte seg for Big Data. Derfor tilbyr Pentaho løsninger for å eksekvere i Hadoop (Pentaho MapReduce), samt innebygd støtte for Big Data kilder inkludert Hadoop, NoSQL og analytiske databaser.


Conduct har omfattende kompetanse innen analyse av Big Data. La oss hjelpe deg å utnytte Big Data for å optimere driften av din virksomhet.

Ingen kommentarer:

Legg inn en kommentar