mandag 18. november 2013

Del 2 i serien "Hvordan bli en informasjonsstyrt bedrift"

Mønstergjenkjenning – en hjørnestein i informasjonsstyrte bedrifter

Av professor Ole-Christoffer Granmo

Dette er del 2 av en miniserie. Se del 1 her.

Viktige forretningshendelser – kanskje et forestående tap av en verdifull kunde – kan ofte oppdages i forkant av hendelsen. Men da må man kjenne til tegnene som varsler om hendelsen. Det kan være så enkelt som å følge med på kundedata og oppdage en fallende trend.

Mønstergjenkjenning er en teknikk som kan brukes til å lete gjennom store mengder data etter bestemte mønstre – regelmessigheter i dataene som er forårsaket av bakenforliggende hendelser. For en virksomhet kan mønstre av interesse være kjennetegnene på de gode markedsføringstiltakene, de verdifulle kundene som går tapt,  salgsmuligheter eller flaskehalser i en forretningsprosess. Gjennom å oppdage slike hendelser, før de finner sted, kan man forbedre markedsføringen, forsterke kundeforbindelsene, øke salget og redusere flaskehalsene som begrenser bedriften. Det dreier seg om prediktiv analyse.

I Conduct tar vi utgangspunkt i en beste praksis arkitektur for mønstergjenkjenning når vi jobber for å gi bedrifter et fortrinn gjennom bruk av datamining og prediktiv analyse.


Følgende byggesteiner er typiske:
      Dataseleksjon valg og sammenstilling av informasjonselementer.
      Preprosessering – utfylling av manglende verdier, glatting av støyfulle data, identifikasjon og håndtering av ekstremverdier og feilaktige verdier, håndtering av inkonsistens, semantikk.
      Transformering – egenskapsuttrekking, normalisering, utledning og avledning av nye variable.
      Analyse – gjenkjenning av scenarier, avviksdeteksjon, aggregere og gi statistiske mål, tidsserieanalyse, forløpsanalyse, etc.
      Rapportering – tabeller, figurer, kart, etc.

Som indikert medfører hver byggestein en rekke valg – hvilken kombinasjon av teknikker er for eksempel best egnet  for gjenkjenning av mulig kundefrafall? Fornuftige valg her er avgjørende både med tanke på analysenøyaktighet og skalerbarhet.

I systemarkitekturen skissert over ser vi et mønstergjenkjenningssystem for analyse av logger. Ved hjelp av et scenariobibliotek, samt innsamlet loggstatistikk og modeller, kjenner systemet igjen scenariene i biblioteket etter hvert som de forekommer i loggene. Her er det også mulig å utvide med avviksdeteksjon hvor man detekterer avvik fra normal adferd, i tillegg til selve scenariene. Nye typer avvik kan da danne grunnlag for utvidelse av scenariobiblioteket.

Det er også viktig å velge en egnet infrastruktur for implementasjon av mønstergjenkjennings­systemet. Vi har positiv erfaring med Open Source-teknologi for Big Data Analytics, både når det gjelder skalerbarhet og når det gjelder fleksibilitet. Vi vil i den sammenheng trekke frem noen egenskaper vi ser på som viktige:

·         Skalerbarhet – lagring, søk, og analyse av vilkårlig store datamengder gjennom såkalt ”Auto-Sharding” og ”MapReduce”.
·         Verktøykasse – systemet bygges opp gjennom utvikling av en kraftig og gjenbrukbare verktøykasse med moduler for lagring, søk, analyse og rapportering.
·         Gjennomsiktighet – fullt innsyn og påvirkningsmulighet i alle stadiene av analysen sikrer kvalitet og pålitelighet.

En egnet datavarehusløsning med Big Data Analytics-utvidelser vil kunne realisere disse egenskapene.

Conduct jobber for å realisere verdien som ligger i åpne og innovative IT-løsninger. Vi har omfattende kompetanse innen analyse av data, både strukturerte data i overkommelige mengder og Big Data. Conduct har medarbeidere med doktorgrad i prediktiv analyse og datamining med ekspertise innenfor analyse og prediksjon, overvåkning og styring, optimering og ressursallokering, data- og tekstmining, visualisering, simulering og beslutningsstøtte, samt smarte applikasjoner. La oss hjelpe deg å utnytte dine data for å optimere driften av din virksomhet.
Ingen kommentarer:

Legg inn en kommentar