Doe maar normaal(vorm)
Sinds mijn eerste kennismaking met het toetsenbord heb ik een uitgesproken passie voor informatie. Informatie heeft iets mystieks. Informatie is het medium waarmee wij met elkaar communiceren als substituut van de natuurlijke taal, gebaren en symbolen. Business Intelligence is voor mij de ultieme zoektocht naar de ´Holy Grail´ van informatie. Een wereld waarin de scheidslijn tussen techniek en functionaliteit flinterdun is en waar informatie weer subjectief en persoonlijk is, en zelfs als een beleving kan worden ervaren.
Ik kan uren turen naar een datamodel, terwijl ik nadenk over de informatiebehoefte van een gebruiker. Een klein foutje in het datamodel kan namelijk grote gevolgen hebben. De context waarbinnen informatie wordt gebruikt, moet kraakhelder zijn: zowel voor de ontwikkelaar als de gebruiker. Ik verbaas me dan ook als ik presentaties zie waar het ‘geklikker-de-klik’ me letterlijk om de oren vliegt. Steeds vaker stel ik me de vraag: “Hoe is het toch mogelijk dat iemand met een enkele muisklik ook de contextuele gevolgen van die ene klik kan bevatten?” Laat staat als die ook nog eens verborgen zitten in een bij-elkaar-geklikte XML SOA kubus. De mogelijkheden die de ETL-DWH-BI-EAI tools tegenwoordig bieden, zijn werkelijk legio. Tegelijk doet het aanschouwen van de mate waarin de verschraling binnen ‘mijn’ vakgebied plaatsvindt, me ontzettend veel pijn. Waar is de informaticus gebleven met passie voor zijn vak?
In de wereld van het modelleren van operationele systemen zijn we de draad al aan het kwijtraken. Tanja beschrijft dit in haar artikel “De zin en onzin van metadata” op haar manier. Zij roept de ICT’er op de taal van de gebruiker te spreken. Ik wil dit aanscherpen: laat de ICT’er eerst het vak leren. Als men zich al niet eens meer bezig houdt met de semantiek van informatie, waar gaat het dan heen?
In de wereld van Business Intelligence zijn we losgeslagen van de aarde. Het lijkt wel of Business Intelligence de ‘safe haven’ is geworden voor mensen die geen zin meer hebben in het modelleren van data. Zelfs al zouden ze willen modelleren, dan nog wordt ze dit ontnomen door de tools. We worden lui gemaakt, vergeten te modelleren om vervolgens oeverloos te discussiëren over het platslaan van data omwille van een KPI? Dit alles wordt dan ook nog eens versterkt door het gemak waarmee Jan en alleman alles, maar dan ook alles, aan elkaar kan breien wat los en vast zit.
Het mooie van een datawarehouse is dat je juist géén rekening hoeft te houden met processen, infrastructuur, ERP systemen en al het soort vraagstukken die je in de transactionele wereld wel hebt. Eindelijk een omgeving waarbinnen je de data mag, nee moet, modelleren zoals het hoort. Het datawarehouse moet een hemel op aarde zijn voor iedere informaticus in plaats van een vuilnisbelt van ´platgeslagen operationele data´. Wellicht begrijpelijk dat ik voorstander ben van een “Corporate Information Model’. Hoewel ik liever spreek over het ‘Correcte Informatie Model’.
In tegenstelling tot wat veel BI experts doen geloven, ben ik dan ook van mening dat het datawarehouse in de meest haalbare normaalvorm moet worden gemodelleerd die er bestaat. Als het kan in de 4e. Waarom niet? Performance is de enige reden die men kan verzinnen. Zoals Rick van Lans in 2000 al in zijn artikel “De fabel van het sterschema” aangeeft, het is onzin alles zomaar plat te slaan. Daarnaast vind ik het een soort heiligschennis. Je mag toch niet het meest expliciete geweten van de organisatie beperkingen opleggen omwille van techniek? Maar helaas, er is nog geen tool die automatisch voor je normaliseert. Tot die tijd is het nog steeds vakmanschap.
Maar hoe zit het dan met performance, vraagt u zich af? Daar wil ik best over praten, maar dan wel met een correct datamodel als uitgangspunt.
Om dit schrijven kracht bij te zetten is het volgende voorbeeld uitgewerkt.
Meer informatie over het genormaliseerde DWH is te vinden in Emiel zijn presentatie: “OBIEE the rising sun”.