Ein erfreuliches neues Jahr

02. Januar 2012

Zum Jahresstart geben Ihnen gleich etwas mit – unser brandneues BI-Infoblatt.

Hintergrund dieses Infoblattes ist die Korrektur unserer fehlerhaften Einschätzung, wie viel BI-Wissen in den Köpfen bereits vorhanden ist. Wir vermuteten, dass Business Intelligence bereits etabliert ist und somit große Erklärungen hinsichtlich Nutzen und Potenzial überflüssig seien – aber diverse Gespräche in den letzen Monaten haben uns eines Besseren belehrt.

Gerne nehmen wir Ihr Feeback – oder weitere unbeantwortete Fragen entgegen.

Einen guten Start ins neue Jahr wünscht

Torsten Katthöfer

SQL Server 2012 – Erster Release Candidate veröffentlicht

22. November 2011

Am letzten Wochenende hat Microsoft still und heimlich den ersten Release Candidate (RC0) des SQL Server 2012 veröffentlicht.

Was ist aber ein “Release Candidate” (RC)? Im Unterschied zu den bisher veröffentlichen “Community Technologies Previews” (CTP) besitzt ein Release Canidate den vollen Funktionsumfang der späteren finalen Version, d.h. alle Funktionen, die der neue SQL Server 2012 hat, sind auch in dem nun veröffentlichten RC0 enthalten.

Für die finale Version gibt es weiterhin keinen offiziellen Termin, aber höchstwahrscheinlich wird die neue Version im Frühsommer 2012 veröffentlicht.

Detailierte Informationen zur Veröffentlichung des RC0 finden Sie hier, den Download finden Sie hier.

Mit vorweihnachtlichen Grüßen, Patrick Rühmkorb

Columnstore Index – ein Renner

09. November 2011

Unsere Experimente mit dem SQL Server 2012 (Denali) lassen uns zunehmend frohlocken: Tests mit dem neuen ColumnstoreIndex prognostizieren einen ganz erheblichen Performanceboost. In einer Tabelle mit ca. 3 Millionen Datensätzen, 4 verschieden Datentypen und unterschiedlichen Anzahlen von Ausprägungen haben wir jeweils pro Ausprägungen die Anzahl der Zeilen gezählt.

Die Ergebnisse lassen sich wie folgt zusammenfassen:

  1. Die Abfragen sind deutlich schneller. Bei 3 Ausprägungen in 3 Mill. Sätzen ergab sich Faktor 25-30 (280ms zu 10ms). Im Vergleich: Ein normaler Index brachte immerhin noch einen Faktor um zwei – was aber hier kein repräsentativer Vergleich ist.
  2. Je weniger Ausprägungen, desto größer der Performancegewinn. Bei kanpp 100.000 Ausprägungen  in 3 Mill. Sätzen gab es immerhin noch ein Faktor 1,3.
  3. Alle Datentypen (varchar, nvarchar, int, datetime) wiesen vergleichbare Werte auf.

Das Geheimnis der Geschwindigkeit ist an sich trivial: Statt wie sonst üblich die Attribute einer Zeile zusammen abzulegen, werden beim Columnstore Index die Attribute der Spalten zusammen abgelegt, was die Plattenzufgriffe erheblich reduzieren kann. Zusätzlich werden die Attribute komprimiert – und diese Komprimierung gewinnt an Effizienz, je weniger distinkte Attribute komprimiert werden müssen.

Es gibt natürlich auch ein Wehrmutstropfen. Eigentlich gibt es zwei:

  1. Tabellen, auf denen ein Columnstore-Index liegt, können nicht direkt manipuliert werden (Also kein Insert, Update, …). Das führt dazu, dass die beladenden ETL-Strecken komplexer werden, weil hier entweder die Indizes jeweils neu erstellt werden müssen oder – wenn es schnell gehen soll – ein Verfahren mit zwei Tabellen und nachgelagerter Zusammenführung etabliert werden muss.
  2.  Den Columnstore-Index wird es nur mit der Enterprise-Edition geben – nicht mit der neuen BI-Edition.

Ich freue mich schon auf das Lächeln in den Gesichtern der IT-Leiter…

Herzlichst, Torsten Katthöfer

 

SQL Server Codename Denali – Evolution oder Revolution?

06. Oktober 2011

Experten vermuten, dass in den nächsten 10 Jahren die Menge der gespeicherten Daten um mehr als das 40-fache steigen wird. Diese Datenexplosion erfordert es, dass Software zur Verwaltung dieser Daten diesen dadurch entstehenden höheren Ansprüchen gerecht wird. Einen Schritt in diese Richtung möchte Microsoft mit der neuen Version des SQL Servers, bisheriger Codename Denali gehen.

Wir haben uns schon einmal die Vorabversion angeschaut und möchten kurz auf ein paar Neuerungen eingehen:

Ein wichtiger Punkt bei der Entwicklung von Denali spielte die Verfügbarkeit des Servers und damit der Datenbanken. Mit der neuen Version ist es dank der AlwaysOn-Funktion möglich, das Ausfallrisiko zu vermindern, so dass (wie der Name schon vermuten lässt) die Server immer erreichbar sein sollen. Zudem werden die „Columnstore Indexes“ eingeführt, die die Abfragegeschwindigkeit bei großen Tabellen um den Faktor 10 erhöhen. Vorbei werden also die Zeiten sein, als man eine Abfrage gestartet hat und dann erst einmal in Ruhe ein Kaffee trinken konnte.

Neben diesen und weiteren kleinen Änderungen bzgl. der Datenbankverwaltung sind aber die Entwicklungen bei den Integration und Analysis Services viel bedeutender.

Ein häufig genannter Kritikpunkt an Business Intelligence-Lösungen ist die Datenqualität. Schaut man sich eine größere Kundendatenbank von irgendeinem Unternehmen genauer an, so wird man mit großer Sicherheit fehlerhafte Daten finden, sei es ein falsch geschriebener Name, eine fehlerhafte Postleitzahl , ein Wert, der in einer falschen Spalte steht oder ein mehrfach vorhandener Kunde. Solche schmutzigen Daten können zu fehlerhaften Analysen führen und von daher rückt die Frage der Datenqualität immer stärker in den Fokus. Um diesem Problem zu begegnen verfügt Denali über die Data Quality Services, mit deren Hilfe die Daten z.B. beim Laden in das Data Warehouse einfach und effizient gereinigt werden können.

Noch gravierender aber sind die Änderungen bei den Analysis Services. Hierbei wird ein erster Schritt weg vom dem multidimensionalen hin zu einem relationalen Modell gegangen, das ganze unter dem Stichwort „Business Intelligence Semantic Model“ (BISM). Zudem ist es dadurch möglich, das ganze Datenmodell in den Speicher zu laden. Doch was heißt das für den Benutzer? Äußerliche Unterschiede werden für ihn nicht wirklich ersichtlich, aber wenn er erst einmal eine vertraute Abfrage startet oder einen Report anfordert und er das Ergebnis bekommt, ehe er vielleicht seinen ersten Schluck vom Kaffee genommen hat offenbaren sich die Unterschiede und Vorteile dieser neuen Technik. Gerade unter Berücksichtigung der steigenden Datenmengen zeigt sich der Vorteil dieser neuen Entwicklung, wodurch auch in Zukunft effiziente Abfragen und Analysen ermöglicht werden.

Lange Rede, kurzer Sinn: Mit dem neuen SQL Server bringt Microsoft eine Software auf dem Markt, welche den neuen Anforderungen, die die Datenexplosion mit sich bringt, gerecht wird. Was die allgemeine Datenbankverwaltung betrifft ist Denali eher eine Evolution, aber für den Bereich Datenanalyse kann Denali als Revolution betrachtet werden.

Bleibt zum Schluss noch die Frage: Wann kommt er denn, der neue SQL Server? Die einzig exakte Antwort, die man auf diese Frage geben kann, lautet: „Wenn er fertig ist!“ Einen genauen Termin gibt es noch nicht, aber man darf davon ausgehen, dass er spätestens im Frühjahr 2012 offiziell erscheint.

Wir sind auf jeden Fall gespannt.

Patrick Rühmkorb

SQL Server 2008 R2 auf Windows Server 2008 langsam

01. September 2011

Langfristige Analysen, viel erwärmte Gehirnmasse und verschiedenste Versuche konnten nicht erklären, warum der SQL Server 2008 R2 (SP2) auf einer 48-Prozessormaschiene mit 128 GB Ram auf einem schnellen SAN unglaublich langsam reagierte.

Dies äußerte sich vor allem dadurch, dass dieselbe (triviale) Abfrage beim zweiten Ausführen deutlich langsamer (und insgesamt erheblich zu langsam) zurückkam als beim ersten Mal – also genau entgegen der Erwartungshaltung. Weder DiskIO noch CPU brachten Hinweise auf das Bottleneck. Also liegt die Vermutung nah, dass das Problem entweder auf Hardware oder Bertriebssystem zu suchen war…

Die Lösung (Dank an Michael Sperling, Point-Kollege) war: Service Pack 1 für Windows 2008. Nach dem Upgrade war wieder die volle (und in Anbetracht der Power dieses Hobels erwartete) Performance zu spüren.

Herzlichst, Torsten Katthöfer

Titanic-Effekt

19. Mai 2011

Vor einigen Tagen ist unsere für diese Saison frisch ins Wasser gebrachte uralte Holz-H-Jolle im Wedeler Yachthafen gesunken. Obwohl – für Holzboote in den ersten Tagen bis Wochen üblich – ein wenig Wasser ins Boot eindrang, kam der Untergang für mich sehr überrraschend, denn zum einen war die Menge des eindringenden Wassers sehr überschaubar, und zum anderen stand direkt neben dem “Leck” eine Tauchpumpe mit Schwimmschalter, welche mit 7000 Litern pro Stunde das Boot hätte leerpumpen können.

Nun ist mir im Nachhinein klargeworden (das Boot ist mittlerweile wieder auf dem Wasser), was passiert ist: Der Boden der Jolle hat Abteile (nach oben offene Schots – wie bei der Titanic). In einem der Abteile, in dem auch die Tauchpumpe steht, dringt Wasser ein. Der Wasserstand in dem Abteil reicht noch nicht, um den Schwimmschalter der Pumpe zu betätigen. Was passiert? Das Wasser läuft von einem Abteil ins nächste. Das wäre erstmal kein Problem, denn irgendwann würde ja die Tauchpumpe anspringen und das Wasserniveau auf einen mittleren Wert halten.

Die zwei Faktoren, die ich nicht bedacht hatte, sind zum einen die unterschiedlichen Auftriebskräfte vorne und hinten (Das Boot ist hinten deutlich breiter als vorne) und zum anderen die generelle Gewichtsverteilung im Boot (Das Boot ist durch den Mast vorne deutlich schwerer als hinten.

Was also passiert? Der Wasserstand in dem Abteil mit dem Leck steigt, irgendwann läuft das Wasser in die anderen Abteile weiter vorne und weiter hinten. Da  das Boot aber vorne weniger Auftriebskraft hat als hinten, kippt das Boot (erst einmal mininal) nach vorne. Das wiederum führt dazu, dass nachlaufendes Wasser tendenziell immer mehr nach vorne läuft, was das Boot noch mehr kippt. Der Wasserstand in dem Abteil, wo die Tauchpumpe steht (ziemlich in der Mitte), bleibt dabei niedrig, da das Wasser ja nach vorne abläuft.

Und so kippt das Boot immer weiter nach vorne weg und läuft dann schließlich über das Deck von vorne voll Wasser, wobei die Tauchpumpe dann letztendlich gewissenhaft versucht, die Elbe in die Elbe zu pumpen.

Jetzt fragen Sie sich, warum ich diese traurige Geschichte hier erzähle? Diese Geschichte macht deutlich, wie entscheidend selbst kleine Informationen sind – in diesem Fall ist es das Verhältnis der Auftriebskräfte vorne zu hinten. Das Nichtwissen bezüglich dieser Kennzahl fungiert hier als entscheidender Hebel, der letztendlich zum Untergang geführt hat.

In der realen Welt gibt es ebensolche Hebel auch, zum Beispiel unter exakt diesem Namen im Optionsscheinhandel. Um solche real existierende Hebel erkennen zu können, ist eine konsequente Beobachtung der Ereignisse notwendig – was auf Unternehmensicht bezogen nur über eine strategische Business Intelligence Lösung funktionieren kann.

Sollten Sie Fragen zum Thema BI oder Anregungen hinsichtlich leckender Schwertkästen auf Holz-H-Jollen haben, sprechen Sie mich gerne an.

Herzlichst, Torsten Katthöfer

Holzfäller

20. Januar 2011

Was hat ein Holzfäller mit BI zu tun? Erstmal relativ wenig. Dennoch ist mir vor kurzem eine interessante Allegorie zu Ohren gekommen, die es auf den Punkt bringt.

Ein Wanderer trifft im tiefen Wald auf einen Holzfäller, der fleißig und mit aller Kraft im Angesicht seines Schweißes einen Baumstamm zersägt. Er hat schon viele kleine Teile abgetrennt, aber es ist auch für den Laien erkennbar, dass die Säge schon bessere Zeiten erlebt hat – sie ist stumpf. Dem Wandersmann ist es ein Greul, eine solche Ineffizienz zu beobachten und bietet unaufgefordert seine fundierte Beratungsleistung an.  “Sagen Sie mal, werter Herr, würden Sie nicht viel schneller sägen können, und somit viel eher nach Hause gehen können, viel mehr Ertrag oder viel mehr Zeit für andere wichtige Dinge haben, wenn Sie ihre Säge schärfen würden?”

Darauf der pragmatische Holzfäller: “Keine Zeit, ich muss sägen”.

Die Moral der Geschichte liegt auf der Hand.

Torsten Katthöfer

P.S.: Wir bieten unsere Beratungsleistungen nur nach Aufforderung an…

Competetive Advantage

14. Januar 2011

Just hatte ich ein Gespräch mit einem Mitarbeiter der Gartner Group. Es war in vielerlei Hinsicht sehr interessant, insbesondere ein Gesprächspunkt bezüglich unserer “Competetive Advantage”. Ich übersetze das jetzt frech einmal als “Alleinstellungsmerkmal”, obwohl das nicht ganz korrekt ist (Siehe http://en.wikipedia.org/wiki/Competitive_advantage)

Was aber ist unser Alleinstellungsmerkmal? Gut, es gibt noch andere Unternehmen, die sich mit BI auskennen, einige davon sogar mit BI und Microsoft-Technologie. Ist die Größe des Unternehmens ein Alleinstellungsmerkmal? Wohl kaum. Sind es spezielle Technologien oder Produkte, die im Unternehmen entwickelt (oder eingekauft) worden sind? Kann sein.

Oder sind es nicht eher die Mitarbeiter, die alle unterschiedlichste Schwerpunkte haben und verschiedenste Erfahrungen mitbringen? Vielleicht ist es auch die Fähigkeit, Wissen weiterzugeben – also die Beratungskompetenz? Ich weiß es nicht.

Wir haben keine großen Maschienen, wir bauen keine gewaltigen Flugzeuge. Wir arbeiten mit Standardsoftware (SQL Server von Microsoft) – ein Produkt, welches unsere Kunden gekauft haben. Und daraus machen wir mit Hilfe langjähriger Erfahrungen, fundierter Ausbildung, den richtigen Fragen und einem gesunden Anspruch an unsere Arbeit das, was unsere Kunden brauchen. Und das sind in der Regel Antworten auf ihre Fragen (bzw. brandaktuelle und korrekte Unternehmenskennzahlen).

Vielleicht ist das ja ein Alleinstellungsmerkmal…?  

Es grüßt aus Hamburg,

Torsten Katthöfer

Die Conversion Rate – eine Kennzahl auf Knopfdruck?

20. Dezember 2010

In fast allen Diskussionen um Webstatistiken, Webtracking, der Bewertung von Internet-Marketing-Kampagnen – kurz um Business Intelligence im eCommerce spielt eine Kennzahl die zentrale Rolle: die Conversion Rate bzw. die Frage wie die Conversion Rate gesteigert werden kann. Entsprechend können alle Webtracking Tools von Webtrekk bis Google Analytics „auf Knopfdruck“ einen KPI Conversion Rate liefern.

In der Theorie ist dieser KPI einfach und klar definiert:
In internet marketing, conversion rate is the ratio of visitors who convert casual content views or website visits into desired actions based on subtle or direct requests from marketers, advertisers, and content creators. The Conversion rate is defined as follows:

Conversion rate = Number of Goal Achievements / Visits
(Quelle: http://en.wikipedia.org/wiki/Conversion_rate)

Reicht diese Definition und ein Tracking Tool, um erfolgreiche eCommerce Analyse betreiben zu können?

In der Praxis der Bewertung von Kampagnen oder von Webseiten verhält es sich wie bei allen Kennzahlen in der BI: es kommt auf eine im konkreten Anwendungsfall passende und zielgerichtete Definition an. Es muss zum einen fachlich festgelegt werden, was das Ziel der Conversion ist, – Kauf, Bestellung eines Newsletters o.ä., vor allem aber ist bei der konkreten Definition der Kennzahl „Conversion Rate“ wichtig festzulegen, was unter „Visits“ verstanden wird: Sind tatsächlich Besuche gemeint oder etwa Besucher (Vistors), werden alle Visits eines Besuchers einbezogen oder werden verschiedene Aufrufe als ein Visit gezählt. Ein typisches Verhalten eines potentiellen Käufers im Internet ist folgendes: In der Mittagspause surft Hr. Müller von seinem Firmenrechner zur Information erst auf der Website A, dann auf Website B, danach kehrt noch mal zu Website A zurück.
Am Abend zu Hause kauft er dann von seinem privaten PC über Website A.

Damit die Conversion Rate tatsächlich eine Aussagekraft hat, müssen bei der Definition und Interpretation dieser KPI solche und viele andere Verhaltensmuster berücksichtigt werden. Eine einfache Knopfdruck-Lösung reicht daher nicht.

Als weiterführende Dokumente seien empfohlen:
http://www.ecommerce-leitfaden.de/lasst-zahlen-sprechen.html#anchor_3_2
http://www.iab.net/media/file/audience_reach_022009.pdf

Frohe Festtage und einen guten Start in das neue Jahr wünscht
Matthias Wedig

“Effizienzsteigerung” – Unwort des Jahres

09. September 2010

Vor einigen Jahren hat mir ein alter Freund – knapp 78 Jahre alt, erfolgreicher und erfahrener Unternehmer – den Unterschied zwischen effizient und effektiv so erklärt, dass ich es nie wieder vergessen habe (was übrigens auch einer seiner Prognosen war):

“Wenn unter deinem Schreibtisch der Papierkorb brennt, kannst Du das Feuer mit einer Flasche Champagner löschen. Das wäre effektiv. Alternativ könntest du ihn mit Wasser löschen – das wäre dann effizient”.

Wenn also in werbewirksamen Verkaufsprospekten und Powerpoints von “Effizienzsteigerung” die Rede ist, dann ist das aus meiner persönlichen Sicht gelinde gesagt, meist Unsinn. Wenn etwas bereits effizient ist, dann ist es gut. Es sei denn, die Umstände haben sich geändert. Hat sich die Technik soweit entwickelt, dass Champus aus dem Nichts erzeugt wird und gleichzeitig Wasser knapp ist, mag es effizient sein, mit Champus eines jungen Jahrgangs zu löschen, statt das Feuer lodern zu lassen - während die alten Schätze im Keller bleiben.

Wie komme ich darauf? Immer wieder werden mir schaurige Berichte angetragen, woher Marketing’ler oder Geschäftsführer ihre Zahlen bekommen. Um ganz unten anzufangen, gibt es Kontoauszüge, aus denen der Umsatz berechnet wird (Haben = Umsatz, Soll = [irgendwelche] Kosten). Dann gibt es Excel-Access-Kombinationen, die zwar korrekte Daten liefern (effektiv), die aber Veränderungen überhaupt nicht mögen – und im Fehlerfall nur noch von den Autoren angepasst werden können. Es gibt Datenbanken, die jeden Tag per Hand mit Zahlen aus Google Analytics gefüttert werden – wenn der wissende Mitarbeiter im Hause ist (ein bisschen effektiv).

Was wir unseren Kunden letztendlich verkaufen, ist Effizienz. Keine fehleranfällige Handarbeit, sondern qualitative Datenquellen, schnelle Verarbeitung, und eine einzige, korrekte und vergleichbare Sicht auf die Kennzahlen. Mehr nicht…

Herzlichst, Torsten Katthöfer


2 Besucher online
0 Gäste, 2 Bots, 0 Mitglied(er)
Meiste Besucher heute: 2 um/am 02:24 UTC
Diesen Monat: 10 um/am 01-07-2012 19:39 UTC
Dieses Jahr: 10 um/am 01-07-2012 19:39 UTC
Jederzeit: 33 um/am 08-23-2010 09:25 UTC