Best Practice

Dynamic Parcel Distribution GmbH (DPD)

Big-Data-Handling

Bild: DPD

Für die Analyse und Auswertung ihrer täglich über 90 Millionen Datensätze setzt die Dynamic Parcel Distribution GmbH (DPD) künftig auf Microsoft SQL Server 2012 Parallel Data Warehouse (PDW). Damit lassen sich jegliche Daten aus dem gesamten Unternehmen in Echtzeit analysieren und in einem einheitlichen Tool-Set auswerten.

Mit mehr als 24.000 Mitarbeitern, 18.000 Fahrzeugen und täglich bis zu 2,5 Millionen Paketen zählt die Dynamic Parcel Distribution GmbH (DPD) zu den führenden internationalen Paket- und Expressdienstleistern. Im B2B-Paketversand baut das Unternehmen seine Marktführerschaft weiter aus – etwa durch die Nennung eines Zeitfensters, wann jedes Paket seinen Bestimmungsort erreichen wird. Dafür mussten vorab alle Sendungen statistisch ausgewertet werden. Keine leichte Aufgabe angesichts von täglich rund 90 Millionen teils unstrukturierter Datensätze. „All diese Daten waren dabei auf mehr als 50 Datenbanken verteilt“, erklärt Peter Weber, Bereichsleiter Business Intelligence bei DPD. Das Ziel war deshalb klar: die Schaffung eines einheitlichen, leistungsstarken Systems, das alle Daten weltweit vereint, in Echtzeit analysiert und in einer analytischen Schicht zur Auswertung bereitstellt. Da Microsoft SQL Server bereits im gesamten Unternehmen für das Reporting im Einsatz ist und auch einige DPD-Gesellschaften SAP nutzen, wurde im Mai 2013 ein Proof of Concept mit Microsoft und SAP durchgeführt. „Dabei haben wir sämtliche Realdaten aus einem Geschäftsjahr, rund 0,5 Terabyte, an die Anbieter übergeben und gebeten, eine Empfehlung zu geben, ob Big Data eine Lösung wäre“, so Peter Weber. Für Microsoft trat die Berliner Ceteris AG an und überzeugte mit Microsoft SQL Server 2012 Parallel Data Warehouse (PDW) und einem Half Rack von HP als Hardware. „In dieses System haben wir unsere SQL-Statements eingepflegt und ohne eine Anpassung die vierfache Query-Performance und siebenfache Daily-Load-Performance erreicht im Vergleich zu unseren vorigen Systemen, die auch schon schnell waren“, erläutert Markus Raatz, Vorstand der Ceteris AG. Damit konnten auch 6,5 Terabyte im Test problemlos bewältigt werden. 

Datenbank und Interface aus einer Hand 

Im Sommer 2014 geht die Lösung bei DPD in Betrieb. SQL Server 2012 PDW bildet dann einen operationalen Data-Store sowie das Interface für alle Auswertungssysteme. Der Zugriff erfolgt dabei einfach über die Standard-ODBC-Schnittstellen von Microsoft. „Zur Auswertung nutzen wir ausschließlich Tools aus dem Microsoft-BI-Stack“, erläutert Peter Weber. „Alle Daten, ob strukturiert oder unstrukturiert, können wir nun mit SQL Server 2012 PDW unternehmensweit in Echtzeit analysieren und in einem einheitlichen Tool-Set auswerten.“