Inhalt

Trends in der IT

Big Data – Ausschöpfung von Businessdaten

Dr. Joseph Reger

Dr. Joseph RegerReger begann in der universitären Forschung (Physik und Informa-
tik). Seine Universitätslaufbahn, die er mit der Habilitation ab-
schloss, führte ihn über Ungarn, Norwegen und USA nach Deutsch-
land. Bevor er 1998 bei Fujitsu Technology Solutions begann, war
er als Executive Consultant und Chief Architect bei IBM tätig. 2002
wurde Reger zum CTO ernannt und lenkte die Aktivitäten des
Unternehmens ebenso wie von Kunden bei Praxisimplementierun-
gen beispielsweise in den Bereichen Dynamic IT und Mobility. Als
CTO ist er für Erkennung und Prognose von IT Trends mit dem größten Nutzenpotenzial
für Kunden, und für ihre Realisierung in der Unternehmensstrategie verantwortlich.

Fujitsu Technology Solutions GmbH
Fujitsu ist der führende japanische Anbieter von Informations- und ITK-basierten Ge-
schäftslösungen und bietet eine breite Palette an Technologieprodukten, -lösungen und
Dienstleistungen. Mit über 170.000 Mitarbeitern betreut das Unternehmen Kunden in
mehr als 100 Ländern. Fujitsu Technology Solutions GmbH und Fujitsu Services gehören
zur International Business Group der Fujitsu Gruppe. Als 100-prozentige Tochtergesell-
schaft von Fujitsu bietet Fujitsu Technology Solutions Unternehmenskunden in Deutsch-
land und EMEA Zugang zu einem weltweiten Dynamic Infrastructures-Portfolio.

 

Interview

Woher kommt Big Data und welche Einsatzmöglichkeiten eröffnen sich damit?
Big Data steht sowohl für das Problem als auch für die Bezeichnung der Lösungs-
ansätze. Das Problem ist, schnell wachsende und sehr große Mengen Daten in
unterschiedlichsten Formen zu erheben, sammeln, speichern und analysieren. Der
Big Data Hype resultierte größtenteils aus Entwicklungen im Bereich Internet,
Search und Marketing. Google, Yahoo, etc. mussten Lösungen finden, die eine
performante und wirtschaftliche Verarbeitung großer Datenmengen ermög-
lichen. Der Trend zu „NoSQL“ Datenbanken wurde weiterhin durch Social Media
verstärkt; Lösungen wie Map-Reduce und Hadoop sind heute bekannte Antworten
auf das Problem.

 

Wie wird Big Data in Ihrem Unternehmen definiert?
Big Data ist erst dann Big Data, wenn die Datenanzahl und Menge nicht mehr
mit den typischen Ansätzen gehandhabt werden kann. Datenmengen ab 100TB+
werden im Moment diesem Trend zugeordnet. Weiter zählt die Geschwindig-
keit des Daten-Wachstums, der Datenverarbeitung und die Daten-Typenvielfalt
(unstrukturiert, strukturiert, poly-strukturiert, etc.).

Ist Big Data eine gänzlich neue Technologie oder versteckt sich hinter dem Namen einer schon bestehenden Technologie?
Es ist eine Kombination aus alter und neuer Technik. Open Source Techniken wie Map
Reduce, Hadoop oder NoSQL werden mit Industriestandards wie x86 und HPC kombi-
niert. Dabei wird versucht, so kostengünstig wie möglich zu handeln, da bei derartig gro-
ßen Datenmengen allein die Datenhaltung sehr kostenintensiv ist. Die Fokussierung
einfacher, optimierter und integrierter Rechen- und zugleich Speicherknoten, deren
Ausfallsicherheit über die Softwareschicht realisiert wird, ist sicherlich der entscheiden-
de Unterschied, der die Big Data-Verarbeitung im Sinne von Analytics und BI in der
heutigen Form erst wirtschaftlich macht.

 

Wie wichtig erachten Sie Big Data momentan?
Big Data ist extrem wichtig – im Web- und Social Media Umfeld und allen analytischen

Anwendungen mit nicht strukturierten Daten.

Aber Big Data wird auch im Enterprise und Governance Umfeld immer wichtiger, denn
die Datensammelwut sollte nicht nur Nachteile, sondern auch Vorteile bringen. Durch
Big Data entstehen neue Möglichkeiten, aus Daten Informationen zu schöpfen.

Wird der Trend Ihrer Meinung nach weiter ansteigen oder wird er sich zurückentwickeln, weil es andere Lösungen für große Datenmengen geben wird?
Viele Unternehmen sammeln zwar Daten, gehen der Auswertung und Analyse die-
ser Daten jedoch noch aus dem Weg. Dies wird sich vermutlich ändern, wenn sie erst
mal erkannt haben, dass in den Daten sehr wichtige Informationen stecken, die unter-
nehmensentscheidend sind.

Sehen Sie den einen Lösungsansatz oder glauben Sie, dass nur eine Kombination aus mehreren Technologien der richtige Weg ist?
Mischverfahren für die Aufbereitung, Reduzierung und Homogenität der Daten sind

Hadoop oder andere NoSQL Lösungen. Oft werden sie als Vorstufen verwendet, um
die Daten in einen verwertbaren Zustand zu überführen. Erst dann können Techni-
ken wie In-Memory eingesetzt werden, um Daten in Echtzeit auszuwerten und zu vi-
sualisieren. Durch die Visualisierung lassen sich aus den Daten wesentlich schneller
Informationen herausziehen, denn Daten sind nicht immer gleich Informationen.

Sollte Ihrer Meinung nach jedes größere Unternehmen Big Data verwenden?
Hört sich ein bisschen an wie „eine Lösung sucht ein Problem“. Aber wenn man
noch nicht weiß, welche Fragestellungen sich ergeben werden, kann man
durch schnelles trial-and-error zu gänzlich neuen Erkenntnissen kommen.

Nein, es müssen schon Daten vorliegen, bei denen es Sinn macht, sie auszuwerten.

Aber die Erfahrung zeigt, dass durch den Einsatz analytischer Tools mit

sehr kurzen Antwortzeiten ganz neue Vorteile entstehen, die vorab noch
nicht mal im Scope lagen. Unternehmen sollten vorab zumindest auf Experten-Basis
evaluieren, welche Möglichkeiten sie durch die Analyse von Big Data haben könnten.

Welche Hürden sehen Sie bei der Einführung in Unternehmen? Ist ein Umdenken nötig?
Der Wert der Analyse von Kunden-, System-, Produkt-, Markt- und Trend-Daten wird oft
unterschätzt. Das Know-How zu Big Data, Analytics oder Business Intelligence liegt sehr
oft nicht vor oder wird nur schleppend aufgebaut. Möglicherweise müssen neue Be-
rufsbezeichnungen etabliert werden, denn es gibt kaum Experten für Felder wie z. B. Data
Analysts, Data-Scientists oder -Architects.

„Wer jetzt nicht umsteigt, verpasst den Anschluss“, wie ist Ihre Stellung hierzu?
Zumindest eine Untersuchung der Big Data, Analytics und BI Möglichkeiten sollte ange-
strebt werden. Der Wettbewerb wird versuchen, sich durch diese neue „Intelligenz“
zu differenzieren. Die Unternehmen sollten eine Risikoanalyse durchführen, um zu se-
hen, welches Potenzial in den vorhandenen Daten steckt und welche neuen Möglich-
keiten sich daraus ergeben.

Wie viel Personal wird benötigt, um Big Data zu verwalten?
Dies ist abhängig von der Problemstellung. Aber die notwendigen Data Analysts, Da-
ta-Scientists und Daten-Architekten sind heute in kaum einem Unternehmen vor-
handen. Manche benötigten Berufsbilder sind sogar noch gar nicht existent.

Wie lange glauben Sie, wird es noch dauern, bis an Big Data kein Vorbeikommen mehr möglich ist?
Big Data ist das Problem, erst in zweiter Linie eine Bezeichnung für eine mögliche
Lösung. Viele Unternehmen werden ein Big Data Management Problem bekommen,
aber nicht alle werden die Chance nutzen, Vorteile daraus zu generieren. Es könnte
gut sein, dass Hadoop oder NoSQL sich ähnlich wie Linux in der Serverwelt entwi-
ckeln, wodurch sich ein eigenes Eco-System in diesem Umfeld bilden kann.

Sehen Sie auch andere bzw. neue Einsatzmöglichkeiten für Big Data, die sich mit der Zeit ergeben werden?
Durch eine andere Sichtweise auf die Daten werden neue Einsatzmöglichkeiten entste-
hen. Auf der einen Seite können Firmen wie auch jetzt schon mit Rohdaten handeln, die
von anderen Unternehmen gekauft und analysiert werden. Auf der anderen Seite
ist es schon möglich, durch Cloud Systeme eine vereinfachte Analyse dieser Daten
durchzuführen. Diese Möglichkeiten existieren bereits. Heute lassen sich Markfor-
schungen schneller durchführen, aber auch Analyse und Visualisierung in Echtzeit sind
jetzt möglich. Die Frage wird sich vermutlich in die Richtung verlagern, wie kann ich
Daten auswerten und welche Daten muss ich erheben oder zukaufen, um an nützliche
und benötigte Informationen zu kommen. Damit entsteht eine neue Herausforderung
an die ITK: das dabei neu entstandene Wissen ist entsprechend zu schützen und zu
verwalten.

Wird in Ihrem Unternehmen an neuen Lösungsansätzen zum Thema Big Data gearbeitet?
Wir haben vielfältige Projekte im Big Data Umfeld. Hier in Europa wie auch bei unse-
ren Kollegen in Japan und speziell in unseren Fujitsu Labs. Es gibt viele Ansätze, Ha-
doop um bestimmte Einsatzbereiche zu optimieren und zu vereinfachen. Wir wer-
den unseren Kunden helfen, ihre Big Data Probleme zu evaluieren und möglichst op-
timal zu lösen. Es existieren Kooperationen mit SAP bei In-Memory Systemen, aber auch
Möglichkeiten auf der Softwareseite.