Hadoop:
einfache Integration in moderne Unternehmen

Hadoop: die kosteneffiziente Lösung für Big Data – in Kombination mit Teradata schon heute bereit für den Einsatz in Ihrem Unternehmen.  

Hadoop ist eine Lösung für das Speichern und Verarbeiten sehr großer Datenmengen. Hadoop ist in aller Munde, da es sich um eine open-source Lösung handelt, die auf hoch skalierbaren Clustern aus handelsüblicher Hardware besteht. Damit ist Hadoop die kostengünstige Antwort auf die Frage nach den praktischen Herausforderungen im Umgang mit Big Data.

Hadoop eignet sich dabei besonders, um einen sogenannten Data Lake anzulegen in dem man Daten unterschiedlichster Formate erfassen und speichern kann. Eine der Herausforderungen im Umgang mit Big Data ist, deren Herkunft aus unterschiedlichsten Quellen und damit die unterschiedlichen Datenformate und -Strukturen mit denen traditionelle Datenbanken nicht gut umgehen können. Hierzu zählen unter anderem Click-Stream-Analysen von Webseiten, Textdateien, Maschinen- und Sensordaten, sowie Audio-, Bild- oder Videodateien.

Durch die Hadoop-Technologie kann man all diese Daten zunächst in ihrer Rohform lagern und diese zu einem späteren Zeitpunkt weiterverarbeiten. Diese späte Bindung von Daten an einen bestimmten Zweck wird auch „Late-Binding“ genannt. In einem traditionellen analytischen Datenbankumfeld werden Daten unmittelbar beim Laden in die Datenbank in eine logische Struktur überführt – dies sorgt für Ordnung und Einsichten in die Daten, ist beim Laden aber mit erheblichem Aufwand verbunden, je größer die Menge an Daten die geladen werden. Bei den heutigen Datenmengen und der Komplexität ihrer Struktur wäre dieser Ansatz nicht für ALLE Daten praktikabel. Hadoop befähigt Unternehmen statt dessen die Daten im Rohformat zu speichern und erst dann in deren Strukturierung und Auswertung zu investieren, wenn bestimmten Daten ein Wert zugeschrieben werden kann und der Aufwand damit höchstwahrscheinlich lohnt.

Die Effizienz von Hadoop wird gesteigert, indem man Hadoop in die herkömmliche Datenbankarchitektur eines Unternehmens eingliedert, wo Hadoop seinerseits die vorhandenen Speicher- und Analysefähigkeiten komplettiert. Teradata bietet einen wettbewerbsfähigen, voll-unterstützten Ansatz zur Integration von Hadoop. Dafür wird Teradata von Analysten wie Forrester als Branchenführer in der Hadoop-Integration gelobt.  

Diese Fähigkeit begründet sich auf der Erfahrung und dem Fokus von Teradata als Analyse- und Lösungsanbieter, der sich von Anfang an dem Umgang mit größtmöglichen Datenmengen verschrieben hat und gewillt ist, den sich ändernden Anforderungen von Unternehmen im Umgang mit größten Datenmengen gerecht zu werden.

Das Teradata Portfolio für Hadoop inkludiert die open-source Distribution von Apache™ Hadoop® von Hortonworks zu 100% und bietet zudem ein überzeugendes Set von Teradata Software-Eigenentwicklungen die die Hadoop-Technologie bereit für den Einsatz in Unternehmen machen. Teradata liefert hierbei Softwareerweiterungen für:

  • Setup und Installation
  • Höchste Verfügbarkeit und Verlustprävention  
  • Performanz und Skalierbarkeit
  • Überwachung und Handhabung
  • Datentransformation und -Integration
  • Datensicherheit

Die Teradata Appliance für Hadoop ist der einfachste Weg, Hadoop in die Datenbankarchitektur eines Unternehmens einzugliedern. Sie kombiniert optimierte Hardware, High-Speed-Konnektoren, eine eigens zugeschnittene Softwareoberfläche und natürlich den Weltklasse Service und Support von Teradata in einem integrierten Paket.

 

Fallstudie

ncr_cs_thumb

Wie die NCR Corporation ihre Qualität gesteigert und gleichzeitig Ihre Time-to-Market mittels Datenanalysen gesenkt hat: Enterprise Hadoop Implementierung mit Teradata und Hortonworks.





Kontaktieren Sie uns und erfahren Sie mehr über Teradata, über unsere Lösungen und unseren einzigartigen Datenbankansatz.