Hadoop:
version simplifiée pour l'architecture des entreprises d'aujourd'hui

Hadoop est une solution pour le stockage et le traitement des grands volumes de données. Cette solution suscite toute l’attention car elle est open-source et fonctionne sur des clusters hautement évolutifs de matériels standard. Hadoop offre par conséquent une approche low-cost pour faire face aux défis pratiques de traitement des données volumineuses.

Il s’agit d’une solution très efficace pour créer un «lac de données (data lake)» afin de capturer et stocker les données brutes dans un large éventail de formats. L'un des défis que posent les big data est que de nombreuses « nouvelles » sources de données se présentent sous un large éventail de formats et de structures pour lesquels les bases de données traditionnelles ne sont pas bien adaptées. Cela comprend les données de parcours de navigation provenant des sites Web, les fichiers texte, les données machine et de capteurs, ainsi que les fichiers audio, image et vidéo.

Grâce à Hadoop, ces sources de données peuvent être stockées sous leur forme brute et traitées ultérieurement quand un besoin spécifique se présente. Ce phénomène est connu sous le nom de liaison tardive. Dans un environnement de données analytiques traditionnel, les données sont traitées dans une structure logique car elles sont chargées dans la base de données ; elles ont pour but d'ordonner et faire comprendre, mais cela nécessite des efforts et un coût d'installation. Avec les volumes de données et la complexité de la structure, cette approche n'est pas toujours pratique pour toutes les données. Hadoop permet à une organisation de capturer toutes les données puis passer ensuite du temps et des efforts pour la création d’une structure que lorsque cela est nécessaire et lorsqu’une valeur est identifiable.

Hadoop est la solution la plus efficace quand elle est intégrée dans l'architecture des données d'une entreprise pour compléter et améliorer les capacités analytiques existantes. Teradata fournit une approche complète pleinement supportée pour Hadoop et est en outre reconnu par les analystes tels que Forrester comme un leader dans la mise en œuvre Hadoop.

Cette capacité se base sur notre attention exclusive en tant que spécialiste analytique, et des difficultés pratiques dont doivent faire face les organisations devant leurs volumes de données en expansion constante ainsi que des exigences croissantes des entreprises pour des analyses avancées.

Le portefeuille de Teradata pour Hadoop inclut la distribution 100 % open-source d'Apache™ Hadoop® par Hortonworks. Il offre une série complète de composants logiciels développés par Teradata qui rendent la technologie Hadoop prête pour l'entreprise. Teradata inclut des améliorations logicielles sur :

  • Configuration et installation
  • Haute disponibilité et Reprise après sinistre
  • Performance et Évolutivité
  • Surveillance et Gérabilité
  • Transformation des données et Intégration
  • Sécurité des données

Le Teradata Appliance for Hadoop est le meilleur moyen de mettre en œuvre Hadoop dans une architecture de données d'entreprise. Il combine à la fois un matériel optimisé, des connecteurs haut-débit, des fonctions améliorées de convivialité des logiciels et fournit un service et un support de première catégorie dans un package intégré.

 

Étude de cas

ncr_cs_thumb

Comment NCR Corporation a-t-il amélioré la qualité et le temps de mise sur marché grâce aux analyses avancées : Mise en œuvre d’Hadoop avec Teradata et Hortonworks





Nous contacter pour en savoir plus sur Teradata, ses solutions et son approche unique en matière de stockage de données.