Parstream

Une base de données analytique pour les grands volumes de données

ParStream apporte une approche révolutionnaire de l'analyse à hautes performance de données. Il concerne le problème provenant des volumes de données en augmentation rapide dans le monde moderne, ainsi que des scenarii d'application scientifique, par l'utilisation d'algorithmes innovants et de structures d'indexation brevetées.

Cas d'utilisation

L'analyse de grands volumes de données prend de plus en plus d'importance dans de nombreuses entreprises et de tous secteurs d’activités.
Ainsi par exemple :

  • Analyses du web – analyse de milliards d'enregistrements en quelques millisecondes
  • Média sociaux – en apprendre plus à propos de vos utilisateurs
  • Recherche de marché – ParStream permet des combinaisons rapides et flexibles de nombreuses colonnes
  • Recherche climatique – Les caractéristiques SQL standard et des nœuds d'interrogation personnalisés apportent une flexibilité et une vitesse maximale pour les applications telles que le regroupement cartographique
  • Soins de santé et assurance – L'importation et l'interrogation simultanées de données permet la comparaison de données actuelles ou bien sur les historiques
  • Telco – Surveillance et facturation de la QoS (quality of service / qualité de services)
  • Extraction – filtrer et interroger de grandes quantités de données cartographiques
  • Mesure intelligente – analyser des données de mesure à travers la base de clients

Avantages :

  • Ultrarapide
    obtenez des résultats d’analyses en quelques fractions de secondes
  • Echelonnable
    stocke et analyse facilement des milliards d'enregistrements
  • Unique
    capable de produire des analyses qui n'étaient pas faisables auparavant
  • Temps réel
    importe et analyse simultanément des données
  • Efficace
    utilise la puissance de traitement parallèle de processeurs graphiques (ou GPU)
  • Rentable
    économie sur les coûts d'infrastructure

Recul de l'architecture actuelle de base de données

Les chiffres ci-dessus montrent une comparaison de performances entre ParStream et DBMS X comme plate-forme pour un moteur de recherche en ligne pour des offres de voyage. Les bases de données actuelles ne sont pas conçues pour des masses de données, mais plutôt pour de petits volumes de données jusqu'à 100 millions d'enregistrements.
Les bases de données actuelles sont dépassées, ont des architectures vieilles de 20-30 ans et les structures de données et d'indexation ne sont pas conçues pour une analyse efficace de tels volumes de données. Et, comme ces bases de données utilisent des algorithmes séquentiels, elles ne sont pas capables d'exploiter le potentiel des calculateurs parallèles ou clusters HPC.

Plates-formes supportées

Actuellement, ParStream est disponible sur un certain nombre de distributions Linux incluant RedHat Enterprise Linux et SUSE Enterprise Linux tournant sur des unités centrales X86_64. Sur demande, ParStream sera porté sur d'autres plates-formes.
ParStream a le plein support pour l'accélération des processeurs graphiques sur les cartes NVIDIA Fermi.