DB-EnginesextremeDB - Data management wherever you need itEnglish
Deutsch
Informationen zu relationalen und NoSQL DatenbankmanagementsystemenEin Service von Redgate Software

Enzyklopädie > Artikel

MapReduce

MapReduce ist ein Algorithmus für parallele Verarbeitung in großen Datenbeständen, welcher von vielen NoSQL Datenbankmanagementsystemen zur Verfügung gestellt wird. Er eignet sich besonders zum Abarbeiten von Abfragen auf verteilten Datenbanken.

Arbeitsweise

MapReduce beruht auf einem seit langem bekannten algorithmischem Konzept (divide and conquer), das im Zusammenhang mit Datenbanken in der Regel folgendermaßen angewandt wird:

  • Ein Master Knoten nimmt eine Anfrage entgegen, und teilt sie in Teilaufgaben auf, die er an andere Knoten verteilt. Dabei ist wesentlich, dass die Teilaufgaben voneinander unabhängig gelöst werden können.

    Zum Beispiel nimmt eine Suchmaschine eine Suchanfrage entgegen, und gibt sie an einzelne Server weiter, welche jeweils einen Teil der Daten verwalten.

     
  • In der Map Phase verarbeitet jeder Knoten seine Teilaufgabe, und stellt die Ergebnisse bereit.

    In diesem Beispiel stellt jeder Server die Suchergebnisse aus seinem lokalen Datenbestand bereit.
     
  • In der Reduce Phase werden die einzelnen Teilergebnisse gesammelt, konsolidiert und zu einem Gesamtergebnis weiterverarbeitet. Je nach Problemstellung kann u.U. auch die Reduce Phase parallelisiert werden.

    In dem Beispiel wird dort etwa die Endreihung der gesammelten Suchergebnisse vorgenommen.

Bei geeigneten Problemstellungen und geeigneter Systemarchitektur ist MapReduce ein fast beliebig skalierbarer Algorithmus. Diese Eigenschaft macht ihn bei der Verarbeitung riesiger Datenmengen attraktiv.



Featured Products

Neo4j logo

See for yourself how a graph database can make your life easier.
Use Neo4j online for free.

RaimaDB logo

RaimaDB, embedded database for mission-critical applications. When performance, footprint and reliability matters.
Try RaimaDB for free.

SingleStore logo

Build AI apps with Vectors on SQL and JSON with milliseconds response times.
Try it today.

Milvus logo

Vector database designed for GenAI, fully equipped for enterprise implementation.
Try Managed Milvus for Free

Datastax Astra logo

Bring all your data to Generative AI applications with vector search enabled by the most scalable
vector database available.
Try for Free

Präsentieren Sie hier Ihr Produkt