Philipp Krenn

10.12.2019

09:00 - 09:45

Plateau 2

Session

  IT-Tage 2021
  •  Live-Streaming von über 200 Vorträgen in 18 Subkonferenzen.
  •  365 Tage On-Demand-Zugriff auf 260 Vortragsvideos und ein umfangreiches Archiv an Informationen der Konferenz.
  •  Weitere 7 Remote-Konferenzen in 2022.

Das CAP-Theorem ist als Tradeoff in verteilten Systemen allgemein bekannt. Aber es ist nicht der einzige Kompromiss, dessen man sich bewusst sein sollte. Für Datenbanken gibt es auch die FAB-Theorie und genau wie beim CAP-Theorem können nur (maximal) zwei der drei Eigenschaften gleichzeitig erfüllt werden:

  • Fast: Die Ergebnisse stehen in Echtzeit oder nahezu in Echtzeit bereit statt Batch-orientiert.
  • Accurate: Antworten sind genau und haben keine Abweichungen.
  • Big: Man hat so viele Daten, dass man horizontale Skalierung benötigt und seine Daten verteilen muss.

Während Fast und Big relativ einfach zu verstehen sind, ist Accurate etwas schwieriger darzustellen. Dieser Vortrag zeigt einige konkrete Beispiele für Kompromisse bei der Genauigkeit von Daten am Beispiel von Elasticsearch: Term Aggregationen, Cardinality Aggregationen mit HyperLogLog++ und den IDF-Teil der Volltextsuche. Oder wie man etwas Geschwindigkeit beziehungsweise die Verteilung für mehr Genauigkeit eintauschen kann.