- Dr. Andreas Weininger
- Donnerstag, 14. Dez 2023
- 10:00 - 10:45
- Plateau 2
- Session
Es gibt viele Arten von Abfragen auf Datenbanken, die sehr viele Ressourcen für ihre Berechnung brauchen und trotz des hohen Ressourcenverbrauchs immer noch lange benötigen um das Ergebnis zurückzuliefern. Ein Beispiel für eine solche Abfrage ist etwa ein COUNT DISTINCT auf einer sehr großen Datenmenge, die wenige Duplikate enthält. Gleichzeitig stellt sich oft die Frage, ob ein Anwender tatsächlich das exakte Ergebnis der Anfrage benötigt, oder ob ein guter Näherungswert nicht ausreichend ist: In analytischen Anwendungen werden Ergebnisse oft graphisch dargestellt und allein durch die Auflösung des Ausgabegerätes ist überhaupt keine Unterscheidung zwischen einem Näherungswert mit einigen gültigen Stellen und dem exakten Wert möglich.
Auch greifen analytische Anwendungen häufig sowieso auf Daten zu, die bis zu 24 Stunden älter sind als die Daten in den operativen Systemen. Häufig sind Anwender auch nur an Trends oder statistischen Aussagen interessiert. In all diesen Fällen kann sich die Frage stellen, ob ein Näherungswert, der schneller zur Verfügung steht, nicht besser ist als der exakte Wert.
Deshalb wird in diesem Vortrag untersucht, wann man bei Datenbankabfragen mit Näherungsergebnissen arbeiten kann, welche Verfahren genutzt werden können um Näherungsergebnisse zu ermitteln und wie diese Approximationsverfahren in modernen Datenhaltungssystemen angewandt werden können.