- Alexander Reelsen
- Donnerstag, 25. Mai 2023
- 14:00 - 14:45
- Track 1
- Session
Invertierter Index, TF/IDF und fertig ist die Volltextsuche? Ganz so einfach ist es heutzutage nicht mehr. Moderne Suchmaschinen benötigen mehr als eine Datenstruktur für unterschiedliche Suchen, haben ein modernes Ranking, das aus konfigurierbaren Formeln besteht und verwenden Cloud Native Technologien, um resourceneffizient betrieben zu werden. Relevanz bleibt das kontinuerliche Thema für Volltextsuchmaschinen. Neben BM25, Relevanz basierend auf Feldwerten von Dokumenten sind vor allem zwei Themen aktuell omnipräsent: Nearest-Neighbour Suche und sowie Ranking via Machine Learning Modellen. Neben Relevanz ist Resourceneffizienz der andere große Bereich in dem bei Suchmaschinen signifikante Veränderungen auszumachen sind. Suche in Blob-Stores oder Reduktion der Replikation sind nur einige der Strategien, die wir uns anschauen werden.
Dieser Vortrag soll aus den unterschiedlichen Buzzwords einen kohärenten Einblick in verschiedene Suchmaschinen und deren Implementierung dieser Eigenschaften inklusive möglicher Tradeoffs bieten.