Designing random sample synopses with outliers

Publikation: Beitrag in Buch/Konferenzbericht/Sammelband/GutachtenBeitrag in KonferenzbandBeigetragenBegutachtung

Beitragende

  • Philipp Rösch - , Technische Universität Dresden (Autor:in)
  • Rainer Gemulla - , Technische Universität Dresden (Autor:in)
  • Wolfgang Lehner - , Professur für Datenbanken (Autor:in)

Abstract

Random sampling is one of the most widely used means to build synopses of large datasets because random samples can be used for a wide range of analytical tasks. Unfortunately, the quality of the estimates derived from a sample is negatively affected by the presence of "outliers" in the data. In this paper, we show how to circumvent this shortcoming by constructing outlier-aware sample synapses. Our approach extends the well-known outlier indexing scheme to multiple aggregation columns.

Details

OriginalspracheEnglisch
TitelProceedings of the 2008 IEEE 24th International Conference on Data Engineering, ICDE'08
Seiten1400-1402
Seitenumfang3
PublikationsstatusVeröffentlicht - 2008
Peer-Review-StatusJa

Publikationsreihe

Reihe International Conference on Data Engineering (ICDE)
ISSN1063-6382

Konferenz

Titel2008 IEEE 24th International Conference on Data Engineering, ICDE'08
Dauer7 - 12 April 2008
StadtCancun
LandMexiko

Externe IDs

Scopus 52649105862
ORCID /0000-0001-8107-2775/work/199215652

Schlagworte

Forschungsprofillinien der TU Dresden

Fächergruppen, Lehr- und Forschungsbereiche, Fachgebiete nach Destatis