Approxjoin: Approximate distributed joins

Do Le Quoc, Istemi Ekin Akkus, Pramod Bhatotia, Spyros Blanas, Ruichuan Chen, Christof Fetzer, Thorsten Strufe

Publikation: Beitrag in Buch/Bericht/KonferenzbandKonferenzbeitragBegutachtung

15 Zitate (Scopus)

Abstract

A distributed join is a fundamental operation for processing massive datasets in parallel. Unfortunately, computing an equi-join over such datasets is very resource-intensive, even when done in parallel. Given this cost, the equi-join operator becomes a natural candidate for optimization using approximation techniques, which allow users to trade accuracy for latency. Finding the right approximation technique for joins, however, is a challenging task. Sampling, in particular, cannot be directly used in joins; naïvely performing a join over a sample of the dataset will not preserve statistical properties of the query result.

OriginalspracheEnglisch
TitelSoCC 2018 - Proceedings of the 2018 ACM Symposium on Cloud Computing
Herausgeber (Verlag)Association for Computing Machinery, Inc
Seiten426-438
Seitenumfang13
ISBN (elektronisch)9781450360111
DOIs
PublikationsstatusVeröffentlicht - 11 Okt. 2018
Extern publiziertJa
Veranstaltung2018 ACM Symposium on Cloud Computing, SoCC 2018 - Carlsbad, USA/Vereinigte Staaten
Dauer: 11 Okt. 201813 Okt. 2018

Publikationsreihe

NameSoCC 2018 - Proceedings of the 2018 ACM Symposium on Cloud Computing

Konferenz

Konferenz2018 ACM Symposium on Cloud Computing, SoCC 2018
Land/GebietUSA/Vereinigte Staaten
OrtCarlsbad
Zeitraum11/10/1813/10/18

Fingerprint

Untersuchen Sie die Forschungsthemen von „Approxjoin: Approximate distributed joins“. Zusammen bilden sie einen einzigartigen Fingerprint.

Dieses zitieren