Scalable Histograms on Large Probabilistic Datase Nonlinear Classification

Published on 2014-10-081563 Views

Mingwang Tang

Histogram construction is a fundamental problem in data management, and a good histogram supports numerous mining operations. Recent work has extended histograms to probabilistic data. However, constr

Research Sessions

Related categories

Presentation

Scalable Histograms on Larger Probabilistic Data00:00

Introduction00:03

Histograms on deterministic data00:52

Probabilistic Database - 101:49

Probabilistic Database - 202:06

Probabilistic Data Models - 102:25

Probabilistic Data Models - 203:06

Probabilistic Data Models - 303:24

Probabilistic Data Models - 403:41

Histograms on Probabilistic data03:55

Effcient computation of bucket error04:32

Pmerge Method - 105:11

Pmerge Method - 205:22

Pmerge Method - 305:39

Pmerge Method - 405:59

Recursive Merging Method06:04

Distributed and Parallel Pmerge - 107:00

Distributed and Parallel Pmerge - 207:06

Distributed and Parallel Pmerge - 307:43

Distributed and Parallel Pmerge - 407:55

Pmerge Based on Sampling - 108:29

Pmerge Based on Sampling - 209:05

Pmerge Based on Sampling - 309:14

Pmerge Based on Sampling - 409:31

Pmerge Based on Sketch09:55

Outline10:52

Experiment setup10:57

Running time11:32

Approximation Ratio11:57

Running time on large scale probabilistic data12:05

Conclusion & Future work12:25

Thank You12:59