Обзор алгоритмов MOLAP


Взрыв данных


При добавлении исходных данных в куб объем данных и время вычисления куба растут экспоненциально, так как необходимо рассчитывать агрегаты по каждому из измерений. Например, десятимерный куб без иерархии внутри измерений с размерностью 100 для каждого измерения приводит к структуре со

$ 101^{10} = 1.1^{20}$

ячейками. Даже если мы положим разреженность 1 к

$ 10^6$

(т.е. пусть только одна из миллиона ячеек содержит данные), куб все равно будет иметь

$ 1,1^{14}$

непустых ячеек. Если пустые значения достаточно легко сжимаются, то "взрывом данных" называют рост количества агрегатов по всем измерениям, которые необходимо вычислить. Т.е. добавление одной ячейки в куб с 10 измерениями, содержащими итоги, приводит к необходимости посчитать

$ 2^{10} - 1$

итоговых агрегатов (для устранения подобных cитуаций в каждом из алгоритмов используются специальные техники, к примеру, condensed-ячейки в алгоритме ).




Начало  Назад  Вперед