Как исключить экстремальные значения из статистики

Содержание

Расчет среднего обычно многое говорит о наборе данных. Однако объемы данных с экстремальными выбросами проблематичны, так как они могут существенно повлиять на результат и исказить его.

Вы можете исключить такие выбросы из своих расчетов. Тогда ваши основные данные приобретут все большее значение при оценке. Иллюстрация [1] показывает таблицу, в которой рассчитывается среднее значение для каждого столбца.

Из-за отрицательных значений на 2 и 4 дни эти средние значения очень низкие. Однако в дни 1 и 5 очень высокие значения приводят к особенно высоким средним значениям.

Чтобы вычислить средние значения без выбросов, используйте функцию ОБРЕЗАТЬ ЗНАЧЕНИЕ. Для этого введите следующую формулу в ячейку B16 и после ее ввода скопируйте формулу в ячейки C16: F16:
= СРЕДА ДЛЯ ОБРЕЗКИ (B4: B13; 0,2)

Средние значения теперь намного ближе друг к другу, потому что экстремальные значения не принимаются во внимание. [2]

Вы передаете два аргумента табличной функции ROUTED AVERAGE: Первый аргумент указывает диапазон, в котором вы хотите вычислить среднее значение. Передайте значение от 0 до 1 или от 0% до 100% в качестве второго аргумента. Это позволяет определить, какую часть объема данных не следует включать в расчет. Самые высокие и самые низкие значения не учитываются.

В таблице примера в качестве второго аргумента указано значение 0,2. Это означает, что 20% из десяти переданных значений не включаются в расчет. С десятью значениями это означает: два значения выпадают из расчета: наибольшее и наименьшее значение. При вычислении количества пропущенных значений Excel всегда округляет в меньшую сторону до ближайшего четного числа, чтобы одинаковое количество значений всегда обрезалось сверху и снизу.

Вы поможете развитию сайта, поделившись страницей с друзьями

wave wave wave wave wave