Сообщить об ошибке.

Функция pvariance() модуля statistics в Python, дисперсия элементов

Дисперсия элементов числовой последовательности

Синтаксис:

import statistics

statistics.pvariance(data, mu=None)

Параметры:

  • data - данные, последовательность или итерация,
  • mu=None - среднее значение последовательности data.

Возвращаемое значение:

  • популяционную дисперсию данных data.

Описание:

Функция pvariance() модуля statistics возвращает дисперсию элементов непустой числовой последовательности или итерации.

Дисперсия, или по другому второй момент относительно среднего значения, является мерой изменчивости (разброса или дисперсии) числовой последовательности. Большая дисперсия указывает на то, что данные распределены относительно среднего значения. Небольшая дисперсия указывает на то, что они тесно сгруппированы вокруг среднего значения числовой последовательности.

Если задан необязательный второй аргумент mu, то обычно это среднее значение числовой последовательности. Аргумент mu также может быть использован для вычисления дисперсии вокруг любого элемента последовательности, который не является средним значением. Если аргумент mu отсутствует или None (по умолчанию), то автоматически вычисляется среднее арифметическое значение последовательности data.

Используйте функцию statistics.pvariance() для вычисления дисперсии от всей последовательности data. Для оценки дисперсии по выборке/срезу обычно лучше использовать функцию statistics.variance().

Примеры использования функции statistics.pvariance():

>>> import statistics
>>> data = [0.0, 0.25, 0.25, 1.25, 1.5, 1.75, 2.75, 3.25]
>>> statistics.pvariance(data)
# 1.25

Если уже есть рассчитанное среднее значение данных числовой последовательности, то это значение можно передать в качестве необязательного второго аргумента mu, чтобы избежать пересчета:

>>> mu = mean(data)
>>> statistics.pvariance(data, mu)
# 1.25

Функция pvariance() поддерживает десятичные и обыкновенные дроби:

>>> from decimal import Decimal as D
>>> pvariance([D("27.5"), D("30.25"), D("30.25"), D("34.5"), D("41.75")])
# Decimal('24.815')

>>> from fractions import Fraction as F
>>> pvariance([F(1, 4), F(5, 4), F(1, 2)])
# Fraction(13, 72)

Примечание. При вызове функции для всей числовой последовательности, то результатом будет дисперсия совокупности σ². Когда функция вызывается для выборки числовой последовательности, то это будет смещенная дисперсия выборки , также известная как дисперсия с N степенями свободы.

Если каким-то образом известно истинное среднее значение числовой последовательности μ, то можно использовать эту функцию для вычисления дисперсии выборки, задав это значение в качестве второго аргумента. При условии, что элементы данных представляют собой случайную выборку числовой последовательности, то результатом будет объективная оценка дисперсии этой числовой последовательности.