Числовые характеристики степени рассеяния наблюдений. Характеристики рассеяния. Качество поверхности, получаемое при обкатывании роликовым инструментом. Схема процесса, величина давления, кратность приложения деформирующей силы, технологическая оснастка в

Математическая статистика – это раздел математики, изучающий приближенные методы отыскания законов распределения и числовых характеристик по результатам эксперимента.

Генеральная совокупность – это множество всех мыслимых значений наблюдений (объектов), однородных относительно некоторого признака, которые смогли быть сделаны.

Выборка это совокупность случайно отобранных наблюдений (объектов) для непосредственного изучения из генеральной совокупности.

Статистическое распределение – это совокупность вариант x i и соответствующих им частот n i .

Гистограмма частот – это ступенчатая фигура, состоящая из смежных прямоугольников, построенных га оной прямой, основания которых одинаковы и равны ширине класса, а высота равна или частоте попадания в интервал n i или относительной частоте n i /n. Ширину интервала i можно определить по формуле Стерджеса :

I=(x max -x min)/(1+3,32lgn),

Где x max – максимальное; x min – минимальное значение вариант, а их разность носит название вариационный размах ; n – объем выборки.

Полигон частот – ломаная линия, отрезки которой соединяют точки с координатами x i , n i .

5. Характеристики положения (мода, медиана, выборочное среднее) и рассеяния (выборочная дисперсия и выборочное среднее квадратическое отклонение).

Мода (М о ) это такое значение варианты, что предшествующее и следующее за ним значения имеют меньшие частоты встречаемости.

Для одномодальных распределений мода – это наиболее часто встречающаяся варианта в данной совокупности.

Для определения моды интервальных рядов служит формула:

M 0 =x ниж +i*((n 2 -n 1 )/(2n 2 -n 1 +n 3 )),

где х ниж – нижняя граница модального класса, т.е. класса с наибольшей частотой встречаемости n 2 ; n 2 – частота модального класса; n 1 – частота класса, предшествующего модальному; n 3 – частота класса, следующего за модальным; i – ширина классового интервала.

Медиана (М е )- это значение признака. Относительно которого ряд распределения делится на 2 равные по объему части.

Выборочная средняя – это среднее арифметическое значение вариант статистического ряда

Выборочная дисперсия – среднее арифметическое квадратов отклонения вариант от их среднего значения:

Среднее квадратическое отклонение это квадратный корень из выборочной дисперсии:

S в =√(S в 2 )

6. Оценка параметров генеральной совокупности по ее выборке (точечная и интервальная). Доверительный интервал и доверительная вероятность.

Числовые значения, характеризующие генеральную совокупность, называются параметрами.

Статистическое оценивание может выполняться двумя способами:

1)точечная оценка – оценка, которая дается для некоторой определенной точки;

2)интервальная оценка – по данным выборки оценивается интервал, в котором лежит истинное значение с заданной вероятностью.

Точечная оценка – это оценка, которая определяется одним числом. И это число определяется по выборке.

Точечная оценка называется состоятельной , если при увеличении объема выборки выборочная характеристика стремится к соответствующей характеристике генеральной совокупности.

Точечная оценка называется эффективной , если она имеет наименьшую дисперсию выборочного распределения по сравнению с другими аналогичными оценками.

Точечную оценку называют несмещенной , если ее математическое ожидание равно оценивающему параметру при любом объеме выборки.

Несмещенной оценкой генеральной средней (математического ожидания) служит выборочная средняя в:

в = i n i ,

где x i – варианты выборки; n i – частота встречаемости вариант x i ; n – объем выборки.

Интервальная оценка – это числовой интервал, который определяется двумя числами – границами интервала, содержащий неизвестный параметр генеральной совокупности.

Доверительный интервал – это интервал, в котором с той или иной заранее заданной вероятностью находится неизвестный параметр генеральной совокупности.

Доверительная вероятность p это такая вероятность, что событие вероятности (1-р) можно считать невозможным. α=1-р – это уровень значимости. Обычно в качестве доверительных вероятностей используют вероятности, близкие к 1. Тогда событие, что интервал накроет характеристику, будет практически достоверным. Это р≥0,95, р≥0,99, р≥0,999.

Для выборки малого объема (n<30) нормально распределенного количественного признака х доверительный интервал может иметь вид:

в - m t≤≤ в + m t (р≥0,95),

где – генеральное среднее; в – выборочное среднее; t – нормированный показатель распределения Стьюдента с(n-1) степенями свободы, который определяется вероятностью попадания генерального параметра в данный интервал; m – ошибка выборочной средней.

"

Характеристики рассеяния

Меры разброса выборки.

Минимум и максимум выборки - это соответственно наименьшее и наибольшее значение изучаемой переменной. Разность между максимумом и минимумом называется размахом выборки. Все данные выборки расположены в промежутке между минимумом и максимумом. Эти показатели как бы очерчивают границы выборки.

R№1= 15,6-10=5,6

R №2 =0,85-0,6=0,25

Дисперсия выборки (англ. variance ) и среднее квадратическое отклонение выборки (англ. standard deviation ) являют собой меру изменчивости переменной и характеризуют степень разброса данных вокруг центра. При этом среднее квадратическое отклонение является более удобным показателем в силу того, что имеет ту же размерность, что и собственно исследуемые данные. Поэтому показатель среднего квадратического отклонения используется наряду со значением среднего арифметического выборки для короткого описания результатов анализа данных.

Выборочную дисперсию при целесообразнее считать по формуле:

Стандартное отклонение считается по формуле:

Коэффициент вариации является относительной мерой рассеяния признака.

Коэффициент вариации используется и как показатель однородности выборочных наблюдений. Считается, что если коэффициент вариации не превышает 10 %, то выборку можно считать однородной, т. е. полученной из одной генеральной совокупности.

Т. к. коэффициент вариации в обеих выборках, то они являются однородными.

Выборку можно представить аналитически в виде функции распределения, а так же в виде таблицы частот, состоящей из двух строк. В верхней строке- элементы выборки (варианты), расположенные в порядке возрастания; в нижней строке записываются частоты вариант.

Частота варианты - число, равное количеству повторений данной варианты в выборке.

Выборка №1 «Матери»

Вид кривой распределения

Асимметрия или коэффициент асимметрии (термин был впервые введен Пирсоном, 1895) является мерой несимметричности распределения. Если асимметрия отчетливо отличается от 0, распределение асимметричное, плотность нормального распределения симметрична относительно среднего.

Показатель асимметрии (англ. skewness ) используется для того, чтобы охарактеризовать степень симметричности распределения данных вокруг центра. Асимметрия может принимать как отрицательные, так и положительные значения. Положительное значение данного параметра указывает на то, что данные смещены влево от центра, отрицательное - вправо. Таким образом, знак показателя асимметрии указывает на направление смещения данных, тогда как величина - на степень этого смещения. Асимметрия равная нулю говорит о том, что данные симметрично сконцентрированы вокруг центра.

Т.к. асимметрия положительная, следовательно, вершина кривой сдвигается влево от центра.

Коэффициент эксцесса (англ. kurtosis ) является характеристикой того, насколько кучно основная масса данных группируется около центра.

При положительном эксцессе - кривая заостряется, при отрицательном - сглаживается.

Кривая сглаживается;

Кривая заостряется.

Для математико-статистического анализа результатов выборки знать только характеристики положения недостаточно. Одна и та же величина среднего значе­ния может характеризовать совершенно различные выборки.

Поэтому кроме них в статистике рассматривают также характеристики рассеяния (вариации, или колеблемости ) результатов .

1. Размах вариации

Определение. Размахом вариации называется разница между наибольшим и наименьшим результатами выборки, обозначается R и определяется

R =X max - X min .

Информативность этого показателя невелика, хотя при малых объёмах вы­борки по размаху легко оценить разницу между лучшим и худшим результатами спортсменов.

2. Дисперсия

Определение. Дисперсией называется средний квадрат отклонения значений признака от среднего арифметического.

Для несгруппированных данных дисперсия определяется по формуле

где Х i – значение признака, - среднее арифметическое.

Для данных, сгруппированных в интервалы, дисперсия определяется по формуле

,

где х i – среднее значение i интервала группировки, n i – частоты интервалов.

Для упрощения расчётов и во избежание погрешностей вычисления при округ­лении результатов (особенно при увеличении объёма выборки) используются также другие формулы для определения дисперсии. Если среднее арифметическое уже вычислено, то для несгруппированных данных используется следующая фор­мула:

 2 =
,

для сгруппированных данных:

.

Эти формулы получаются из предыдущих раскрытием квадрата разности под знаком суммы.

В тех случаях, когда среднее арифметическое и дисперсия вычисляются од­новременно, используются формулы:

для несгруппированных данных:

 2 =
,

для сгруппированных данных:

.

3. Среднее квадратическое (стандартное ) отклонение

Определение. Среднее квадратическое (стандартное ) отклонение характе­ризует степень отклонения результатов от среднего значения в абсолютных единицах, т. к. в отличие от дисперсии имеет те же единицы измерения, что и результаты измерения. Иначе говоря, стандартное отклонение показывает плотность распределения результатов в группе около среднего значения, или однородность группы.

Для несгруппированных данных стандартное отклонение можно определить по формулам

 =
,

 =
или =
.

Для данных, сгруппированных в интервалы, стандартное отклонение определяется по формулам:

,

или
.

4. Ошибка средней арифметической (ошибка средней)

Ошибка средней арифметической характеризует колеблемость средней и вычисляется по формуле:

.

Как видно из формулы, с увеличением объёма выборки ошибка средней уменьшается пропорционально корню квадратному из объёма выборки.

5. Коэффициент вариации

Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах:

.

Считается, что если коэффициент вариации не превышает 10 %, то выборку можно считать однородной, то есть полученной из одной генеральной совокупности.

Вариационный ряд

В генеральной совокупности исследуется некоторый количественный признак. Из нее случайным образом извлекается выборка объема n , то есть число элементов выборки равно n . На первом этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел x1, x2, …, xn по возрастанию. Каждое наблюдаемое значение xi называется вариантой . Частота mi – это число наблюдений значения xi в выборке. Относительная частота (частость) wi – это отношение частоты mi к объему выборки n : wi=mi/n.

При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x , называется накопленной частотой: miнак=mi для xi называется накопленной частостью: wiнак=miнак/n.

Признак называется дискретно варьируемым, если его отдельные значения (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Вариационный ряд такого признака называется дискретным вариационным рядом.

Числовые характеристики вариационного ряда

Числовые характеристики вариационных рядов вычисляют по данным, полученным в результате наблюдений (статистическим данным), поэтому их называют также статистическими характеристиками или оценками. На практике часто оказывается достаточным знание сводных характеристик вариационных рядов: средних или характеристик положения (центральной тенденции); характеристик рассеяния или вариации (изменчивости); характеристик формы (асимметрии и крутости распределения).

Средняя арифметическая характеризует значения признака, вокруг которого концентрируются наблюдения, т.е. центральную тенденцию распределения.

Достоинство медианы как меры центральной тенденции заключается в том, что на нее не влияет изменение крайних членов вариационного ряда, если любой из них, меньший медианы, остается меньше ее, а любой, больший медианы, продолжает быть большее ее. Медиана предпочтительнее средней арифметической для ряда, у которого крайние варианты по сравнению с остальными оказались чрезмерно большими или малыми. Особенность моды как меры центральной тенденции заключается в том, что она также не изменяется при изменении крайних членов ряда, т.е. обладает определенной

Характеристики поло

Среднее арифметическое (выборочное среднее)

xв=i=1nmixin

Мода

Mo = xj, если mj = mmax

Me = xk+1, если n = 2k+1;

Me = (xk + xk+1)/2, если n = 2k

Характеристики рассеяния

Выборочная дисперсия

Dв=i=1nmixixв2n

Выборочное среднее квадратичное отклонение

σв=Dв

Исправленная дисперсия

S2=nn1Dв

Исправленное среднее квадратичное отклонение

Коэффициент вариации

V=σвxв∙100%

Среднее абсолютное

отклонение

θ=i=1nmixixвn

Вариационный размах

R = xmax xmin

Квартильный размах

Rкв = Qв – Qн

Характеристики формы

Коэффициент асимметрии

As=i=1nmixixв3nσв3

Коэффициент эксцесса

Ek=i=1nmixixв4nσв43

устойчивостью к вариации признака. Но наибольший интерес представляют меры вариации (рассеяния) наблюдений вокруг средних величин, в частности, вокруг средней арифметической. К таким оценкам относятся выборочная дисперсия и среднее квадратичное отклонение . Выборочная дисперсия обладает одним существенным недостатком: если среднее арифметическое выражается в тех же единицах, что и значения случайной величины, то, согласно определению, дисперсия выражается уже в квадратных единицах. Этого недостатка можно избежать, если использовать в качестве меры вариации признака среднее квадратичное отклонение. При малых объемах выборки дисперсия является смещенной оценкой, поэтому при объемах n 30 используют исправленную дисперсию и исправленное среднее квадратичное отклонение . Другой часто используемой характеристикой меры рассеяния признака является коэффициент вариации . Достоинством коэффициента вариации является то, что это безразмерная характеристика, позволяющая сравнивать варьирование несоизмеримых

вариационных рядов. Кроме того, чем меньше значение коэффициента вариации, тем однороднее совокупность по изучаемому признаку и типичнее средняя. Совокупности с коэффициентом вариации V > 3035% принято считать неоднородными.

Наряду с дисперсией используют и среднее абсолютное отклонение . Достоинством среднего линейного отклонения является его размерность, т.к. выражается в тех же единицах, что и значения случайной величины. Дополнительным и простым показателем рассеяния значений признака является квартильный размах. Квартильный размах включает в себя медиану и 50% наблюдений, отражающих центральную тенденцию признака, исключая наименьшие и наибольшие значения.

К характеристикам формы относят коэффициент асимметрии и эксцесс. Если коэффициент асимметрии равен нулю, то распределение имеет симметричную форму. Если распределение асимметрично, одна из ветвей полигона частот имеет более пологий спуск, чем другая. Если асимметрия правосторонняя, то справедливо неравенство: xв>Me>Mo, что означает преимущественное появление в распределении более высоких значений признака. Если асимметрия левосторонняя, то выполняется неравенство: , означающее, что в распределении чаще встречаются более низкие значения. Чем больше значение коэффициента асимметрии, тем более асимметрично распределение (до 0,25 асимметрия незначительная; от 0,25 до 0,5 умеренная; свыше 0,5 – существенная).

Эксцесс является показателем крутости (островершинности) вариационного ряда по сравнению с нормальным распределением. Если эксцесс положителен, то полигон вариационного ряда имеет более крутую вершину. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине. Если эксцесс отрицателен то полигон имеет более пологую вершину по сравнению с нормальной кривой. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от минимального до максимального значения. Чем больше абсолютная величина эксцесса, тем существеннее распределение отличается от нормального.

У нас самая большая информационная база в рунете, поэтому Вы всегда можете найти походите запросы

Эта тема принадлежит разделу:

Поверхностное пластическое деформирование (ППД)

Шпаргалки на экзамен. Детали машин, методы поверхностного пластического деформирования (ППД). Ответы

К данному материалу относятся разделы:

Явления, происходящие в поверхностном слое детали при обработке ППД, механизм упрочнения

Качество поверхности, получаемое при обкатывании роликовым инструментом. Схема процесса, величина давления, кратность приложения деформирующей силы, технологическая оснастка в процессах обкатывания шаровым инструментом.

Качество поверхности, получаемое при обкатывании шаровым инструментом. Схема процесса, величина давления, кратность приложения деформирующей силы, технологическая оснастка в процессах обкатывания шаровым инструментом.

Формообразование микропрофиля поверхности при обработке скользящим индентором, его назначение, технологическая оснастка в процессах вибрациионной упрочняющей обработки, область применения.

Формообразование микропрофиля поверхности при обработке вращающимся индентором, его назначение, технологическая оснастка в процессах вибрационной упрочняющей обработки, область применения.

Какое влияние оказывает угол сетки рисок абразивных зерен бруска на производительность процесса и качество обрабатываемой поверхности при суперфинишировании? Как настроить технологическую оснастку на получение определенного угла сетки рисок?

Как обеспечить получение системы параллельных каналов и правильную сетку каналов при обработке скользящим индентором в процессах ППД? Сравнительная характеристика этих сеток каналов и их влияние на эксплуатационные свойства поверхностей деталей машин.

Какими технологическими методами обеспечивается качество поверхностного слоя детали на отделочном этапе обработки? Приведите их сравнительную характеристику. Критерии выбора определенного метода для решения конкретной технической задачи.

Виброударная обработка, сущность процесса, область применения, технологическое оснащение.

Суперфиниширование, сущность процесса, область применения. Выбор размеров, способа крепления брусков и их правки в процессах суперфиниширования.

Классификация методов поверхностного пластического деформирования (ППД), сравнительная характеристика и особенности их применения. Технологическое оснащение процессов ППД.

Объясните термины: опорная длина профиля, опорная кривая профиля поверхности, приведите примеры микрогеометрии поверхностей, полученные различными технологическими методами и методику оценки их несущей способности.

Жесткий и упругий контакт в процессах ППД, и его технологическое обеспечение. Влияние вида контакта на качество поверхностного слоя.

Почему для повышения эксплуатационных параметров деталей применяют вибрационное пластическое деформирование? Сравните его с традиционными методами обкатывания и выглаживания без вибраций. Характеристика технологического оснащения этих сравниваемых методов

Явления, происходящие в поверхностном слое детали при обработке ППД, механизм формирования остаточных напряжений.

Поверхностное и объемное дорнование отверстий, сущность процесса,область применения, технологическое обеспечение дорнования.

Сравнительная характеристика методов шлифования: скоростное; силовое; совмещенное; интегральное; упрочняющее.

Понятие эксперимента. Ошибки измерений: промахи, систематические, случайные. Похожие материалы:

Особенности изучения темы «Алгоритмы» в начальной школе с применение компьютерных обучающих программ

Курсовая работа направление подготовки Педагогическое образование. Цель данной работы состоит в том, чтобы выявить и доказать необходимость и эффективность изучения алгоритмизации в начальной школе с применением компьютерных обучающих программ.

Топографічні карти універсального призначення

Реферат. Топографічні фотокарти суші та акваторії. Зарубіжні топографічні карти

Эстетика (Аристотель и Платон)

Аристотель, теории мимезиса, принцип соразмерности человека и прекрасного. Музыкальная эстетика, пифагорейская эстетика, Музыкально-математическая гармония. Идеалистическая эстетика Платона

Система применения удобрения в севообороте

Курсовой проект агрономического факультета. Кафедра агрохимии и почвоведения

Энергоэффективность в строительстве. Тепловая сушка

Часть курсового проекта. Тепловая экономичность сушильных установок. Воздушные завесы.

В описательной статистике центральное место занимает оценивание параметров выборки.

Точечное оценивание параметров распределения

Точечная оценка - количественная характеристика генеральной совокупности, функция от наблюдаемых случайных величин. Далее речь пойдет о точечном оценивании параметров распределения.

Рассмотрим свойства точечных оценок.

А) Несмещенной оценкой параметра θ называется статистическая оценка θ* , математическое ожидание которой равно θ : М (θ* )= θ .

Если М (θ* ) > θ (или М (θ* ) < θ ) , то возникает систематическая ошибка (неслучайная ошибка, искажающая результаты измерений в одну сторону). Несмещенность оценки является гарантией защиты от систематических ошибок.

Б) Однако несмещенная оценка не всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения θ* могут быть сильно рассеяны вокруг своего среднего значения (дисперсия D (θ* ) может быть велика). Тогда найденная по данной выборке оценка, например θ* 1 , может оказаться удаленной от М (θ* ), а значит и от θ . Поэтому естественным вслед за несмещенностью, является требование малости дисперсии.

Эффективной называют оценку, которая при данном объеме выборки имеет наименьшую дисперсию.

В) При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности. Состоятельной называют оценку, которая при n→∞ по вероятности стремиться к оцениваемому параметру:

Например, если дисперсия несмещенной оценки стремиться к нулю при n→∞, то такая оценка оказывается и состоятельной.

Перейдем к оцениванию параметров распределения.

Параметры распределения – это его числовые характеристики. Они указывают, где в среднем располагаются значения признака (мера положения ), насколько значения изменчивы (мера рассеяния), ихарактеризуют отклонение распределения от нормального (мера формы) . В реальных условиях исследования мы оперируем не параметрами, а их приближенными значениями – оценками параметров, которые являются функциями от наблюдаемых величин. Заметим, что чем больше выборка, тем ближе может быть оценка параметра к его истинному значению.



Пусть x 1 , x 2 , … x к вариационный ряд и n 1 , n 2 , … n к - частоты соответствующих вариант, n – объем выборки.

Показатели положения


Если дано интервальное статистическое распределение, то выборочная средняя определяется для соответствующих интервалов .

Где - середина интервала .

Выборочная средняя является несмещенной и состоятельной оценкой.

Медиана - значение признака, приходящееся на середину упорядоченного по возрастанию вариационного ряда. Если ряд состоит их (2N +1) вариант, то медианой является (N +1)-е значение варианта, если ряд состоит из 2N вариант, то медиана равна полусумме N – го и (N +1) – ого значений вариант.

Мода - вариант с наибольшей частотой. Если таких вариант несколько (у них одна и та же частота), то распределение называют полимодальным .

Показатели вариации

Размах – разница между наибольшим и наименьшим значениями вариант.

Выборочная дисперсия (оценка дисперсии) – характеристика рассеяния наблюдаемых значений количественного признака выборки вокруг своего среднего значения. Обозначим D в - выборочную дисперсию

Можно показать, что М(D в) = (n/(n-1))D в. Поэтому исправленная (несмещенная) дисперсия, которую будем обозначать через , равна


Кроме выборочной дисперсии для характеристики рассеяния пользуются сводной характеристикой - средним квадратическим отклонением (стандартом) σ
Выборочная асимметрия – характеристика симметричности распределения. Обозначается . Для симметричных распределений (в том числе для нормального распределения) асимметрия равна нулю. Если , то «длинная часть» кривой распределения расположена справа от математического ожидания, если , то слева от математического ожидания (рис.2.).

Выборочный эксцесс – характеристика «подъема, крутости» кривой распределения. Обозначается . Для нормального распределения эксцесс равен нулю. При , то кривая имеет более высокую и острую вершину, если , то кривая имеет более низкую вершину, чем нормальная кривая (рис.1).

Похожие статьи