Рефераты. Реферат: Обработка результатов эксперимента

Реферат: Обработка результатов эксперимента

Обработка результатов эксперимента

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ
1. ОШИБКИ ИЗМЕРЕНИЙ
1.1. Цели математической обработки результатов эксперимента
1.2. Виды измерений и причины ошибок
1.3. Типы ошибок измерения
1.4. Свойства случайных ошибок
1.5. Наиболее вероятное значение измеряемой величины
1.6. Оценка точности измерений
1.7. Понятие доверительного интервала и доверительной вероятности
1.8. Обнаружение промахов
1.9. Ошибки косвенных измерений
1.10. Правила округления чисел
1.11. Порядок обработки результатов измерений
1.12. Обработка результатов измерений диаметра цилиндра
Контрольные вопросы
2. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
2.1. Виды случайных величин и законы их распределения
2.2. Числовые характеристики случайных величин, заданных своими распределениями
2.3. Основные дискретные и непрерывные законы распределения
2.4. Понятие статистической гипотезы и статистического критерия
2.5. Вероятность ошибок первого и второго рода
2.6. Проверка гипотезы вида закона распределения вероятностей
Контрольные вопросы
3. НАХОЖДЕНИЕ ИНТЕРПОЛИРУЮЩИХ КРИВЫХ
3.1. Графический метод обработки результатов
3.2. Функциональные шкалы и их применение
3.3. Аналитические методы обработки результатов
3.3.1. Способ средней
3.3.2. Метод наименьших квадратов
3.3.3. Интерполирование функций
3.3.4. Параболическое интерполирование
Контрольные вопросы
4. ОСНОВЫ НОМОГРАФИИ
4.1. Номограммы в декартовой системе координат
4.2. Составные номограммы с помеченными линиями
Контрольные вопросы
5. ТИПОВЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
ЛИТЕРАТУРА

Изложены некоторые разделы математической обработки результатов наблюдений и экспериментов о действиях со случайными величинами, определения и оценки законов их распределения, аналитического и графического отображения результатов.

ВВЕДЕНИЕ

При исследовании технических систем могут использоваться теоретические и эмпирические методы познания. Каждое из этих направлений обладает относительной самостоятельностью, имеет свои достоинства и недостатки. В общем случае, теоретические методы в виде математических моделей позволяют описывать и объяснять взаимосвязи элементов изучаемой системы или объекта в относительно широких диапазонах изменения переменных величин. Однако при построении теоретических моделей неизбежно введение каких-либо ограничений, допущений, гипотез и т.п. Поэтому возникает задача оценки достоверности ( адекватности ) полученной модели реальному процессу или объекту. Для этого проводится экспериментальная проверка разработанных теоретических моделей. Практика является решающей основой научного познания. В ряде случаев именно результаты экспериментальных исследований дают толчок к теоретическому обобщению изучаемого явления. Экспериментальное исследование дает более точное соответствие между изучаемыми параметрами. Но не следует и преувеличивать результаты экспериментальных исследований, которые справедливы только в пределах условий проведенного эксперимента.

Таким образом, теоретические и экспериментальные исследования дополняют друг друга и являются составными элементами процесса познания окружающего нас мира.

Как правило, результаты экспериментальных исследований нуждаются в определенной математической обработке. В настоящее время процедура обработки экспериментальных данных достаточно хорошо формализована и исследователю необходимо только ее правильно использовать. Круг вопросов, решаемых при обработке результатов эксперимента, не так уж велик. Это - вопросы подбора эмпирических формул и оценка их параметров, вопросы оценки истинных значений измеряемых величин и точности измерений, вопросы исследования корреляционных зависимостей и некоторые другие.

Настоящее учебное пособие не претендует на оригинальность. Оно содержит некоторые результаты фундаментальных и прикладных работ в области обработки результатов экспериментальных исследований [1...13]. Пособие может служить практическим руководством по обработке результатов эксперимента как студентам, так и научным сотрудникам и инженерам.

1. ОШИБКИ ИЗМЕРЕНИЙ

Основой всего естествознания является наблюдение и эксперимент.

Наблюдение - это систематическое, целенаправленное восприятие того или иного объекта или явления без воздействия на изучаемый объект или явление. Наблюдение позволяет получить первоначальную информацию по изучаемому объекту или явлению.

Эксперимент - метод изучения объекта, когда исследователь активно и целенаправленно воздействует на него путем создания искусственных условий или использует естественные условия, необходимые для выявления соответствующих свойств. Достоинствами эксперимента по сравнению с наблюдением реального явления или объекта является:

1. Возможность изучения в “чистом виде”, без влияния побочных факторов, затемняющих основной процесс;

2. В экспериментальных условиях можно получить результат более быстро и точно;

3. При эксперименте можно проводить испытания столько раз, сколько это необходимо.

Результат эксперимента или измерения всегда содержит некоторую погрешность. Если погрешность мала, то ею можно пренебречь. Однако при этом неизбежно возникают два вопроса: во- первых, что понимать под малой погрешностью, и, во- вторых, как оценить величину погрешности. То есть, и результаты эксперимента нуждаются в определенном теоретическом осмыслении.

1.1. Цели математической обработки результатов эксперимента

Целью любого эксперимента является определение качественной и количественной связи между исследуемыми параметрами, либо оценка численного значения какого-либо параметра.

В некоторых случаях вид зависимости между переменными величинами известен по результатам теоретических исследований. Как правило, формулы, выражающие эти зависимости, содержат некоторые постоянные, значения которых и необходимо определить из опыта.

Другим типом задачи является определение неизвестной функциональной связи между переменными величинами на основе данных эксперимента. Такие зависимости называют эмпирическими.

Однозначно определить неизвестную функциональную зависимость между переменными невозможно даже в том случае, если бы результаты эксперимента не имели ошибок. Тем более не следует этого ожидать, имея результаты эксперимента, содержащие различные ошибки измерения.

Поэтому следует четко понимать, что целью математической обработки результатов эксперимента является не нахождение истинного характера зависимости между переменными или абсолютной величины какой-либо константы, а представление результатов наблюдений в виде наиболее простой формулы с оценкой возможной погрешности ее использования.

1.2. Виды измерений и причины ошибок

Под измерением понимают сравнение измеряемой величины с другой величиной, принятой за единицу измерения.

Различают два типа измерений: прямые и косвенные. При прямом измерении измеряемая величина сравнивается непосредственно со своей единицей меры. Например, измерение микрометром линейного размера, промежутка времени при помощи часовых механизмов, температуры - термометром, силы тока - амперметром и т.п. Значение измеряемой величины отсчитывается при этом по соответствующей шкале прибора.

При косвенном измерении измеряемая величина определяется (вычисляется) по результатам измерений других величин, которые связаны с измеряемой величиной определенной функциональной зависимостью. Например, измерение скорости по пройденному пути и затраченному времени, измерение плотности тела по измерению массы и объема, температуры при резании по электродвижущей силе, величины силы - по упругим деформациям и т.п.

При измерении любой физической величины производят проверку и установку соответствующего прибора, наблюдение их показаний и отсчет. При этом никогда истинного значения измеряемой величины не получить. Это объясняется тем, что измерительные средства основаны на определенном методе измерения, точность которого конечна. При изготовлении прибора задается класс точности. Его погрешность определяется точностью делений шкалы прибора. Если шкала линейки нанесена через 1 мм , то точность отсчета
0,5 мм не изменить если применим лупу для рассматривания шкалы. Аналогично происходит измерение и при использовании других измерительных средств.

Кроме приборной погрешности на результат измерения влияет еще ряд объективных и субъективных причин, обуславливающих появление ошибки измерения - разности между результатом измерения и истинным значением измеряемой величины. Ошибка измерения обычно неизвестна, как неизвестно и истинное значение измеряемой величины. Исключение составляют измерения известных величин при определении точности измерительных приборов или их тарировке. Поэтому одной из важнейших задач математической обработки результатов эксперимента и является оценка истинного значения измеряемой величины по данным эксперимента с возможно меньшей ошибкой.

1.3. Типы ошибок измерения

Кроме приборной погрешности измерения (определяемой методом измерения) существуют и другие, которые можно разделить на три типа:

1. Систематические погрешности обуславливаются постоянно действующими факторами. Например, смещение начальной точки отсчета, влияние нагревания тел на их удлинение, износ режущего лезвия и т.п. Систематические ошибки выявляют при соответствующей тарировке приборов и потому они могут быть учтены при обработке результатов измерений.

2. Случайные ошибки содержат в своей основе много различных причин, каждая из которых не проявляет себя отчетливо. Случайную ошибку можно рассматривать как суммарный эффект действия многих факторов. Поэтому случайные ошибки при многократных измерениях получаются различными как по величине, так и по знаку. Их невозможно учесть как систематические, но можно учесть их влияние на оценку истинного значения измеряемой величины. Анализ случайных ошибок является важнейшим разделом математической обработки экспериментальных данных.

3. Грубые ошибки (промахи) появляются вследствие неправильного отсчета по шкале, неправильной записи, неверной установки условий эксперимента и т.п. Они легко выявляются при повторном проведении опытов.

В дальнейшем будем считать, что систематические и грубые ошибки из результатов эксперимента исключены.

1.4. Свойства случайных ошибок

Случайные ошибки бывают как положительные, так и отрицательные разной величины, не превосходящей определенного предела. Если обозначить через Х истинное значение измеряемой величины, а результат первого измерения - а1, то разность

Х - а1 = х1 или а1 - Х = х1

называют истинной абсолютной ошибкой одного измерения. Одновременно она является случайной (при исключении систематических и грубых ошибок).

Если измерения провести многократно в одних и тех же условиях, то результаты отдельных измерений одинаково надежны. Такую совокупность измерений а1, а2 ...аn называют равноточными измерениями. Если проанализировать достаточно большую серию равноточных измерений и соответствующих случайных ошибок измерений, то можно выделить 4 свойства случайных ошибок:

1. Число положительных ошибок почти равно числу отрицательных;

2. Мелкие ошибки встречаются чаще, чем крупные;

  1. Величина наиболее крупных ошибок не превосходит некоторого определенного предела, зависящего от точности измерения. Самую большую ошибку в ряду равноточных измерений называют предельной ошибкой;

4. Частные от деления алгебраической суммы всех случайных ошибок на их общее близко к нулю, т.е.


На основе указанных свойств при учете некоторых допущений математически достаточно строго выводится закон распределения ошибок, описываемый следующей функцией:


,

где s - дисперсия измерений (см. ниже);

е - основание натуральных логарифмов;

х - истинная абсолютная ошибка измерений.

Закон распределения случайных ошибок является основным в математической теории погрешностей. Иначе его называют нормальным законом распределения. Особое значение в пользу широкого использования закона Гаусса имеет следующее обстоятельство: если суммарная ошибка измерения появляется в результате совместного действия ряда причин, каждая их которых вносит малую долю в общую ошибку (т.е. нет доминирующих причин), то по какому бы закону не были распределены ошибки, вызываемые каждой из причин, результат их совместного действия приведет

к нормальному распределению ошибок. Эта закономерность является следствием так называемой центральной предельной теоремы Ляпунова и хорошо соотносится с введенным понятием случайной ошибки.

Наряду с нормальным законом распределения ошибок могут встречаться и другие.

1.5. Наиболее вероятное значение измеряемой величины

Допустим, что для определения истинного значения Х измеряемой величины было сделано n равноточных измерений с результатами а1, а2 .. .аn. Естественно, что ряд этих чисел будет больше Х, другие меньше Х и неясно, какое из этих чисел ближе всего подходит к Х.

Представим результаты измерений в виде очевидных равенств:

а1 = Х - Dх1; а2 = Х - Dх2; ... ; аn = Х - Dхn.

Естественно, что истинные абсолютные ошибки D хi могут принимать как положительные, так и отрицательные значения.

Суммируя левые и правые стороны равенств получим


Поделим обе части равенства на число измерений n и получим


.

Величина
является среднеарифметическим величины Х. Если число n достаточно велико ( при n® ¥), то согласно четвертому свойству случайных ошибок


.

Это же видно и по кривой Гаусса (рис. 1), где всякой положительной погрешности соответствует равная ей отрицательная.

Из изложенного следует, что

Х = а при n ® ¥ ,

т.е. при бесконечном числе измерений истинное значение измеряемой величины равно среднеарифметическому значению результатов всех измерений. При ограниченном числе измерений истинное значение будет отличаться от среднеарифметического и необходимо оценить величину этого расхождения: Х = а ± Dх.

Следует еще раз подчеркнуть, что среднеарифметическое значение, принимаемое за истинное значение измеряемой величины, является наиболее вероятным значением. Среди значений аi могут оказаться значения, которые в действительности ближе к истинному значению.

Отклонение D х вероятнейшего значения а от его истинного значения Х называют истинной абсолютной ошибкой.

1.6. Оценка точности измерений

Для ряда равноточных измерений а1, а2 ...аn определим его среднеарифметическое значение а и составим разности (а - а1), (а - а2), ..., (а - аn).

Каждую из этих разностей называют вероятнейшей ошибкой отдельного измерения (Vi). Вероятнейшие ошибки, как и истинные ошибки D хi = (Х - аi), бывают положительные и отрицательные, нулевые. Рассмотрим


т.е. алгебраическая сумма вероятнейших ошибок равна нулю при любом числе измерений. Истинные случайные ошибки таким свойством не обладают.

Вероятнейшие ошибки Vi лежат в основе математической обработки результатов измерений: именно по ним вычисляют предельную абсолютную ошибку D аi среднеарифметического а и тем самым оценивают точность результата измерений.

Средняя истинная случайная ошибка (иначе - среднее отклонение отдельного измерения) определяется выражением (D х1+Dх2+...+Dхn)/ n.

Величина [ (Dх1)2+(Dх2)2+...+(Dхn)2] / n представляет средний квадрат случайной ошибки или дисперсию S2 выборки (при ограниченном n) или генеральной совокупности s 2 (при бесконечном n). Средняя квадратичная ошибка отдельного измерения S =
является лучшим критерием точности, чем средняя случайная ошибка, т.к. не происходит компенсации положительных и отрицательных ошибок D хi и сильнее учитывается действие крупных ошибок.

Поскольку истинное значение Х измеряемой величины неизвестно, то неизвестны и истинные случайные ошибки
хi. Для определения средней квадратичной ошибки S используется положение теории случайных ошибок, что при большом числе измерений n справедливо равенство


.

Различный знаменатель объясняется тем, что величины
хi являются независимыми, а из n величин Vi независимыми являются n-1, т.к. в величину Vi входит а, само определяемое из этих же n измерений.

Важно, что не зная самих истинных случайных ошибок удается вычислить среднюю квадратичную ошибку определенного измерения:


.

Оценим теперь погрешность результата всей серии эксперимента, т.е. определим величину D х = Х - а.

Для этого проведем преобразование выражения

Sn2 =

=

=

.


Если повторить серии по n измерений в каждой N ðàç, ìîæíî ïîëó÷ить средние значения а1, а2, ... , аN и погрешности результатов измерений

(Dх)1 = (Х - а1); (Dх)2 = (Х - а2); ... ; (Dх)N = (Х - аN)

и среднюю среднеквадратичную погрешность серии

Sa2 =
.

При большом числе N S2a ® s 2a


Усредняя выражение S2n по числу серий N, получаем

Sa2 = (D x)2 = Sn2 -
.

Учитывая что при большом n S2n ® s 2 и S2 ® s 2 получаем искомую

связь между дисперсиями всего опыта s 2a и отдельного эксперимента s 2


,

т.е. дисперсия s 2a результата серии из n измерений в n раз меньше дисперсии отдельного измерения. При ограниченном числе n измерений приближенным выражением s 2a будет S2a


.

Выражения s 2a и S2a отражают фундаментальный закон возрастания точности при росте числа наблюдений. Из него следует, что желая повысить точность измерений в 2 раза мы должны сделать вместо одного - четыре измерения; чтобы повысить точность в 3 раза, нужно увеличить число измерений в 9 раз и т.д.

1.7. Понятие доверительного интервала и доверительной вероятности

Как установлено ранее, истинное значение измеряемой величины Х отличается от среднеарифметического a на некоторую величину D x. На рис. 2 представлено расположение истинного значения Х и а, полученного из некоторых измерений а1, а2, а3.

Ясно, что случайные величины а1, а2, а3 обусловят случайный характер абсолютной погрешности D x результата серии измерений, которая будет распределена по закону Гаусса:


.

Тогда вместо выражения Х = а ± Dх можно записать а - Dх £ Х £ а + D .

Интервал (а - Dх; а + D х), в который по определению попадает истинное значение X называют доверительным интервалом. Надежностью ( уровнем значимости) результата серии измерений называется вероятность a того, что истинное значение X измеряемой величины попадет в доверительный интервал. Вероятность a выражается в долях единицы или процентах. Графически надежность отражается площадью под кривой нормального распределения в пределах доверительного интервала, отнесенной к общей площади. Выбор надежности определяется характером производимых измерений. Например, к деталям самолета предъявляются более жесткие требования, чем к лодочному мотору, а к последнему значительно больше, чем к ручной тачке. При обычных измерениях ограничиваются доверительной вероятностью 0,90 или 0,95. Для любой величины доверительного интервала ( выраженного в долях s ) по формуле Гаусса может быть просчитана соответствующая доверительная вероятность. Эти вычисления проделаны и сведены в таблицу, имеющуюся практически во всей литературе по теории вероятности. На рис. 3 представлены значения надежности a при величине доверительного интервала ± s , ± 2s , ± 3s. Эти значения доверительной вероятности рекомендуется запомнить.

По рис. 3 видно, что величина абсолютной погрешности D x может быть представлена в виде К× s а, где К некоторый численный коэффициент, зависящий от надежности a . Однако это справедливо лишь для большого ( бесконечного) числа n. При малых n этим коэффициентом пользоваться нельзя, т.к. величина s а неизвестна. Для того, чтобы получить оценки границ доверительного интервала при малом n вводится новый коэффициент t a . Этот коэффициент предложен английским математиком и химиком В.С. Госсетом, публиковавшим свои работы под псевдонимом ² Стьюдент ² .

И коэффициент t a назвали коэффициентом Стьюдента. Коэффициент Стьюдента отражает распределение случайной величины t =

при различном n. При n® ¥ ( практически при n ³ 20 ) распределение Стьюдента переходит в нормальное распределение. Значения коэффициента Стьюдента также приводятся практически во всей литературе по теории вероятности.

Зная величину t a можно определить величину абсолютной погрешности D х = t× Sa . Следует отметить, что величина абсолютной погрешности еще не определяет точность измерений. Точность измерений характеризует относительная погрешность, равная отношению абсолютной погрешности D x результата измерений к результату измерений а: e = ± Dх / а. .

1.8. Обнаружение промахов

Если в ряду измерений встречаются результаты, резко отличающиеся от большей части ряда, то возникает вопрос принадлежности ² выскакивающих ² значений этому ряду измерений. Большие ошибки имеют малую вероятность возникновения. Поэтому следует объективно оценить, является ли данное измерение промахом ( тогда его исключают из ряда ) или же это результат случайного, но совершенно закономерного отклонения. Можно считать каждое измерение промахом, если вероятность случайного появления такого значения является достаточно малой.

Если известно точное значение s , то вероятность появления значения, отличающегося от среднеарифметического а более чем на 3s £ 0,003 и все измерения, отличающиеся от а на 3s ( и больше ) могут быть отброшены, как маловероятные.

Следует иметь в виду, что для совокупности измерений вероятность появления измерения ³ 3s от а всегда больше 0,003. Действительно, вероятность того, что результат каждого измерения не будет отличаться от истинного более чем 3s составляет 1- 0,003 = 0,997. Вероятность того, что все n измерений не будут отличаться от среднего более чем на 3s по правилу умножения вероятностей составит ( 1 - 0,003 ) n. Для не слишком большого n

(1 - 0,003)n » 1 - 0,003× n.

Это значит, что вероятность того, что из 10 измерений хотя бы одно будет случайно отличаться от среднего более чем на 3s будет уже не 0,003, а 0,03 или 3%. А при 100 измерениях вероятность такого события составит уже около 30%.

Обычно число измерений не очень велико. При этом точное значение s не известно, следовательно, отбрасывать измерения, отличающиеся от среднего более чем на 3s , нельзя.

Для оценки вероятности b случайного появления ² выскакивающих² значений в ряду n измерений составлены соответствующие таблицы.

Для применения таблицы вычисляется среднее арифметическое а и средняя квадратичная погрешность S n из всех измерений, включая и подозреваемое значение аk . Затем вычисляется уклонение подозреваемого значения аk от среднего арифметического в долях среднеквадратичной ошибки

Vмакс =
.

По таблице определяется какой вероятности b соответствует полученное значение Vмакс.

Если вероятность появления данного измерения в ряду лежит в диапазоне 0,1 > b > 0,01, то представляется одинаково правильным - оставить это измерение или отбросить. В случае же, когда b выходит за указанные пределы, вопрос об отбрасывании решается практически однозначно. Решая вопрос об отбрасывании полезно посмотреть, как сильно оно меняет окончательный результат по а и S n.

1.9. Ошибки косвенных измерений

Часто измеряется не непосредственно интересующая нас величина, а другая, зависящая от нее некоторым образом. Например, при резании металлов часто непосредственно измеряются деформации, ЭДС, по которым судят о возникающих силах и температурах. При этом также необходимо оценить ошибку измерения.

При косвенных измерениях значение y измеряемой величины находят по некоторой формуле

y = ¦ (х1, х2, ... , хm),

где x1, x2, ... xm - средние арифметические измеряемые ( непосредственно) величины. Рассмотрим функцию общего вида

y = ¦ (х1, х2, ... , хm)

где x1, x2, ... , xm - независимые переменные, для определения которых производятся n прямых независимых измерений по каждой xi.

Обозначим значения переменных через среднее значение и отклонения

y ± D y = ¦ (x1 ± D x1, x2 ± D x2, ... , xm ± D xm).

Эту функцию представим рядом Тейлора, ограничив его первыми членами ряда ( принимая D xi < < xi )

y ± D y = ¦ (х1, х2, ... , хn) ±
,

где


- производная функции по xi, взятая в точке xi.

Учитывая, что y = ¦ (x1, x2, ... , xm) получаем

D y =
.

Чтобы учесть погрешности D xi всех n опытов целесообразно использовать средние квадратические оценки ( D xi )2, так как D xi = 0.

Возведем в квадрат левую и правую части уравнения и разделим на n


.

Здесь суммы удвоенных произведений типа


согласно четвертому свойству случайных ошибок ( D xi = 0 ).

Тогда в левой и правой частях имеем среднеквадратические погрешности функции и аргументов

S
.

Пример. При тарировке динамометра было получено уравнение зависимости силы от отклонения l луча осциллографа вида P = 25 l. Точность измерения отклонения D l = 1 мм. Тогда

D P =
.

В качестве меры точности лучше выступает не абсолютная, а относительная погрешность.

e
.

Рассмотрим ее определение на примере. Пусть

y = cx1a × x2b × x3g .

Тогда


;

;

.




=
.

Аналогично можно определить относительную погрешность и при других зависимостях. Зная относительную погрешность, можно определить и абсолютное ее значение:

D y = y× e y.

1.10. Правила округления чисел

Величина погрешности результата измерений физической величины дает представление о том, какие цифры в числовом значении измеряемой величины сомнительны. Поэтому результаты измерений следует округлять перед тем, как производить с ними дальнейшие вычисления.

Округлять числовое значение результата измерений следует в соответствии с числовым разрядом значащей цифры погрешности. При этом выполняют общие правила округления.

Лишние цифры в целых числах заменяются нулями, а в десятичных дробях отбрасываются ( как и лишние нули ). Например, если погрешность измерения ± 0,001 мм, то результат 1,07005 округляется до 1,070.

Если первая из изменяемых нулями и отбрасываемых цифр меньше 5, остающиеся цифры не изменяются. Например, число 148935, точность измерения ± 50, округление: 148900.

Если первая из заменяемых нулями или отбрасываемых цифр равна 5, а за ней не следует никаких цифр или идут нули, то округление производится до ближайшего четного числа. Например, число 123,50 округляется до 124.

Если первая из заменяемых нулями или отбрасываемых цифр больше 5 или равна 5, но за ней следует значащая цифра, то последняя остающаяся цифра увеличивается на единицу. Например, число 6783,6 округляется до 6784.

1.11.Порядок обработки результатов измерений

При практической обработке результатов измерений можно последовательно выполнить следующие операции:

  1. Записать результаты измерений;
  2. Вычислить среднее значение из n измерений

а =

  1. Определить погрешности отдельных измерений Vi = а - аi;
  2. Вычислить квадраты погрешностей отдельных измерений Vi 2;
  3. Если несколько измерений резко отличаются по своим значениям от остальных измерений, то следует проверить не являются ли они промахом. При исключении одного или нескольких измерений п.п.1...4 повторить;
  4. Определяется средняя квадратичная погрешность результата серии измерений

  1. Задается значение надежности a ;

  2. Определяется коэффициент Стьюдента t a (n) для выбранной надежности a и числа проведенных измерений n;
  3. Находятся границы доверительного интервала

Dх = t a (n)× Sa

  1. Если величина погрешности результата измерений (п.9) окажется сравнимой с величиной d погрешности прибора, то в качестве границы доверительного интервала следует взять величину

.
  1. Записать окончательный результат

X = a ± D x ;

Оценить относительную погрешность результата серии измерений

e =
.

1.12.Обработка результатов измерений диаметра цилиндра

Микрометром было сделано десять замеров диаметра цилиндра. Цена деления микрометра 0,01 мм. Определить диаметр цилиндра с надежностью a = 0,95 и a = 0,99. Оценить влияние числа замеров на точность получаемого результата.

аi: 14,85; 14,80; 14,84; 14,81; 14,79;

14,81; 14,80; 14,85; 14,84; 14,80.

  1. Для первых пяти измерений определим среднеарифметическое значение и границы доверительного интервала. Для удобства расчетов выберем произвольное число ао удобное для расчетов (ао = 14,80 мм) и определим разности (аi - ао) и квадраты этих разностей. Результаты сведены в таблицу.

i

аi, мм

аi - ао, мм

(аi - ао)2, мм2

1

14, 85

0, 05

0, 0025

2

14, 80

0, 00

0, 0000

3

14, 84

0, 04

0, 0016

4

14, 81

0, 01

0, 0001

5

14, 79

- 0, 01

0, 0001


0, 09

0, 0043

Найдем среднее значение а и среднеквадратичное отклонение S а:


а - ао = 0, 018 мм;



( мм2 );

( мм ).

Для надежности a = 0,95 и n = 5 t a = 2,78. Абсолютная погрешность измерения D х:

Dх = t a × Sа = 2,78 × 0,0116 = 0,0322 мм.

Результат измерения можно представить в виде

(14,818 - 0,032) мм £ а £ ( 14,818 + 0,032) мм

или сохраняя в величине погрешности одну значащую цифру

(14,82 - 0,03) мм £ а £ ( 14,82 + 0,03) мм,

т.е. 14,79 мм £ а £ 14,85 мм или а = ( 14,82 ± 0,03) мм.

Относительная погрешность

e а =
.

Теперь найдем абсолютную и относительную погрешность этих измерений при a = 0,99.

В этом случае t a = 4,60. Тогда

Dх = t a × Sa = 4,60× 1,16× 10-2 = 5,34× 10-2 ( мм ).

Следовательно а = ( 14,82 ± 0,05) мм

e а =
.

Видно, что с увеличением надежности границы доверительного интервала возросли, а точность результата уменьшилась.

  1. Проведем расчет погрешностей для этих же пяти измерений, незаконно полагая, что s 2 = S 2n (что при n = 5 ошибочно). Для этого используем распределение Гаусса (а не Стюарта). При a = 0,95 ka =

Это дает возможность определить

Dх = ka × Sa = 1,96× 1,16× 10-2 » 2× 10-2 ( мм ),

т.е. погрешность получилась меньше примерно на 30%. Если по этой величине погрешности определить величину надежности при t a = ka, то из таблицы коэффициентов Стьюдента получим a < 0,90 вместо заданной a = 0,95. Следовательно при малом числе измерений n применение закона нормального распределения с s 2 = S2n вместо распределения Стьюдента приводит к уменьшению надежности результата измерений.

  1. Найдем средние значения и погрешности следующих пяти измерений

i

аi, мм

аi - ао, мм

(аi - ао)2, мм2

1

14, 81

0, 01

0, 0001

2

14, 80

0, 00

0

3

14, 85

0, 05

0, 0025

4

14, 84

0, 04

0, 0016

5

14, 80

0, 00

0


0, 10

0, 0042

ао = 14, 80 мм;

а = ао +
( мм );

а - ао = 0, 02 мм;




( мм2 );

Sa = 1, 05× 10-2 мм.

При a = 0,95:

Dх = t a × Sa = ± 2,78× 1,05× 10-2 = 2,92× 10-2 ( мм );

e а =
;

Х = 14, 82 ± 0, 03 мм.

При a = 0,99:

Dх = ± 4,60× 1,05× 10-2 » 5× 10-2 ( мм );

e а = ±

Х = 14, 82 ± 0,05 мм.

Результаты практически не отличаются, от результатов полученных из первой серии.

  1. Найдем теперь погрешность результата всей серии из десяти измерений. В этом случае
    (мм);
    (мм2).

Эти величины получаются суммированием последних строк из таблиц частных серий.

ао = 14, 80 мм;

а = ао +
( мм );

а - ао = 0, 019 мм.

Sa2 =

=
( мм2 );

Sa = 7, 35× 10-3 мм.

При a = 0,95 имеем

Dх = ta × Sa = ± 2,26× 7,35× 10-3 = ± 1,7× 10-2 ( мм );

e а =
;

а = 14, 819 ± 0, 017 мм.

При a = 0,99 получаем

Dх = ta × Sa = ± 3,25× 7,35× 10-2 = ± 2,4× 10-2 ( мм );

e а =
;

а = 14, 819 ± 0, 024 мм.

Видно, что абсолютная и относительная погрешность результата десяти измерений стали почти в два раза меньше погрешностей пяти измерений.

Применение нормального распределения с s 2 = S2n дает в случае a = 0,95 ka = 1,96 и D х = 1,4 × 10- 2 мм, а величина надежности понижается до 0,91; в случае a = 0,99 получаем ka = 2,58 и D х = 1,9 × 10- 2 мм, а величина надежности понижается до a = 0,97.

Как видно, с ростом числа измерений различие между результатами, вычислениями по распределению Стьюдента и по нормальному распределению уменьшается.

Контрольные вопросы

  1. Цель математической обработки результатов эксперимента;
  2. Виды измерений;
  3. Типы ошибок измерения;
  4. Свойства случайных ошибок;
  5. Почему среднеарифметическое значение случайной величины при нормальном законе ее распределения является вероятнейшим значением?
  6. Что такое истинная абсолютная и вероятнейшая ошибки отдельного измерения?
  7. Что такое доверительный интервал случайной величины?
  8. Что такое уровень значимости (надежности) серии измерений?
  9. Геометрический смысл уровня значимости;
  10. Почему при малом числе опытов нельзя погрешность измерений представить в виде D х = ± Ks а?
  11. Что является критерием “ случайности” большого отклонения измеряемой величины?
  12. Чем определяется величина случайной ошибки косвенных измерений?
  13. Чем определяется точность числовой записи случайной величины?

2. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН

При характеристике случайных величин недостаточно указать их возможные значения. Необходимо еще знать насколько часто возникают различные значения этой величины. Это характеризуется вероятностью p отдельных ее значений.

Соотношение, устанавливающее связь между значениями случайной величины и вероятностями этих значений, называют законом распределения случайной величины. Различают интегральный и дифференциальный законы распределения.

2.1. Виды случайных величин и законы их распределения

Под случайной величиной понимается величина, принимающая в результате опыта какое либо числовое или качественное значение.

Случайная величина, принимающая конечное число или последовательность различных значений, называется дискретной случайной величиной. Случайная величина, принимающая все значения из некоторого интервала, называется непрерывной случайной величиной.

Под интегральным законом распределения (или функцией распределения) F (х) случайной величины Х понимают вероятность p того, что случайная величина Х не превысит некоторого ее значения х

F (х) = p (Х < х).

Основным свойством интегрального распределения является монотонное не убывание в ограниченном диапазоне [ 0; 1 ] .

Действительно, если х1 и х2 некоторые значения случайной величины Х. Причем х2 > х1, то очевидно, что событие p (Х < х2) ³ p (Х < х1), т.к. между значениями х1 и х2 могут быть и промежуточные. Из определения интегрального закона следует, что F (х2) ³ F (х1), что говорит о монотонном не убывании функции. Очевидно также, что

F (- ¥ ) = p (Х < - ¥ ) = 0;

Þ F (¥ ) - F (- ¥ ) = 1,

F (+ ¥ ) = p (Х < ¥ ) = 1;

т.е. F (х) изменяется в диапазоне от 0 до 1.

Для дискретной случайной величины

F (x) = P (X < x) = P (- ¥ < X < x) =
,


где суммирование распространяется на хi < х. В промежутке между двумя последовательными значениями Х функция F (х) постоянна. При переходе аргумента х через значение хi F (х) скачком возрастает на величину p (Х = хi).

Рассмотрим p (х1 £ Х < х2). Если х2 > х1, то очевидно, что

p (Х < х2) = p (Х < х1) + p (х1 £ Х < х2).

Тогда

p (х1 £ Х < х2) = p (Х < х2) - p (Х < х1) = F (х2) - F (х1),

т.е. вероятность попадания случайной величины в интервал [ х1; х2) равен разности значений интегральной функции граничных точек.

Последнее условие можно использовать для нахождения вероятности p (Х = х1) для непрерывной случайной величины. Для этого рассмотрим предел

p (X = x1) =
,

т.е. если закон распределения случайной величины есть функция непрерывная, то вероятность того, что случайная величина примет заранее заданное значение, равна нулю.

Здесь видно различие между дискретными и непрерывными случайными величинами. Для дискретных случайных величин, для каждого значения случайной величины существует своя вероятность. И для него справедливо утверждение: событие, вероятность которого равна нулю, невозможно. Для непрерывной случайной величины это утверждение неверно. Как показано, вероятность того, что Х = х1 ( где х1- заранее выбранное число) равна нулю, это событие не является невозможным.

Рассмотрим непрерывную случайную величину Х, интегральный закон которой предполагается непрерывным и дифференцируемым. Функцию

¦ (х) = F¢ (х)

называют дифференциальным законом распределения или плотностью вероятности случайной величины Х. Из определения производной можно записать

¦ (x) = F¢ (x) =
,

т.е. плотность вероятности случайной величины Х в точке х равна пределу отношения вероятности попадания величины Х в интервал (х; х + Dх) к D х, когда D х стремится к нулю.

Используя понятия интегральной функции распределения и определенного интеграла можно записать

¦ (x) = F¢ (x) или F (x) = p (x1 < X < x2) =
.

Это соотношение имеет простое геометрическое толкование (рис. 5).

Если
определяет заштрихованную область в соответствующих пределах, то

p (х < Х < х + Dх) » ¦ (х) D х.

Из свойств интегрального распределения следует


.

Зная дифференциальный закон распределения можно определить интегральный закон распределения

F (x) =
.

2.2. Числовые характеристики случайных величин, заданных своими распределениями

Основными характеристиками случайной величины, заданной своими распределениями, является математическое ожидание ( или среднее значение ) и дисперсия.

Математическое ожидание случайной величины является центром ее распределения. Дисперсия характеризует отклонение случайной величины от ее среднего значения.

Если Х дискретная случайная величина, значения хi которой принимают с вероятностью pi, так, что
, то математическое ожидание М (Х) случайной величины Х определяется равенством

M (X) =
,

т.е. суммой произведений всех ее возможных значений на соответствующие вероятности.

Математическим ожиданием непрерывной случайной величины является аналог его дискретного выражения

M (X) =
.

Действительно, все значения в интервале (х; х + Dх) можно считать примерно равными х, а вероятность таких значений равна ¦ (х) dx (см. ранее). Поэтому значения хi дискретного распределения заменяются х, а вероятности pi - на ¦ (х) dx, а сумма заменяется интегралом.

Дисперсией или рассеянием случайной величины Х называется математическое ожидание квадрата разности случайной величины и ее математического ожидания.

D (Х) = М [ Х - М (Х)] 2 = М (Х - х)2 = s 2 (х)

Если случайная величина Х дискретна и принимает значения хi с вероятностями pi, то случайная величина (Х - х)2 принимает значения (хi - х)2 с вероятностями Рi. Поэтому для дискретной случайной величины имеем

D (X) =

Аналогично для непрерывной случайной величины получаем

D (X) =
.

Чем меньше величина дисперсии, тем лучше значения случайной величины характеризуются ее математическим ожиданием.

2.3. Основные дискретные и непрерывные законы распределения

Как отмечалось ранее, очень часто случайная величина распределена по нормальному закону. Но существуют и другие распределения, имеющие практическое значение. Рассмотрим некоторые из них по условиям возникновения и основным параметрам их характеризующим.

  1. Равномерное распределение вероятностей.

Пусть плотность вероятности А равна нулю всюду, кроме интервала (a; b), на котором она постоянна (рис. 6). Тогда можно записать

p (a < X < b) =

A =
.

Тогда дифференциальный закон равномерного распределения определяется

¦ (x) =

Интегральный закон распределения

F (x) =
.

При х ³ b имеем

F (x) =

Таким образом интегральный закон равномерного распределения задается (рис. 6)

F (x) =

Основные характеристики распределения

М (X) =
;

D(X) =

=

=


.

  1. Биноминальное распределение

Пусть при некотором испытании событие А может наступить или не произойти (А). Обозначим вероятность А через р, а А через q = 1 -р ( других итогов испытания нет ). Тогда исходами двух последовательных независимых испытаний и их вероятностью будут:

АА - р2; АА - рq; АА - qр; АА - q2.

Отсюда видно, что двукратное появление события А равно р2, вероятность однократного появления - 2 рq, а вероятность того, что А не наступит ни разу - q2. Эти результаты единственно возможные и поэтому


.

Это рассуждение можно перенести на любое число испытаний.

Например, при трех испытаниях получим


.

Подсчитаем вероятность того, что при n испытаниях событие А появится m раз. Это может произойти, например, в последовательности


Ясно, что вероятность равна рmqn- m. Но m событий А может быть и в другом сочетании. Число всех возможных сочетаний из n элементов по m (количество событий А) равно числу сочетаний
. Используя теорему сложения вероятностей получаем общую вероятность Рm,n наступления m событий А из n испытаний

Pm,n =

=
.

Из этой формулы видно, что вероятности Рm,n для различного исхода испытаний (появление или не появление определенного результата А) определяется

pn + npn-1q +
.

Коэффициенты перед вероятностями р, q являются биноминальными коэффициентами, а общая вероятность представляет слагаемые в разложении бинома ( р + q )n. Поэтому закон распределения случайной величины Х, в котором вероятность наступления событий А определяется коэффициентами бинома, называется биноминальным распределением дискретной случайной величины. Этот закон может быть задан в виде таблицы 1.

Таблица 1

Биноминальный закон распределения

хi

 

0

1

2

...

m

...

n

pi

qn

npqn-1


...


...

pn

Биномиальные коэффициенты удобно получать с помощью треугольника Паскаля.

1 n = 0

1 1 n = 1

1 2 1 n = 2

1 3 3 1 n = 3

1 4 6 4 1 n = 4

1 5 10 10 5 1 n = 5

Все строки треугольника ( начинающегося с единицы ) начинаются и заканчиваются единицей. Промежуточные числа получаются сложением соседних чисел вышестоящей строки. Числа, стоящие в одной строке, являются биноминальными коэффициентами соответствующей степени.

Из описания биномиального распределения становится ясно, что область его действия там, где возможно многократное проведение испытаний с известной вероятностью.

Определим основные характеристики этого распределения.

Математическое ожидание

М (Х) =

+

+

= np (q + p)n-1 = np.

Дисперсия распределения может быть определена из общего выражения


,

но это приводит к громоздким вычислениям. В то же время случайная величина Х принимает в каждом опыте только два значения: 1, если событие А произошло и 0, если оно не произошло с вероятностями, соответственно, р или q. Тогда математическое ожидание одного опыта определится

М (Х1) = 0× q + 1×р = р = х

и соответственно дисперсия одного опыта

D (Х1) = (0 - р)2× q + (1 - р)2× р = р2q + q2р = рq (р + q) = рq.

Тогда дисперсия всех n опытов составит

D (X) = n× p× q.

  1. Закон Пуассона

В случае малых р ( или, наоборот, близких к 1 ) биноминальный закон распределения можно преобразовать следующим образом



,

где
.


Определим предел Рm,n при n ® ¥ и постоянном m. Тогда пределы


равны единице, а
.

Окончательно имеем


.

Это распределение называется законом Пуассона, где l - интенсивность распределения. Используется в задачах с редкими событиями.

Определим его основные характеристики и смысл величины l .

Запишем закон распределения в виде таблицы.

хi

 

0

1

2

...

m

...

pi

e-l



...


...

M (X) =

+
.

Выражение в скобках есть разложение функции еl в ряд Маклорена.

Поэтому

М (Х) = lе- l еl = l .

Не рассматривая вывод отметим, что

D (Х) = l ,

т.е. дисперсия равна математическому ожиданию.

Рассмотренные виды распределений случайной величины, конечно, не исчерпывают всех существующих распределений. Можно назвать еще несколько: распределение Бернулли, экспоненциальное распределение, гамма - распределение, распределение Вейбула, гипергеометрические распределения и др. При определенных условиях и параметрах один вид распределения может переходить в другой. Поэтому при решении практических задач по законам распределения случайных величин следует обращаться к специальной литературе.

2.4. Понятие статистической гипотезы и статистического критерия

Статистической гипотезой называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Такие утверждения можно делать на основе теоретических соображений или статистических исследований других наблюдений. Например, при многократном измерении некоторой физической величины, точное значение Х которой не известно, но в процессе измерений оно меняется. На результат измерений влияют многие случайные факторы, поэтому результат i - го измерения можно записать в виде аi = Х + e i, где e i - случайная погрешность измерения. Если e i складывается из большого числа ошибок, каждая из которых не велика, то на основании центральной предельной теоремы можно предположить, что случайные величины аi имеют нормальное распределение. Такое предположение является статистической гипотезой о виде распределения наблюдаемой случайной величины.

Если для исследуемого явления сформулирована та или иная гипотеза ( обычно ее называют основной или нулевой гипотезой и обозначают символом Но ), то задача состоит в том, чтобы сформулировать правило, которое позволяло бы по результатам наблюдений принять или отклонить эту гипотезу. Правило, согласно которому проверяемая гипотеза Но принимается или отвергается, называется статистическим критерием проверки гипотезы Но .

Наиболее распространены такие статистические гипотезы, как:

а) вида распределения;

б) однородности нескольких серий независимых результатов;

в) случайности результатов эксперимента и т.п.

Статистический критерий проверки гипотезы Но служит для определения возможного отклонения от основной гипотезы. Характер отклонений может быть различным. Если критерий ² улавливает² любые отклонения от Но, то такой критерий называют универсальным или критерием согласия. Существуют критерии, которые выявляют отклонения от заданного вида, это узко направленные критерии.

Выбор правила проверки гипотезы Но эквивалентен заданию критической области х1, при попадании в которую переменной х гипотеза Но отвергается. Критерий, определяемый критической областью х1 называют критерием х1.

В процессе проверки гипотезы Но можно прийти к правильному решению или совершить ошибку первого рода - отклонить Но когда она верна, или ошибку второго рода - принять Но, когда она ложна. Иными словами, ошибка первого рода имеет место, если точка х попадает в критическую область х1, в то время как верна нулевая гипотеза Но, а ошибка второго рода - когда х Î хо, но гипотеза Но ложна.

Желательно провести проверку гипотезы так, чтобы свести к минимуму вероятности обоих ошибок. Однако при данном числе испытаний n в общем случае невозможно одновременно обе эти вероятности сделать как угодно малыми. Поэтому наиболее рационально выбирать критическую область следующим образом: при заданном числе испытаний n устанавливается граница для вероятности ошибки первого рода и при этом выбирается та критическая область х1, для которой вероятность ошибки второго рода минимальна.

2.5. Вероятности ошибок первого и второго рода

Рассмотрим станок, который может работать только в одном из двух состояний. Если он работает в налаженном режиме, то для интересующего нас признака качества, например, длины или диаметра заготовки, имеет место нормальное распределение при работе как в налаженном так и в разлаженном режиме. Оба режима отличаются только уровнем настройки процесса по математическому ожиданию ( М(х) = 10 и 11, соответственно в налаженном и разлаженном режиме ), в то время как дисперсии в обоих случаях составляют s 2 = 4.

Проверить нужно нулевую гипотезу, в соответствии с которой М(х) = 10, против альтернативы ( в данном случае единственной ) М(х) = 11. Конкурирующую гипотезу обозначим Н1. Тогда Но: М(х) = 10; Н1: М(х) = 11.

Необходимо по результатам выборки определить в каком из состояний работает станок. Примем объем выборки n из потенциально бесконечной генеральной совокупности. В качестве контрольной величины возьмем выборочное среднее Хn. На рис. 9 изображены плотности распределения Хn для n = 25 и n = 4.

Для формулировки критерия необходимо разделить область изменения контрольной величины (х) на критическую область отклонения гипотезы Но ( принятия Н1 ) и область принятия гипотезы Но. Для этого необходимо выбрать число К, такое, что 10 < К < 11, и интервал ( - ¥; К ] рассматривать как область принятия гипотезы Но, а интервал [ К; ¥ ) - как область отклонения гипотезы Но. По рис. 9 видно, что каждая реализация Х25 или Х4 возможна при верности любой из двух гипотез, но с различной вероятностью.

рода a ( отклонения верной гипотезы Но ) и второго рода b ( принятие гипотезы Но, когда она не верна ). Также видно, что увеличение n ведет к уменьшению дисперсии распределения х и тем самым - к одновременному уменьшению вероятностей a и b . В соответствии с рис. 9 можно записать:


;


.

Эти два уравнения содержат четыре величины a , b, К, n. Задав две из четырех величин, можно определить две другие.

Например, при n = 25 и К = 10,4 определим:


;


.

Если задаться величинами a и b , то можно определить величины К, n.

2.6. Проверка гипотезы вида закона распределения вероятностей

При проверке эксперимента закон распределения вероятностей случайных величин неизвестен и можно лишь предположительно судить о его виде . Выборочные оценки параметров распределения несут в себе случайные ошибки, искажающие истинный характер распределения. Поэтому после получения эмпирического распределения производится подбор теоретического закона распределения, пригодного для описания вероятностных свойств изучаемой случайной величины. Критерии подбора ( проверки гипотезы соответствия ) называют в статистике критериями согласия. Все они основаны на выборе допустимой меры расхождения между теоретическим распределением и выборочными данными.

Общую процедуру проверки гипотезы закона распределения можно представить в следующей последовательности:

  1. По опытным данным строится эмпирическая кривая распределения вероятностей;
  2. Определяются параметры эмпирического распределения ( в соответствии с его видом );
  3. Выдвигается одна или несколько гипотез о функции плотности исследуемой случайной величины, исходя из внешнего вида эмпирической кривой, значений ее параметров, технических факторов, влияющих на ее вид;
  4. Эмпирическая кривая выравнивается по одной или нескольким теоретическим кривым;
  5. Проводится сравнение по одному или нескольким критериям согласия;
  6. Выбирается теоретическая функция, дающая наилучшее согласование.

Поясним п. 4; 5. Определив по эмпирическим данным параметры распределения, подставляют их в теоретическую кривую закона распределения и рассчитывают вероятность середин интервалов эмпирического распределения. Умножив значение полученной вероятности на общее число опытов, получают теоретическое значение частот случайной величины, которые и определяют ² выровненную² кривую. Теперь можно найти вероятность того, что эмпирическая кривая соответствует выбранной теоретической, выбрав вероятность согласия ( уровень значимости ). Если результат расхождения не выйдет за принятый уровень значимости, то считают, что эмпирическое распределение согласуется с теоретическим. Если сравнение осуществляется с несколькими теоретическими законами, то окончательно принимать тот, который дает лучшее соответствие.

Чаще всего в качестве критериев согласия принимают критерий Пирсона ( c 2 ) и критерий Колмогорова - Смирнова ( К - С - критерий ).

Критерий c 2 является наиболее состоятельным при большом числе наблюдений. Он почти всегда опровергает неверную гипотезу, обеспечивает минимальную ошибку в принятии неверной гипотезы по сравнению

с другими критериями.

c 2 =
,

где mj - наблюдаемая частота случайного события;

m* j - ожидаемая по принятому теоретическому закону распределения;

К - число интервалов случайной величины.

Затем определяется число степеней свободы l:

l = К - r - 1;

где К - число интервалов случайной величины;

r - число параметров теоретической функции распределения.

К - С - критерий лучше всего использовать в случае, если теоретические значения параметров распределения известны. При неизвестных параметрах его можно использовать, но он дает несколько завышенные результаты. При использовании этого критерия определяется величина


,

где

mнj, m*нj - соответственно, накопленные наблюдаемые и ожидаемые

(теоретические) частоты;

n - число проведенных опытов.

То есть, в данном случае оценивается только максимальное отклонение накопленной частоты случайного события, возникающее в одном из диапазонов изменения случайной величины. Полученное значение коэффициента сравнивается с табличным для числа степеней свободы опыта и принятого уровня значимости результата. Если табличное значение коэффициента больше, то гипотеза о принятом законе распределения не отвергается.

Контрольные вопросы

  1. Сущность непрерывной и дискретной случайной величины;
  2. Сущность интегрального закона распределения случайной величины;
  3. Сущность дифференциального закона распределения случайной величины;
  4. Связь интегрального и дифференциального законов распределения;
  5. Основные характеристики случайной величины, заданной своим распределением;
  6. Назовите примеры законов распределения непрерывной и дискретной случайной величины;
  7. Понятие статистической гипотезы и статистического критерия;
  8. Назовите примеры статистических гипотез;
  9. Сущность ошибок первого и второго рода;
  10. Сущность проверки гипотезы вида закона распределения;
  11. Принципиальное различие в критериях Пирсона и Колмогорова - Смирнова.

3. НАХОЖДЕНИЕ ИНТЕРПОЛИРУЮЩИХ КРИВЫХ

В первой части пособия рассматривались измерения той или иной физической величины, находящейся при проведении серии измерений в неизменном состоянии. Очень часто исследуемая величина меняется в соответствии с изменением условий опыта или времени. Цель эксперимента в этом случае состоит в нахождении функциональной зависимости, которая наилучшим образом описывает изменение интересующего нас параметра.

Следует понимать, что однозначно восстановить ( большей частью неизвестную ) функциональную зависимость между переменными невозможно даже в том случае, если бы переменные величины, полученные из опыта, не имели бы ошибки измерения. Тем более не следует ожидать, что это удастся сделать, имея экспериментальные данные, содержащие, по крайней мере, случайные ошибки измерений.

Поэтому математическая обработка результатов наблюдений не может ставить перед собой задачу разгадать истинный характер зависимости между переменными. Она позволяет лишь представить результаты опыта в виде наиболее простой формулы.

В зависимости от назначения этих формул существуют различные методы их получения, отличающиеся сложностью расчетных процедур и точностью получаемых решений.

3.1. Графический метод обработки результатов

Графический метод заключается в построении графика зависимости между исследуемыми величинами с последующим определением уравнения зависимости между ними.

Графики строят прежде всего в равномерных шкалах. Если характер связи между исследуемыми величинами неизвестен, то сначала проверяют совпадение экспериментальных точек с заданной кривой. Если предварительные сведения о характере уравнения отсутствуют, то первым этапом обработки данных является нахождение кривой, совпадающей с опытными точками. Эта задача решается методом подбора. Можно использовать эталон - кальку с предварительно вычерченным на ней семейством кривых с различными параметрами. Естественно, что масштаб кальки и эмпирической кривой должен быть одинаков.

Построенный по опытным данным отрезок кривой может совпадать с большим количеством различных кривых, проходящих достаточно близко к опытным точкам. В этом случае выбирают кривую с наиболее простым и удобным в использовании уравнением. Иногда эмпирическая кривая может иметь перегибы или состоять из отдельных ярко выраженных участков. Однако при этом необходимо определить координаты точек перехода от одной кривой к другой.

Уравнение зависимости между исследуемыми величинами при графическом методе просто определяется тогда, когда эмпирические точки достаточно хорошо совпадают с прямой линией, т.е. описываются уравнением y = ax + b, где a, b - коэффициенты, подлежащие определению.

Определение коэффициентов при графическом методе основано на ² способе натянутой нити² . Нанеся результаты эксперимента на график (лучше, если он выполнен на миллиметровке), подбираем графическую прямую, ближе всего подходящую к нанесенным точкам. Выбрав положение прямой, определяем две произвольные точки на этой прямой (не обязательно являющиеся точками эксперимента), определяем их координаты (x1; y1), (х2; y2). И для определения коэффициентов а и b получаем два простых уравнения

ах1 + b = y1;

ах2 + b = y2.

На рис. 10 приведена иллюстрация этого метода. Точки - результаты, полученные в эксперименте. Прямая проведена на глаз как можно ближе к экспериментальным точкам. На прямой выбраны точки М (2; 4) и N (13; 10). Коэффициент а характеризует угол наклона прямой.

Поэтому



.

Таким образом y = 0,55х + 2,9.

В случае, если экспериментальная зависимость имеет нелинейный характер, то графическим способом в системе координат с равномерными шкалами определить коэффициенты кривой затруднительно. Но достаточно большой класс нелинейных зависимостей путем замены переменных и графического изображения в функциональных шкалах можно привести к линейным и далее использовать способ натянутой нити.

3.2. Функциональные шкалы и их применение

Пусть функция y = ¦ (х) непрерывна и монотонна на некотором промежутке [ a; b ]. Возьмем ось ОМ, на которой будет строиться шкала, выберем на ней точку начала отсчета О и установим масштаб m . Функциональная шкала строится следующим образом.

Разбив интервал [ а; b ] на равные части, вычисляем значение функции ¦ (х) в каждой из точек деления и отложим на оси ОМ для каждой точки отрезок m ¦ (х). Получающаяся при этом точка снабжается отметкой х, т.е. откладывается в выбранном масштабе значение функции, а надписывается значение аргумента.

Иногда начало шкалы помещают в первую точку отсчета, т.е. точку с надписью а совмещают с 0. Тогда точка х будет находиться в конце отрезка m [ ¦(х) - ¦(а) ] . Полученная шкала позволяет судить о поведении функции на рассматриваемом участке: большие промежутки между отметками укажут, что функция изменяется быстрее, чем там, где эти промежутки малы.

Выбор масштаба m определяет длину шкалы. Чаще поступают наоборот: задаются длиной шкалы l и определяют масштаб.


Þ m =
.

Пример. Построим функциональную шкалу для функции y = x2 на участке [ 1; 2 ]. Зададимся длиной шкалы l = 12 см. Тогда m =
см. Разобьем отрезок [ 1; 2 ] на десять равных частей и вычислим значения функции во всех точках деления. Совместим начало шкалы с точкой отсчета х = 1. Результаты расчета сведены в табл. 2, а функциональная шкала приведена на рис. 11.

Таблица 2

Расчет функциональной шкалы y = x2

х

1,0

1,1

1,2

1,3

1,4

1,5

1,6

1,7

1,8

1,9

2,0

х2

1,0

1,21

1,44

1,69

1,96

2,25

2,56

2,89

3,24

3,61

4,00

х2- 1

0

0,21

0,44

0,69

0,96

1,25

1,56

1,89

2,24

2,26

3,00

4(х2- 1)

0

0,84

1,76

2,76

3,84

5,00

6,24

7,56

8,94

10,44

12,0

1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0

Рис. 11. Функциональная шкала y = x2

С помощью функциональных шкал графики многих функций могут быть преобразованы к прямолинейному виду.

Например, уравнение параболы y = x2. Если на оси OY нанести равномерную шкалу, а на оси OX1 шкалу квадратов х1 = х2, то получится сетка, где уравнение параболы имеет изображение прямой линии ( y = x1 ),

проходящей через начало координат.

Особенно часто используются различные логарифмические функции, с помощью которых можно ² выпрямлять² графики степенных и показательных функций. Например, y = aebx; lg y = (b lg е) х + lg a. Полагая lg y = y1, lg a = A, b lg e = B запишем исходное уравнение в виде y1 = А + Вх, откуда видно, что оставив равномерной шкалу х и построив логарифмическую шкалу y1, можно изобразить исходное уравнение прямой линией. Полученная координатная сетка называется полулогарифмической.

Очевидно, что такого рода преобразования возможны и в более общем случае. Всякая неявная функция, заданная соотношением вида

аj (х) + by (y) + с = 0,

где a, b, с - постоянные, будет изображаться прямой линией на функциональной сетке, где на оси ОХ построена шкала j (х), а на оси OY - шкала функции y (y). Естественно, что функции j (х) и y (y) должны удовлетворять условиям непрерывности и монотонности. В табл. 3 приведены преобразования для некоторых функций.

Таблица 3

Линеаризация некоторых функций

Исходная

формула

Преобразованная

формула

Замена

переменных

Линеаризованная формула

y=axb

lg y=b× lgx+lga

lg y=y1

lg x=x1

lg a=a1

y1=bx1+a1

y=a× lgx+b

¾

lg x=x1

y=ax1+b

y=ebx+k

lg y=b× lge× x+k× lge

lg y=y1

b× lg e=a

k× lg e=k1

y1=ax+k1

y=aebx

lg y=bx× lge+lga

lg y=y1

b× lg e=b1

lg a=a1

y1=b1x+a1

y=

¾


y=ax1+b

y=



y1=ax+b

y=



y1=bx1+a

Из сказанного ясна роль функциональных сеток при обработке результатов эксперимента. Если результаты эксперимента располагаются вблизи кривой, то по имеющемуся ограниченному участку кривой трудно судить, какого типа функцией ее лучше всего приближать. Переведя полученные экспериментальные данные на функциональные сетки можно оценить на какой из них эти данные ближе всего подходят к прямой и, следовательно, какой функцией лучше всего описываются.

3.3. Аналитические методы обработки результатов

Графический метод обработки результатов обладает наглядностью, относительной простотой, однако его результаты содержат определенную субъективность и относительно низкую точность.

Аналитические методы лишены в какой - то степени указанных недостатков и позволяют получить результат для более широкого класса функций с большей точностью, чем графический метод.

Существуют различные аналитические методы получения параметров эмпирических кривых в зависимости от критерия, принятого при их получении. Рассмотрим некоторые из существующих способов.

3.3.1.Способ средней

Страницы: 1, 2



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.