• Название:

    Baw

  • Размер: 0.11 Мб
  • Формат: DOCX
  • или


Федеральное агентство по образованию

Государственное Образовательное Учреждение Высшего Профессионального Образования

“Тверской государственный технический университет”

(ГОУ ВПО ”ТГТУ”)

Кафедра Информационных систем

КУРСОВАЯ РАБОТА по дисциплине

«Теория вероятность и математическая статистика»

Выполнил студент 2 курса

Сотникова Н.В.

Проверил профессор кафедры ИС

Ветров А. Н.

Оценка:__________

Подпись:__________

Тверь 2012 г

Оглавление

TOC \o "1-3" \h \z \u 1.Введение PAGEREF _Toc344183324 \h 3

2.Предельные теоремы PAGEREF _Toc344183325 \h 4

2.1.Теорема Бернулли PAGEREF _Toc344183326 \h 4

2.2.Закон больших чисел Чебышева. PAGEREF _Toc344183327 \h 5

3.Простая линейная регрессия PAGEREF _Toc344183328 \h 6

4.ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. PAGEREF _Toc344183329 \h 8

4.1.Двухвыборочный z-тест для средних PAGEREF _Toc344183330 \h 8

4.2.Двухвыборочный t-тест с одинаковыми дисперсиями, различными дисперсиями и двухвыборочный F-тест для дисперсии PAGEREF _Toc344183331 \h 8

4.3.Парный двухвыборочный t-тест для средних PAGEREF _Toc344183332 \h 10

5. Заключение PAGEREF _Toc344183333 \h 11

6. Список используемой литературы………………………………………………………………………………………………….12

Введение

Темой данной курсовой работы являлось определение и проверка вероятности предельных теорем, а именно Теоремы Бернулли и Закона больших чисел Чебышева, определения коэффициентов простой линейной регрессии, полученных в ходе проведённых испытаний и проверки статистических гипотез.

В проверки предельных теорем мы проведём тесты для определения вероятности выпадения «герба» с большим числом опытов (для Теоремы Бернулли это число составит 170 и 1850 опытов соответственно), а также проведём анализ Закона больших чисел с целью определения случайных величин при большом nопытов.

Для уравнения линейной регрессии найдём коэффициенты a0и a1 а также найдём определим коэффициент корреляции ryx при помощи генерации числа случайным образом в интервале [0,1].В следствии чего проверим качество подгонки(степень тесноты) регрессионной модели к наблюдаемым данным по шкале Чеддока.

Для проверки статистических гипотез проведём несколько тестов для проверки двух собственных гипотез: «H0: mx=my и H1: mx≠my».

И сделаем заключение по полученным данным.

Предельные теоремы

Теорема Бернулли

Если проводится n независимых испытаний случайного события A, вероятность которого P(A) = p, то относительная частота m/n появления события A (mчисло появлений A) при большом n приближенно равна вероятности p:

.

уточнение: будем писать

при ,

если для любого >0 и для достаточно больших n соотношение

(1)

выполняется с вероятностью, стремящейся к 1 с ростом n; запишем это так:

при .

fn– 0.5<0.1 при n = 170 и fn– 0.5<0.03 при n=1850.

N= 170 опытов

Случай

1

2

3

4

5

кол-во выпадений “герба”

90

72

76

75

83

вероятность выпадения

0,06872

-0,03723

0,01632

-0,06274

0,04705

N= 1850 опытов

Случай

1

2

3

4

5

кол-во выпадений “герба”

917

911

913

920

895

вероятность выпадения

-0,00752

0,01478

-0,00588

-0,00522

0,00236

Вывод. При n=170 теорема Бернулли выполняется в 5 опытах из 5, а при n=1850 в 5 опытах.

Закон больших чисел Чебышева.

Одно из основных утверждений закона больших чисел состоит в том, что значение среднеарифметического случайных величин с равными математическими ожиданиями , при большом n оказывается приближенно равным a:

Будем писать

при ,

если для любого >0 и достаточно больших n соотношение

(2)

выполняется с вероятностью, стремящейся к 1 с ростом n; запишем это так:

при .

Проверяем (2) на достоверность:

N= 45 опытов

Случай

1

2

3

4

5

кол-во выпадений “герба”

23

21

25

29

25

вероятность выпадения

1.01287

0.575858

0.784472

1.035254

1.071781

N= 1125 опытов

Случай

1

2

3

4

5

кол-во выпадений “герба”

545

513

575

535

553

вероятность выпадения

1.010109

0.754486

1.014251

1.002436

0.944532

Вывод. Для N=45 закон больших чисел выполняется при P=-0.4475, для N=1125 при P=0.48632.

Простая линейная регрессия

Простая линейная регрессия используется для исследования зависимости двух переменных.

Для определения оценок параметров в уравнении используем метод наименьших квадратов (МНК).

yi = a0 + a1xi + iY = 11,5 + 1,4x + 2ε

Y

X

2

21,465284

6,5

1,112887

26,784284

10,3

0,480068

23,143284

7,7

0,413975

32,484284

15,8

0,406155

22,764284

7,4

0,04712

32,384284

14,3

1,678112

35,924284

15,4

0,091515

41,905884

21,1

1,379218

42,304284

22,1

0,875839

27,164284

12

1,625301

25,696284

9,5

0,211231

23,704284

8,1

1,693511

24,124284

8,4

0,839626

33,784284

15,3

1,069226

18,384284

4,3

1,270352

25,384284

9,3

1,767032

20,344284

5,7

0,508229

30,424284

12,9

0,844701

19,504284

5,1

0,132205

17,684284

3,8

0,851385

36,304284

17,1

1,253763

23,844284

8,2

1,183283

23,704284

8,1

1,530244

28,744284

11,7

0,944445

30,564284

13

1,034424

33,784284

15,3

0,050568

31,264284

13,5

0,345361

27,064284

10,5

0,308994

22,584284

7,3

1,203201

31,684284

13,8

0,315872

26,924284

10,4

0,629624

26,644284

10,2

1,273071

37,564284

18

1,854315

31,684284

13,8

1,252839

20,764284

6

0,235697

29,024284

11,9

0,549676

25,524284

9,4

1,383931

31,544284

13,7

0,80918

29,164284

12

0,297148

28,604284

11,6

1,221141

25,104284

9,1

1,612994

21,604284

6,6

0,363549

23,004284

8,1

0,931969

26,224284

11,7

0,050041

32,944284

13

1,530244

ryx = a1sx/sy

sx =, sy =,

Xсредн= 10,04563

Yсредн=24,64005

a1=2.73854 a0=27.2437 Sx =3.476495 Sy=4.27572R=ryx=1.888473 F=43

Y = 22.35+ 2.51xi

Полученное уравнение регрессии: Y = 22.35+ 2.51xi

Вывод. Степень связи Rнаходиться в интервале 0,1-0,3. Это означает, что менее 50% вариации результирующей переменной объяснятся случайными факторами.

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ.

Для проверки статистических гипотез применим: H0: mx=myH1: mx≠my

И проведём несколько тестов для их проверки.

Двухвыборочный z-тест для средних

Дисперсия для автомата 1: = 5 мм2.

Дисперсия для автомата 2: =7 мм2.

Уровень значимости = 0,05.

,

Автомат 1

182,3

183,0

181,8

181,4

181,8

181,6

183,2

182,4

182,5

179,7

179,9

181,9

182,8

183,4

Автомат 2

185,3

185,6

184,8

186,2

185,8

184,0

184,2

185,2

184,2

Двухвыборочный z-тест для средних

Переменная 1

Переменная 2

Среднее

180,6796

180,2433

Известная дисперсия

6

7

Наблюдения

12

9

Гипотетическая разность средних

0

z

-3,87434

P(Z<=z) одностороннее

0,001067

z критическое одностороннее

1,63853

P(Z<=z) двухстороннее

0,074135

z критическое двухстороннее

1,656744

Вывод. Поскольку zкрит < zрасч, то гипотезу H0 (о равности средних значений) отвергаем и применяем гипотезу H1 (о их неравности) принимая во внимание мощность критерия (1-β) и двусторонний критерий при уровне значимости 0,05.

Старая технология

308

308

307

308

304

307

307

308

307

Новая технология

308

304

306

306

306

304

304

304

306

304

303

304

303

Уровень значимости = 0,05

4.2Двухвыборочный t-тест с одинаковыми дисперсиями

Переменная 1

Переменная2

Среднее

307,1111

304,5455

Дисперсия

1,611111

1,472727

Наблюдения

9

11

Объединенная дисперсия

1,959829

Гипотетическая разность средних

0

df

18

t-статистика

4,608459

P(T<=t) одностороннее

0,00209

t критическое одностороннее

1,734744

P(T<=t) двухстороннее

0,052218

t критическое двухстороннее

2,173922

Вывод. Поскольку tкрит<tрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,05.

Двухвыборочный t-тест с различными дисперсиями

Переменная 1

Переменная2

Среднее

303,11

204,7592

Дисперсия

1,6311

1,1713

Наблюдения

9

13

Гипотетическая разность средних

0

df

19

t-статистика

3,971449

P(T<=t) одностороннее

0,000639

t критическое одностороннее

1,742633

P(T<=t) двухстороннее

0,011916

t критическое двухстороннее

2,093637

Вывод. Поскольку tкрит<tрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,05.

Двухвыборочный F-тест для дисперсии

Переменная 1

Переменная 2

Среднее

302,1122

303,6761

Дисперсия

1,626421

2,291606

Наблюдения

9

13

df

8

12

F

0,227563

P(F<=f) одностороннее

0,136454

F критическое одностороннее

0,5046752

Вывод. Поскольку Fкрит<Fрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,05.

1

2

3

4

5

6

7

8

9

10

Низкая температура

10,40

10,36

10,38

10,41

10,43

10,42

10,39

10,41

10,38

10,40

Высокая температура

10,41

10,38

10,38

10,43

10,44

10,42

10,40

10,42

10,38

10,41

4.3Парный двухвыборочный t-тест для средних

Переменная 1

Переменная 2

Среднее

12,245

12,405

Дисперсия

0,00154

0,000668

Наблюдения

10

10

Корреляция Пирсона

0,7474530683

Гипотетическая разность средних

0

df

9

t-статистика

-3,87214

P(T<=t) одностороннее

0,002138

t критическое одностороннее

1,833535

P(T<=t) двухстороннее

0,0377354

t критическое двухстороннее

2,37216775

Вывод. Поскольку tкрит<tрасч, то гипотезу H0отвергаем и применяем гипотезу H1при уровне значимости 0,01.Поскольку p – уровень имеет маленькое значение (0,003863898). Следовательно, можно утверждать, что температура влияет на величину растяжения проволоки.

5. Заключение

В ходе выполнения данной курсовой работы мы провели большое количество опытов с целью проверки предельных теорем на достоверность. В ходе проверки была доказана Теорема Бернулли и Закон больших чисел Чебышева.

Из уравнения линейной регрессии мы доказали что число влияет на полученное в результате новое уравнение регрессии, но не значительно, т.е. коэффициент корреляции ryxсоставил 0,1586303, из чего следует что он не особо влияет на исходные данные.

Проведя массу тестов на проверку статистических гипотез, мы проверяли 2 гипотезы: H0: mx=myH1: mx≠my

И в ходе проверки мы выяснили, что применяемая нами первая гипотеза во всех тестах отпадала, т.к. средние значения не были равными.

В заключении мы научились проверять различные теоремы на достоверность и проводить различные тесты для выборочных случайных чисел.

6.Список используемой Литературу

1.Методические указания по Курсовой Работе.