Критерий Рябкова первого порядка R1

Критерий Рябкова первого порядка (R1) статистический тест, применяется для оценки на грубые ошибки (выбросы) сомнительного значения выборки в одномерном наборе данных, имеющей нормальное распределение.
Вычисляют критерии Рябкова первого порядка предполагая, что наибольший или наименьший результат измерений вызван грубыми ошибками.
Сравнивают наименьшее R1_min и R1_max с критическим значением критерия при выбранном p-value.
Расчётное значение критерия R1 определяют по формуле:

для минимального числа

: Поиск R1 макс.png (9.41 КБ) 999 просмотров

для максимального числа

Если, R1_{расчётное}<R1_{табличное} то значение считают выбросом.
При исключении выброса, за одну иттерацию следует удалять одно значение с наименьшим R1_{расчётное}. Затем критические значения для нового набора данных пересчитывают.

Критические значения для R1

► Показать

n	0,05	0,01
3	0,034043	0,006826
4	0,19112	0,08474
5	0,35117	0,20281
6	0,4575	0,32012
7	0,53512	0,41059
8	0,59319	0,48218
9	0,63817	0,53926
10	0,67452	0,5858
11	0,70395	0,62387
12	0,72855	0,6559
13	0,74923	0,68289
14	0,76706	0,70612
15	0,78238	0,72613
16	0,79583	0,74364
17	0,80765	0,75908
18	0,81818	0,7728
19	0,82754	0,78497
20	0,83598	0,79599
21	0,84359	0,8059
22	0,85056	0,81489
23	0,85689	0,8231
24	0,86268	0,83057
25	0,86803	0,8375
26	0,87297	0,84382
27	0,87751	0,84969
28	0,88175	0,85513
29	0,88569	0,86016
30	0,8894	0,86489
31	0,89283	0,86929
32	0,89608	0,87343
33	0,89909	0,87728
34	0,90197	0,88093
35	0,90465	0,88431
36	0,90721	0,88756
37	0,9096	0,89057
38	0,9119	0,89348
39	0,91405	0,8962
40	0,91612	0,8988
41	0,91807	0,90125
42	0,91995	0,90362
43	0,92172	0,9058
44	0,92342	0,90798
45	0,92505	0,90999
46	0,9266	0,91196
47	0,92809	0,91381
48	0,92952	0,91559
49	0,93089	0,91728
50	0,9322	0,91895
51	0,93346	0,9205
52	0,9347	0,92206
53	0,93585	0,92347
54	0,93699	0,9249
55	0,93807	0,92623
56	0,93913	0,92756
57	0,94014	0,92878
58	0,94112	0,93002
59	0,94206	0,93116
60	0,94298	0,93232
61	0,94386	0,93337
62	0,94473	0,93447
63	0,94555	0,93546
64	0,94636	0,93647
65	0,94714	0,93742
66	0,9479	0,93836
67	0,94863	0,93925
68	0,94934	0,94014
69	0,95004	0,94097
70	0,95072	0,94181
71	0,95137	0,9426
72	0,95201	0,9434
73	0,95263	0,94414
74	0,95324	0,94489
75	0,95382	0,94559
76	0,9544	0,9463
77	0,95495	0,94697
78	0,95551	0,94765
79	0,95603	0,94828
80	0,95656	0,94893
81	0,95706	0,94953
82	0,95755	0,95015
83	0,95803	0,95071
84	0,95851	0,95131
85	0,95896	0,95184
86	0,95942	0,95241
87	0,95985	0,95293
88	0,96028	0,95346
89	0,9607	0,95395
90	0,96111	0,95447
91	0,96151	0,95493
92	0,96191	0,95543
93	0,96229	0,95588
94	0,96267	0,95634
95	0,96304	0,95678
96	0,9634	0,95723
97	0,96376	0,95764
98	0,96411	0,95808
99	0,96444	0,95848
100	0,96478	0,95889
101	0,9651	0,95928
102	0,96543	0,95968
103	0,96574	0,96004
104	0,96606	0,96043
105	0,96635	0,96078
106	0,96666	0,96115
107	0,96694	0,96149
108	0,96724	0,96184
109	0,96751	0,96217
110	0,9678	0,96252
111	0,96806	0,96283
112	0,96834	0,96316
113	0,96859	0,96347
114	0,96886	0,96379
115	0,96911	0,96408
116	0,96936	0,96439
117	0,9696	0,96468
118	0,96985	0,96497
119	0,97008	0,96525
120	0,97032	0,96554
121	0,97054	0,9658
122	0,97078	0,96608
123	0,97099	0,96634
124	0,97122	0,96661
125	0,97143	0,96686
126	0,97164	0,96712
127	0,97185	0,96736
128	0,97206	0,96762
129	0,97226	0,96785
130	0,97246	0,9681
131	0,97266	0,96833
132	0,97285	0,96857
133	0,97304	0,96879
134	0,97323	0,96902
135	0,97342	0,96924
136	0,9736	0,96946
137	0,97378	0,96967
138	0,97396	0,96988
139	0,97413	0,97009
140	0,97431	0,9703
141	0,97448	0,9705
142	0,97465	0,9707
143	0,97481	0,97089
144	0,97498	0,97109
145	0,97514	0,97128
146	0,9753	0,97147
147	0,97545	0,97166
148	0,97561	0,97184
149	0,97576	0,97202
150	0,97591	0,9722
151	0,97606	0,97238
152	0,97621	0,97255
153	0,97635	0,97272
154	0,9765	0,9729
155	0,97664	0,97307
156	0,97678	0,97323
157	0,97692	0,97339
158	0,97705	0,97356
159	0,97719	0,97371
160	0,97732	0,97387
161	0,97745	0,97403
162	0,97758	0,97418
163	0,97771	0,97433
164	0,97784	0,97449
165	0,97797	0,97463
166	0,97809	0,97478
167	0,97821	0,97492
168	0,97833	0,97507
169	0,97845	0,97521
170	0,97857	0,97535
171	0,97869	0,97549
172	0,9788	0,97563
173	0,97892	0,97576
174	0,97903	0,97589
175	0,97914	0,97602
176	0,97926	0,97616
177	0,97937	0,97628
178	0,97947	0,97641
179	0,97958	0,97653
180	0,97969	0,97666
181	0,97979	0,97678
182	0,97989	0,97691
183	0,98	0,97703
184	0,9801	0,97715
185	0,9802	0,97726
186	0,9803	0,97738
187	0,9804	0,9775
188	0,98049	0,97761
189	0,98059	0,97773
190	0,98069	0,97784
191	0,98078	0,97795
192	0,98087	0,97806
193	0,98097	0,97817
194	0,98106	0,97828
195	0,98115	0,97838
196	0,98124	0,97849
197	0,98133	0,97859
198	0,98142	0,9787
199	0,9815	0,9788
200	0,98159	0,9789
201	0,98167	0,979
202	0,98176	0,9791
203	0,98184	0,9792
204	0,98193	0,97929
205	0,98201	0,97939
206	0,98209	0,97949
207	0,98217	0,97958
208	0,98225	0,97968
209	0,98233	0,97977
210	0,98241	0,97986
211	0,98249	0,97995
212	0,98256	0,98004
213	0,98264	0,98013
214	0,98272	0,98022
215	0,98279	0,98031
216	0,98286	0,98039
217	0,98294	0,98048
218	0,98301	0,98057
219	0,98308	0,98065
220	0,98316	0,98074
221	0,98323	0,98082
222	0,9833	0,9809
223	0,98337	0,98098
224	0,98344	0,98107
225	0,9835	0,98115
226	0,98357	0,98123
227	0,98364	0,98131
228	0,98371	0,98138
229	0,98377	0,98146
230	0,98384	0,98154
231	0,9839	0,98162
232	0,98397	0,98169
233	0,98403	0,98177
234	0,9841	0,98184
235	0,98416	0,98191
236	0,98422	0,98199
237	0,98428	0,98206
238	0,98435	0,98213
239	0,98441	0,9822
240	0,98447	0,98227
241	0,98453	0,98235
242	0,98459	0,98241
243	0,98465	0,98248
244	0,98471	0,98255
245	0,98476	0,98262
246	0,98482	0,98269
247	0,98488	0,98275
248	0,98494	0,98282
249	0,98499	0,98289
250	0,98505	0,98295
251	0,9851	0,98302

Зарезервированно

Определения:
1. Точность обнаружения — количество ошибок первого рода, количество ошибок второго рода, для разных критериев можно выбрать одинаковое. Но если к выборкам намеренно добавлять выбросы, процент их обнаружения у разных критериев будет различаться. Не существует единого подхода к оценке эффективности критериев. Конкретно для этой статьи мы будем использовать термин «точность обнаружения», как субъективная оценка критерия на основе полученных данных (графиков).
2. Правило трёх сигм заключается в том, что при нормальном распределении практически все значения величины с вероятностью 0,9973 лежат не далее трёх сигм в любую сторону от математического ожидания, то есть находятся в диапазоне [μ−3σ;μ+3σ]
3. Выборка— множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.
Выборку можно описать некоторыми статистиками, среднее, медиана, мода, стандартное отклонение, размах, и. т. д.
Искажения нормального распределения по-разному влияют на разные описательные статистики.
4. Критерий Граббса находит выбросы по оценке соотношения стандартного отклонения (или дисперсий, кому как удобнее) с проверяемым значением и без него.
5. Стандартное отклонение — наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания
6. Среднее абсолютное отклонение (АAD) — является мерой статистической дисперсии. АAD — это надёжная статистика, более устойчивая к выбросам в наборе данных чем стандартное отклонение (не значит, что лучше). В стандартном отклонении расстояния от среднего возводятся в квадрат, поэтому большие отклонения имеют больший вес, и поэтому выбросы могут сильно на него влиять. В общем виде центральной точкой может быть среднее (АAD), медиана (MAD).
Утверждения:
1. Проверять необходимо число с наибольшим критическим значением.
2. p-value Процент ложного обнаружения.
3. Ссылка на авторитет не является доказательством.
4. Нет смысла тестировать критерии на распределениях отличных от нормального, а потом сравнивать полученные результаты, т. к. для практического применения в этом нет смысла. При этом не отрицается возможность намеренного искажения нормального распределения для оценки критериев.

Здесь мы рассмотрели критерий Граббса. В этой статье будет рассмотрен альтернативные способы проверки на выбросы.
Критериев существует огромное количество, порядка 30
Например: Метод Ирвина, Критерий Стьюдента, Критерий наибольшего абсолютного отклонения, Критерий максимального относительного отклонения, Критерий Романовского, Метод вариационного размаха, Критерий 3 Сигм, Критерий Райта, Критерий Граббса, Q-критерий (Диксона), Критерий Львовского, Критерий Шовене, Критерий Дэвида, Критерий Хоглина-Иглевича, L-критерий (Критерий Титьена-Мура), Критерий Смоляка-Титаренко, Критерий Бродского-Быцаня-Власенко. Критерий Кимбера.
Описание некоторых, корыте могут заслуживать внимание.
Критерий 3 Сигм
— К данному критерию у меня претензий, нет, грубость при небольшом количестве данных, компенсируется упрощением.
Горячо любимый, и воспетый критерий Диксона.
— Реализация, на ПК, вызывает небольшие затруднения, с этими «X3-X1»
— Критические значения только до 30n
— Критерий Диксона теряет часть информации о выборке (большая часть значений просто не учитывается).
— Скачкообразное изменение свойств (для разных n формулы могут быть разные).
— Использует для вычислений критического значения числа с большим разбросом (числа ближе к минимальному и максимальному имеют больший разброс, чем числа, которые ближе к среднему значению).
— Попытки использовать критерий Диксона в качестве альтернативы критерию Граббса не увенчались успехом.
Пример вариантов результата при добавлении к выборке числа 4σ:
а) Критерий Граббса обнаружил выброс, критерий Диксона обнаружил Выброс.
б) Критерий Граббса обнаружил выброс, критерий Диксона не обнаружил Выброс.
г). Практически отсутствует вариант — Критерий Граббса не обнаружил выброс, критерий Диксона обнаружил Выброс.
— Критические значения рассчитаны для одностороннего критерия, что уже в большинстве случаев приведёт к неправильному использованию и выводам.
Метод Ирвина
— Я бы его охарактеризовал как смесь критерия Диксона, и критерия Граббса. Зачем нам половинчатые меры? Первый забраковали, второй уже есть.
Критерий Стьюдента, и разные вариации.
— Критерий может составить конкуренцию критерию Граббcа. Любое p-value, любое n, без статистических таблиц. Результаты обоих критериев должны быть похоже, т. к. работают с одинаковыми свойствами нормального распределения.
Критерии, которые используют медиану.
— Возможно, мы их, когда ни будь рассмотрим.
Остальные критерии откровенно бесполезны.
Причины:
— Сомнительные критические значения. Стоить только вспомнить многолетний спор про неправильные коэффициенты Граббса, да работы которые основаны на неправильных выводах предыдущих работ.
— Повторяют Критерий Граббса, или Диксона в разных вариациях.
— Не подвергались анализу.
— Наверное самое главное, практический все вариации друг друга, используют либо нормальное распределение, либо разность крайних значений. Это должно приводить к одинаковым результатам (если критические значения посчитаны правильно). В итоге никаких альтернативных данных мы не получим, а вот ошибочные выводы вполне вероятно.

Предисловие.
В практике не всегда, а скорее никогда, идеального нормального распределения не будет, помимо этого, бывают редкие события. Всё это по-разному может повлиять на описательные статистики, которые используют критерии, и в итоге может привести к неверным выводам.
Для подтверждения своих выводов можно использовать арбитражные методы, вычисляющие через другие свойства нормального распределения.
Для обнаружения выбросов рассмотрим критерий Рябкова первого порядка (R1), основанного на среднем абсолютном отклонении.

С помощью генератора случайных чисел получим массивы данных, содержащие несколько тысяч выборок n= 7; n= 20; n=59 с нормальным законом распределения, заранее заданными средними величинами и дисперсиями.
Добавляем к каждой выборке значение из диапазона от 0σ до 6σ (можно от 0σ до −6σ), где σ — это среднеквадратичное отклонение (это будет выброс, значение не принадлежит выборке), назовём его «промах». Итоговое кол-во в выборках будет n= 8; n= 21; n=60

Исследуем каждую выборку на наличие выбросов и промахов. Исследование будем проводить для минимального и максимального числа, при p-value = 0,01 (граница на которой необходимо принимать решение об исключении значения). Оценивать будем число с наибольшим критическим значением (это будет наибольшее, или наименьшее значение).
Построим графики 1.
По оси X на графике располагаются значения величины i из выражения iσ (добавленное значение 0σ-6σ),
По оси Y
1. Процент обнаружения выброса «промаха». (промах был определён как выброс), положительный результат (выброс обнаружен).
2. Чёрная линия процент одинаковых результатов для обоих критериев «корреляция» (оба критерия выброс обнаружили, оба критерия выброс не обнаружили). С одной стороны если критерии будут выдавать максимально близкие результаты, смысл их параллельного использования пропадает. С другой результаты абсолютно отличные от результатов критерия Граббса, будут иметь максимум ошибок.
График 2
3. Процент чисел, определенных как выброс, но не являющихся «промахом», ложноположительный результат (ошибка). По факту — это две ошибки, ошибка первого и второго рода, так как реальный выброс мы не обнаружили..
Под графиками даны дополнительные данные.

-Красная линия, критерий Граббса
-Оранжевая линия Критерий R1
-Синяя штрихпунктирная, результаты обоих критериев с логической операцией или. Например: критерий Граббса обнаружил выброс, или критерий R1обнаружил выброс. Для графика 2 Ошибка первого и второго рода у критерия Граббса или критерия R1
-Зелёная штрихпунктирная, результаты обоих критериев с логической операцией и. Например: критерий Граббса обнаружил выброс, и критерий R1 обнаружил выброс. Для графика 2 Ошибка первого и второго рода у критерия Граббса и критерия R1
-Чёрная линия процент одинаковых результатов для обоих критериев

Результаты для n = 8
99% промахов будет обнаружено: для критерия Граббса при ≈μ+10,3σ, для критерия R1 при ≈ μ+11,7σ
Без добавленного промаха процент ошибок с логической операцией "или" 1,32%, с логической операцией "и" 0,68%, корреляция 99,3%

Результаты для n = 21
99% промахов будет обнаружено: для критерия Граббса при ≈μ+6σ, для критерия R1 при ≈μ+7,2σ
Без добавленного промаха процент ошибок с логической операцией "или" 1,45%, с логической операцией "и" 0,55%, корреляция 99,1%

Результаты для n = 60
99% промахов будет обнаружено: для критерия Граббса при ≈μ+5σ, для критерия R1 при ≈ μ+5,6σ
Без добавленного промаха процент ошибок с логической операцией "или" 1,40%, с логической операцией "и" 0,60%, корреляция 99,2%

Из графиков видно что чаще промахи удаётся обнаружить когда мы используем вариант (или) один из критериев обнаружил выброс, (что и логично), при этом при количество ошибок в два раза больше чем с вариантом, оба критерия обнаружили выброс. Точность обнаружения у критерия Граббса лучше (красная линия), чем у критерия R1(оранжевая линия). Уровень ошибок у обоих критериев примерно одинаков.

1. Большинство критерии на определение выбросов бесполезны.
2. Критерий Граббса является наиболее точным критерием, исследуемым мной.
Заключение, не скажу что однозначно верное.
Поиск выбросов с использованием арбитражных методов, некоторые варианты реализации:
— Если один из критериев обнаружил выброс(вариант или), выброс следует исключить, не является оптимальным, так как увеличивается количество ложных срабатываний, при незначительном увеличении точности.
— Если оба критерия одновременно обнаружили выброс(вариант и), выброс следует исключить, может быть использован:
а) когда выбросы крайне маловероятны.
б) есть предположения о искажении нормального распределения.
в) необходимо уменьшить количество ложных срабатываний (например, большое количество исследуемых выборок, автоматическая обработка данных).
При этом точность будет немного хуже, чем у менее точного из используемого критерия, а количество ложных срабатываний в некоторых случаях будет меньше на 40%

Результаты для n= 5
99% промахов будет обнаружено: для критерия Граббса при ≈μ+22σ, для критерия R1 при ≈ μ+23σ
Без добавленного промаха процент ошибок с логической операцией или 1,08%, с логической операцией и 0,90%, корреляция 99,8%

В данном примере показано что чем выборка меньше, тем сложнее обнаружить выброс, любым критерием. Это не недостаток критериев — это свойство.
Точность обнаружения для обоих критериев при малом n практический одинаковая.
:оригинальный текст

Аккредитация в Росаккредитации