Публикация научных статей.
Вход на сайт
E-mail:
Пароль:
Запомнить
Регистрация/
Забыли пароль?

Научные направления

Поделиться:
Статья опубликована в №78 (февраль) 2020
Разделы: Науки о Земле
Размещена 20.02.2020. Последняя правка: 31.03.2020.
Просмотров - 915

Метрологические особенности осреднения данных при океанологических измерениях

Степанюк Иван Антонович

доктор физико-математических наук, профессор

Российский государственный гидрометеорологический университет

профессор кафедры океанологии

Аннотация:
Оцениваются возможности уменьшения погрешности при осреднении разнородных данных при океанологических измерениях. Рассматриваются неравноточные измерения при объединении двух групп с различающимися объемами данных. Анализируются особенности осреднения при расположении неравноточных данных «вперемежку». Этот вариант наиболее распространен в океанологии. Показано, что реальные погрешности существенно больше, чем ожидаемые.


Abstract:
The possibility of reducing the error when averaging heterogeneous data for Oceanological measurements is evaluated. Unequal measurements are considered when combining two groups with different data volumes. We analyze the features of averaging when placing non-uniform data "interspersed". This option is most common in Oceanology. It is shown that the actual errors are significantly greater than the expected ones.


Ключевые слова:
океанологические измерения; неравноточные измерения; погрешности осреднения; измерения «вперемежку»

Keywords:
oceanological measurements; non-precision measurements; averaging errors, «interspersed» measurements


УДК 551.46

Введение. В настоящее время из-за широкой доступности цифровых методов измерений в океанологии распространилось убеждение, что конечные результаты экспериментальных исследований можно получать с очень высокой точностью, если применять операции осреднения. Действительно, в метрологии существует такой прием – погрешность среднего арифметического значения результата группы измерений может соответствовать выражению:

 1.png                                                                      (1)

где σXi  – погрешность отдельного измерения;

       N   – количество осредняемых значений.

Частота отсчетов в современных аналого-цифровых преобразователях, как правило, высокая. И тогда возникает кажущаяся «легкость» повышения качества измерений. При этом условия применимости формулы (1) чаще всего остаются невыполненными.

Приемы осреднения с декларируемым повышением точности широко применяются приCTD–зондировании (например [6]), при объединении судовых и спутниковых данных, и особенно – в океанологической спутниковой альтиметрии (например [2]).

Однако формула (1) применима, если [3]

– измерения являются равноточными;                              

– группы данных измерений являются однородными;

– измерения являются независимыми.

Равноточность данных – допустимость различий средних квадратических отклонений групп данных  может быть проверена: для двух групп – с помощью критерия Р.Фишера, для большего количества групп – с помощью критерия М. Бартлетта.

Однородность данных – допустимость различий средних арифметических значений для двух нормально распределенных групп проверяют при помощи критерия Стьюдента, для числа групп более двух – с помощью критерия  Р.Фишера. Если распределения отличаются от нормального, то используются ранговые критерии Уилкоксона и Сиджела-Тьюки.

Методики расчета критериев даны в работе [3]. Здесь они не рассматриваются.

Независимость данных – это отсутствие корреляции между погрешностями отдельных измерений. Проверяется она расчетом коэффициентов корреляции. У зависимых данных суммирование погрешностей производится с добавлением члена, содержащего коэффициенты корреляции.

Становится целесообразным оценить эффективность осреднения при нарушении условий применимости формулы (1).

Особенности осреднения при неравноточных измерениях. Такая задача может возникнуть, например, при осреднении судовых и спутниковых данных. По принципу: если взять больше значений, то осредненные характеристики получатся намного лучше. Но такой принцип чаще всего неуместен.

По правилам метрологии при обработке совокупностей данных прямых измерений используется понятие весов (весовых коэффициентов) групп данных. Веса групп определяются разными способами.

В качестве весов можно использовать величины:

  • пропорциональные величине среднего квадратического отклонении (дисперсии);
  • пропорциональные числу измерений;
  • пропорциональные вероятности;
  • полученные экспертными оценками.

 Наиболее распространенным является использование весовых коэффициентов, обратно пропорциональных дисперсиям рядов, если эти дисперсии известны:

 

2.png,                                                                                    (2)

 где  μ – некоторый постоянный коэффициент, задаваемый разными приемами, например как дисперсия группы данных, вес которой принят за единицу. 

Выражение (2) вполне логично – чем меньше дисперсия, тем больше вес данных этой группы.

С учетом весовых коэффициентов получаются следующие выражения для среднего арифметического значения совокупности и для дисперсии этой совокупности (например [3]). В наших обозначениях:

 

               3.png                                                                    (3)

 

Здесь Pi – вес каждого измерения (группы измерений).

Рассмотрим простейшую ситуацию объединения судовых и спутниковых данных измерений поверхностной температуры. В каждой группе измерения считаем равноточными, но различия погрешностей между группами не удовлетворяют критерию Р.Фишера. Распределение погрешностей в группах соответствует нормальному закону. Различия средних арифметических значений между группами удовлетворяет критерию Стьюдента. Тогда для взвешенного среднего арифметического будет справедливо выражение:

 

4.png                                           (4)

 

Из выражения (4), рассматривая его как косвенное измерение, легко получить выражение для взвешенного среднего квадратического отклонения (погрешности расчета взвешенного среднего):

 

  5.png                                                                             (5)

 

Здесь индексы m и  n относятся к характеристикам  судовых (m) и спутниковых (n) измерений, а сами величины – количество используемых значений при осреднении.

Из выражения (5) при условии равноточных измерений (Pm=Pn, σm= σn, m=n) получается выражение, полностью соответствующее выражению (1):

 

                 6.png                                                                               (6)

 

Пропорциональность весов обратным дисперсиям. Примем за единицу веса значение Pm, тогда

 6.png

и выражение (5) преобразуется к виду:

 

7.png,                                                                    (7)

 

где  K – коэффициент уменьшения погрешности.

 Если пользоваться выражением (1), то ожидаемое (кажущееся) уменьшение погрешности по отношению к σm  будет равно 7.png . Однако при учете весов снижение погрешности получается существенно меньше (табл. 1). При расчетах использовано условие, что погрешность спутниковых данных не менее чем в 5 раз больше погрешности судовых данных (σn=5σm).

Веса, пропорциональные количеству измерений.  Использование в качестве весов количества измерений в каждой группе, т.е. значений m и  n при описанных выше условиях (однородность групп, равноточность внутри каждой группы, нормальный закон распределения внутри групп),  позволяет получить из (5) выражение для погрешности:

 

 

8.png                                                                   (8)

 

Осреднение данных «все подряд, вперемежку». При осреднении без учета веса, т.е.  по принципу «все подряд, вперемежку», выражение для общего среднего получается следующим:

 

9.png                                    (9)

 

Из выражения (9), рассматривая его как косвенное измерение, можно получить выражение для погрешности общего среднего, совпадающее с выражением (8).

Соответственно, при условии равноточности, как и ранее, получается выражение (6).

 Использование весов, пропорциональных вероятности. Для такого варианта также полностью применимы выражения (3), а в качестве весов используются значения вероятности, например, доверительных вероятностей для групп значений. Такой прием практически равноценен тому, что веса считают пропорциональными обратным дисперсиям.

 Экспертные оценки веса. Полное соответствие выражению (8) получается также при использовании весов, обратно пропорциональных количеству «грубых» данных, т.е.

 

10.png                                                              (10)

Расчеты реального уменьшения погрешности K  производились  как для больших объемов суммарных рядов (m+n=100m+n=200), так и для малых объемов (m+n=25). Определялись коэффициенты  уменьшения погрешности для разных соотношений между m и n, при различных вариантах весов двух совместно осредняемых групп данных. Результаты представлены в таблицах 1 (большие ряды) и в таблице 2 (малый ряд), а также проиллюстрированы на рис.1 и 2. 

Таблица 1

  

m

n

Уменьшение погрешность без учета «грубых» данных, K

Ожидаемое (кажущееся)

уменьшение погрешности, K

Реальное уменьшение погрешности K, при  Pm~μ/ σm  и Pn~μ/ σn

Реальное уменьшение погрешности K, при осреднении   «вперемежку» ипривесах, пропорциональных количеству данных

5

95

0,45

0,1

0,43

0,49

10

90

0,31

0,1

0,3

0,47

20

80

0,22

0,1

0,22

0,45

30

70

0,18

0,1

0,18

0,42

40

60

0,16

0,1

0,15

0,39

50

50

0,14

0,1

0,14

0,36

60

40

0,13

0,1

0,13

0,32

70

30

0,12

0,1

0,12

0,29

80

20

0,11

0,1

0,11

0,24

90

10

0,105

0,1

0,105

0,16

продолжение таблицы( σn=5σm,  m+n=200   )

 

5

195

0,45

0,07

0,43

0,35

10

190

0,31

0,07

0,3

0,34

20

180

0,22

0,07

0,22

0,34

30

170

0,18

0,07

0,18

0,33

40

160

0,16

0,07

0,15

0,32

50

150

0,14

0,07

0,14

0,31

60

140

0,13

0,07

0,13

0,30

70

130

0,12

0,07

0.12

0,29

80

120

0,11

0,07

0,11

0,28

90

110

0,105

0,07

0,10

0,27

 

 Таблица 2 

 

m

n

Уменьшение погрешность без учета «грубых» данных, K

Ожидаемое (кажущееся)

уменьшение погрешности, K

Реальное уменьшение погрешности K, при  весах,
обратных дисперсиям

Реальное уменьшение погрешности K, при осреднении   «вперемежку» иприPm=m 

Pn=n, а также при условиях (10)

5

20

0,2

0,45

0,43

0,9

7

18

0,2

0,38

0,37

0,85

10

15

0,2

0,32

0,31

0,78

12,5

12,5

0,2

0,28

0,28

0,72

15

10

0,2

0,26

0,26

0,65

20

5

0,2

0,224

0,23

0,48

 

 Анализ и обсуждение.  Из полученных результатов следует, что «прибавление» грубых данных к более точным (в примере – спутниковых данных к более точным судовым данным) практически не результативно (кривые 3 и 4 на рис.1).  Незначительный эффект улучшения осредняемых судовых данных появляется лишь при очень малых отношениях количества точных данных и грубых (5:95, 5:195) и при учете весов, обратных дисперсиям. Реальная погрешность после осреднения получается практически такой же, как и при осреднении только одних точных данных. Кривые 3 и 4 асимптотически приближаются к значению коэффициента К, как бы ожидаемому при суммарном количестве данных. Окончательно же он становится равным этому ожидаемому значению только при количестве точных значений, равных суммарному количеству.

 1.png

 

Рисунок 1– Изменчивость коэффициента уменьшения погрешности

при различных условиях осреднения для больших суммарных рядов.

Обозначения: 1– «кажущееся» уменьшение погрешности при m+n=100,

2 – аналогично, при m+n=200, 3 – реальное уменьшение погрешности

без учета привлекаемых «грубых» данных, 4 – реальное

уменьшение погрешности  по выражению (7), 5 – реальное

уменьшение для m+n=100 при осреднении «вперемежку»,

6 – реальное уменьшение   для  m+n=200 при осреднении "вперемежку"

 

Использование обратных дисперсий в качестве весов групп данных получается более интересным, чем использование значений количества данных (кривые 5 и 6). Эти кривые  также полностью соответствуют осреднению «вперемежку», наиболее характерному при океанологических измерениях. Здесь грубые данные существенно увеличивают суммарную погрешность. Ожидаемое уменьшение коэффициента К до 0,1 (кривая 5, сумма осредняемых значений 100) и до 0,07 (кривая 6, сумма осредняемых значений 200) по-прежнему получается при количестве точных значений, равных суммарному.

Однако, в целом, уменьшение погрешности все же получается. Но, например,  вместо ожидаемого «в десять раз» (100 значений) оно получается всего «в два раза». Для увеличенного количества (кривая 6) – вместо ожидаемого «в 14 раз» получается примерно «в три раза». А поскольку привлечение дополнительных данных требует существенного увеличения усилий при обработке, то возникает вопрос целесообразности такого привлечения.

При малом количестве суммарных данных (рис.2, m+n=25) наблюдается примерно такая же картина. При использовании в качестве «весов» обратных дисперсий получается, что по сравнению с рис.1 немножко «затягивается» слабое улучшение (кривые 2 и 3), однако существенно  изменяется уменьшение погрешности при осреднении «вперемежку» (примерно в 1,1÷1,4 раза вместо ожидаемого «в пять раз»).

 

2.png 

Рисунок 2 – Характер изменений коэффициента уменьшения

погрешности при малом суммарном количестве используемых

данных  (m+n=25). Обозначения: 1 – «кажущееся» уменьшение

 погрешности», 2 - реальное уменьшение погрешности без учета
привлекаемых грубых данных; 3 - реальное уменьшение погрешности
по выражению (7); 4 - реальное уменьшение погрешности
при осреднении "вперемежку".

 Следует также отметить, что полученные оценки сделаны при некоррелируемых погрешностях. При наличии корреляции суммарная погрешность возрастает пропорционально удвоенному произведению коэффициента корреляции и обеих погрешностей. Аналогично ухудшаются метрологические характеристики при осреднении неоднородных данных. Однако эти особенности требуют отдельного рассмотрения.

Выводы.

1. В настоящее время из-за возрастания скорости съема цифровых значений сформировалась  иллюзия существенного повышения точности за счет осреднения  («осреднили 10000 значений – увеличили точность в 100 раз»). К сожалению, это не более чем иллюзия.

Тем не менее, такие приемы характерны для современной океанологической измерительной техники. Для ряда широко используемых CTD-зондов указываются столь малые доверительные границы погрешности, которые в настоящее время никак не могут быть подтверждены метрологическими испытаниями (см. например, нашу работу [4]). Причем, применительно к CTD-зондам приемы использования весов должны быть усилены учетом неоднородности данных из-за наличия вертикальной стратификации измеряемых характеристик.

2. При океанологических измерениях наиболее распространен вариант осреднения «вперемежку», поскольку чаще всего невозможно выделить отдельные группы данных с нормированными метрологическими характеристиками. Это, например, особенно характерно для океанологической спутниковой альтиметрии, когда расстояние между альтиметром на орбите и поверхностью моря достигает 1000 км, и между ними находится очень динамичная среда (см. например [1,5]), где скорость распространения радиолокационного импульса от альтиметра и обратно практически не контролируется. Из-за этого вряд ли возможны часто декларируемые погрешности измерений уровня в открытом море примерно до единиц сантиметров (например [2]).

3. Дополнительно можно отметить необоснованные завышения точности за счет осреднения при различных иных измерениях: у доплеровских измерителей течений ADSP (например [7]), при вертикальном CTD-зондировании (например [6]), при буксировании зондов, при буксировании «термокос», и др.

4. Поскольку при осреднении «вперемежку» отсутствует возможность отдельного выявления погрешностей для «перемешанных» групп данных, то наиболее целесообразно ориентироваться на метрологически обеспеченные значения погрешности, полученные сличением с эталонами и не надеяться на их существенное улучшение за счет осреднения.

5. Пренебрежение неравноточностью осредняемых данных может приводить к ошибочным физическим интерпретациям получаемых экспериментальных результатов.

Библиографический список:

1. Госсард Э., Хук У. Волны в атмосфере.– М.: «Мир», 1978.–532 с.
2. Лебедев С.А., Костяной А.Г. Спутниковая альтиметрия Каспийского моря.– М.: Издательский центр «Море» Международного Института Океана, 2005.– 366 с.
3. Селиванов М.Н., Фридман А.Э., Кудряшова Ж.Ф. Качество измерений. Метрологическая справочная книга.– Л.: Лениздат, 1987.– 295 с.
4. Степанюк И.А., Степанюк А.И., Атаджанова О.А. Проблема метрологического обеспечения океанологических CTD-зондов //Электронный периодический рецензируемый журнал «SCI-ARTICLE.RU». – 2017. – № 49 (сентябрь). – С.117-129
5. Тащилин А.В. Формирование крупномасштабной структуры ионосферы в спокойных и возмущенных условиях.– Дисс.на соискание ученой степени доктора физ.-мат.наук. Спец.: Физика атмосферы и гидросферы.– Институт солнечно-земной физики Сибирского отделения РАН.– Иркутск, 2014.– 265 с.
6. FSIPost. Post Processing Software. User Manual Falmouth Scientific, Inc. 2004. – 76 р.
7. SonTek/YSI ADP. Acoustic Doppler Profiler Technical Documentation. – 2001. – 186 р.




Рецензии:

19.03.2020, 9:56 Галкин Александр Федорович
Рецензия: Статья написана на актуальную тему. Стиль изложения логичный. Выводы соответствуют содержанию. Статья будет полезна всем специалистам, занимающимся получением и обработкой экспериментальных данных. Рекомендуется к публикации.

20.03.2020 19:19 Ответ на рецензию автора Степанюк Иван Антонович:
Автор благодарен рецензенту за положительный отзыв о работе. С уважением И.А.Степанюк

19.03.2020, 16:49 Петрухин Геннадий Михайлович
Рецензия: 19.03.2020 Статья затрагивает вопросы уменьшения погрешности обработки данных при неравноточных измерениях. В частности делается вывод, что пренебрежение неравноточностью осредняемых данных может привести к ошибочным интерпретациям экспериментальных результатов. Предлагается ориентироваться на метрологически обеспеченные значения погрешности, полученные сличением с эталонами. Статья будет полезна специалистам и ставит задачу совершенствования методологии океанографических измерений и обработки экспериментальных результатов. Статья рекомендуется к публикации.
20.03.2020 19:19 Ответ на рецензию автора Степанюк Иван Антонович:
Автор благодарен рецензенту за положительное мнение о работе. С уважением И.А.Степанюк



Комментарии пользователей:

19.03.2020, 11:48 Мирмович Эдуард Григорьевич
Отзыв: Уважаемый Иван Антонович! Рецензент уже видел эту статью и рецензировал. Не могли бы Вы разъяснить эту ситуацию


20.03.2020, 19:43 Степанюк Иван Антонович
Отзыв: Автор благодарен рецензентам за проявленный интерес к его работе и за положительные рецензии. Эдуард Григорьевич! Ну никак не могу разъяснить. Ваша рецензия на сайте журнала просто не появлялась - я все отслеживаю. Если у вас есть замечания, то я непременно их учту. С уважением И.А.Степанюк


Оставить комментарий


 
 

Вверх