Публикация научных статей.
Вход на сайт
E-mail:
Пароль:
Запомнить
Регистрация/
Забыли пароль?
https://wos-scopus.com
Научные направления
Поделиться:
Статья опубликована в №44 (апрель) 2017
Разделы: Математика
Размещена 26.04.2017. Последняя правка: 12.05.2017.

Модификации метода коррелированных процессов и их применение при статистическом моделировании

Некрасов Сергей Александрович

д.т.н.

Южно-Российский государственный политехнический университет

профессор

Аннотация:
Обсуждается ряд употребительных методов для решения стохастических задач на основе процедуры статистических испытаний (Монте-Карло). Главное внимание уделено методу коррелированных процессов. Осуществлено сравнительное исследование эффективности рассматриваемых методов на примере вычисления определенных интегралов.


Abstract:
Considered a number of commonly used methods for solving stochastic tasks based on the procedure of statistical tests (Monte-Carlo). The focus is on the method of correlated processes and bilateral methods. A comparative study of the effectiveness of these methods on the example of the characteristic problems of numerical calculation of integrals.


Ключевые слова:
имитационное моделирование; метод Монте-Карло; метод ускоренного статистического моделирования; сравнение эффективности.

Keywords:
simulation; Monte Carlo method; the method of accelerated statistical modeling to compare the efficacy


УДК 519.6 : 621.316

Введение

Методы статистического моделирования (Монте-Карло) широко используются на практике и обладают большими возможностями. Однако их применение часто приводит к большим затратам машинного времени [1-3]. Это связано с тем, что при использовании методов Монте-Карло приходится многократно решать одну и ту же задачу, но при разных значениях исходных данных.

Технология наиболее употребительных методов ускорения статистического моделирования предполагает построение некоторой упрощенной модели, аппроксимирующей оператор решаемой задачи. Естественно, данное обстоятельство требует учета множества особенностей, с которыми приходится иметь дело при решении задач из конкретных предметных областей.

В статье рассматривается технология одного из наиболее употребительных методов - метода коррелированных процессов.

1.  Основные соотношения метода коррелированных процессов

Обозначим через `lambda` искомый n-мерный вектор вероятностных характеристик исследуемой системы, а через `mu`m-мерный вектор вероятностных характеристик упрощенной системы:    где M[…] – среднее по множеству наблюдений величины, входящей в скобки; R и Sn- и m-мерный векторы, компоненты которых представляют собой некоторые функции процессов соответственно в исходной и упрощенной системах.

Пусть с исходной и упрощенной системами осуществлено в одинаковых условиях N независимых машинных статистических экспериментов. Выборочные средние `lambda` * и `mu`* векторов `lambda`  и `mu`, найденные по данным этих N экспериментов:

     Эксперименты с одинаковыми внешними воздействиями на исходную и упрощенную системы имеют одинаковый номер, т.е. значения Rj и Sj получены при одних и тех же воздействиях.  Точное значение вектора `mu` вероятностных характеристик упрощенной системы находится аналитически.

В методе коррелированных процессов используется оптимальная оценка `lambda` 0 вектора `lambda` по значениям векторов `lambda` *`mu` * и `mu` на основе оценки вероятностных характеристик исходной системы по статистическим значениям характеристик исходной и упрощенной системы:

                     

где 
   
`lambda` i0 и `lambda` i*i-е компоненты векторов `lambda` 0 и `lambda` * соответственно; Rij i-я компонента вектора Rj.

Величина `mu`*–`mu` представляет собой статистическую ошибку в определении вектора `mu` . Величина  равна значению ошибки, пересчитанной для величины `lambda` i* с учетом корреляционной связи `lambda` i* и `mu`*. Оценка `lambda` i0 получается более точной, чем статистическое значение `lambda` i*. Оценка компонент вектора `lambda` может быть произведена независимо.  
На практике для применения соотношения (2) требуется знать корреляционные матрицу-строку KRiS и матрицу KSS. В некоторых случаях точное определение может оказаться затруднительным. При этом вместо Kss находят статистическое значение Kss* , вычисленное по тем же N экспериментам, по которым были найдены `lambda` * и `mu`*: Исходная система не решается аналитическим методом, поэтому вместо корреляционной матрицы-строки  находят ее статистическое значение:

 Для малых статистических выборок предпочтительней несмещенные оценки: Проблему представляет отыскание приближенной модели. Обычно она находится при помощи линеаризации или уменьшения детальности, числа факторов и т.п. исходной модели. Даже если приближенная модель очень приближенна, точность статистического метода будет не хуже, чем при применении метода Монте-Карло. Повышению точности расчета способствует корреляция между оцениваемыми параметрами исходной и приближенной модели. Главным недостатком метода в [2] считается систематическая ошибка при статистической оценке параметров.

2. Модификации метода коррелированных процессов

2.1. Применение статистической вычислительной или экспериментальной выборочной оценки высокой точности

Понятно, что даже упрощенная система не всегда поддается аналитическому решению. Точное нахождение значения вектора m вероятностных характеристик упрощенной системы может потребовать чрезмерного огрубления исходной системы. Между тем имитационное моделирование на основе упрощенной системы может быть весьма эффективным по причине низких вычислительных затрат. Поэтому можно с небольшими затратами осуществить большое количество M статистических экспериментов с упрощенной системой и использовать соответствующее выборочное среднее повышенной точности:                    
2.2. Применение сверхэффективной статистической оценки выборочного среднего и нелинейных оценок

Очень часто выборочные средние экспериментальных значений векторов исходной и упрощенной системы подчиняются нормальному или асимптотически нормальному закону распределения в силу центральной предельной теоремы, либо просто симметричному относительно центра закону распределения. Это и прочие свойства законов распределения параметров упрощенной системы можно использовать для повышения эффективности статистических оценок.  Например, в  случае симметричного закона распределения сверхэффективной является следующая оценка выборочного среднего:                         
В традиционном варианте метода коррелированных процессов применяется линейная оценка параметров. Ее точность может улучшить нелинейная оценка, так как линейная оценка является частным случаем нелинейной. Например, можно искать разложение  исследуемого параметра в виде полинома по степеням `lambda ` *`mu`* и `mu` .

2.3. Применение метода коррелированных процессов при «пассивном» эксперименте

Обычно метод коррелированных процессов применяют для имитационного моделирования, предполагающего некоторую аналитическую модель изучаемого явления. Между тем существует очень большой круг задач, связанных с обработкой выборок большого объема и многомерным регрессионным анализом. Статистические значения Sj можно получить, в принципе, из (активного) физического эксперимента (при условии небольшой трудоемкости), т.е. измерением параметра или характеристики  процесса.

Во многих случаях имеется большой объем данных т.н. «пассивного» эксперимента, т.е. эмпирические данные, полученные не при решении рассматриваемой задачи, а при других обстоятельствах. При этом математическая (аналитическая) модель явления обычно неизвестна и применяется статистическая обработка методами регрессионного анализа. В данном случае существует интерес в формулировке аналога метода коррелированных процессов. Вначале можно рассмотреть (упрощенную) статистическую модель с одним или несколькими факторами и получить, используя большой объем данных «пассивного» эксперимента, соответствующую регрессию относительно высокой надежности. Для повышения точности выборочного среднего можно осуществлять дополнительный «активный» эксперимент (при его доступности). Основная (многофакторная) статистическая модель система здесь соответствует исходной аналитической системе при традиционном варианте метода коррелированных процессов. Т.е. можно, например, использовать корреляцию уравнений регрессии для одно- и многофакторной модели. Для упрощенной статистической модели целесообразно выбирать факторы приоритетного значения.

3. Сопоставление методов выделения главной части и коррелированной выборки при вычислении определенных интегралов

Предположим, что требуется вычислить интегралИзвестны функция `Psi`1(u) `~~` `Psi`(u) и значение интеграла Пусть x – некоторая случайная величина (скалярная или векторная), равномерно распределенная в области интегрирования W, объем которой без ограничения общности положим равным единице. В этом случае 

 Оценка значения интеграла в методе коррелированной выборки осуществляется по формулам (1) – (2). В случае обычного метода Монте-Карло

При использовании широкоупотребительного метода выделения главной части (называемого также методом управляемой переменной [2]) значение интеграла оценивается по формуле 

В качестве численного примера рассмотрим случай, когда    Результаты вычислений представлены в табл. 1 (при `epsilon` = 0,5) и табл. 2 (при `epsilon` = 0,1).

                                                                          Таблица 1

N

d, %

g1

g2

50

0,65

80

20

200

0,3

80

30

800

0,16

100

20

 

                                                                          Таблица 2

N

d, %

g1

g2

50

0,16

200

25

200

0,08

300

30

800

0,04

300

25

 В таблицах обозначено: d – относительная погрешность метода коррелированной выборки, g1и g2 – выигрыш в точности по сравнению с методами Монте-Карло и выделения главной части соответственно.

При `epsilon` = 0,01 выигрыш в точности метода коррелированных процессов по сравнению с методом Монте-Карло равен уже около 2500, при `epsilon` = 0,001 – около 20 000.
Отмеченные закономерности сохраняются и для других более сложных вариантов подынтегральных функций.

                                      Прочие подходы. Редукция стохастической краевой задачи
                                                                          к уравнению 
  Фоккера-Планка

      Как известно,  стохастическая задача Коши при помощи простой методики сводится к соответствующему уравнению Фоккера-Планка. Для краевой задачи такой прием также возможен. Для этого достаточно погрузить краевую задачу в более общий класс с оператором эволюционного типа (т.е. добавить к фазовому пространству краевой задачи время и соответствующий дифференциальный оператор). Этот прием хорошо известен, так как краевые задачи часто решают методами установления. Получившуюся нестационарную краевую задачу аппроксимируем методом прямых и редуцируем к задаче Коши для системы обыкновенных дифференциальных уравнений со стохастическими правыми частями. К данной задаче Коши применяем соответствующую методику и формулируем уравнение Фоккера-Планка для плотности вероятности пребывания системы в допустимых состояниях. Конечно, размерность фазовой области получается относительно большой. Возможно, в ряде частных случаев можно упростить уравнение Фоккера-Планка: обнулить оператор  дифференцирования по времени и перейте к стационарному уравнению, осуществить некоторые редукции для получения более простых форм.
                                                                                Заключение

Метод коррелированных процессов в осуществленных статистических экспериментах приводит к выигрышу в точности в среднем в  10–20 раз. Но из-за случайного фактора такой выигрыш не гарантируется, примерно в каждом десятом статистическом эксперименте имел место проигрыш в точности.

Все рассмотренные подходы применимы для решения широкого класса стохастических задач как с сосредоточенными, так и с распределенными параметрами.
 

Библиографический список:

1. Пугачев В.Н. Комбинированные методы определения вероятностных характеристик. М.: Сов. радио, 1973. 256 с.
2. Васильев Д.В., Сабинин О.Ю. Ускоренное статистическое моделирование систем управления. Л.: Энергоатомиздат. Ленингр. отд-ние, 1987. 136 с.
3. Лихолет Н.О., Емельянов В.Ю., Шаров С.Н. Возможности сокращения трудоемкости статистического моделирования корреляционно-экстремальных систем. // Информационно-управляющие системы. Вып. 3. 2009. С. 13-20.
4. Некрасов С.А. Методы ускоренного статистического моделирования и их применение в электротехнических задачах/ Изв. вузов. Электромеханика. - 2008. - No 5. - С. 13 - 19. http://elibrary.ru/item.asp?id=12159957




Комментарии пользователей:

11.05.2017, 12:33 Мирмович-Тихомиров Эдуард Григорьевич
Отзыв: Как не стыдно рецензенту, но он не разобрался, откуда взялись цифры повышения точности в тысячи и десятки тысяч раз. Я прошу у автора прощения. Хотелось бы пояснить читателям, для каких практических задач его попытки улучшить метод Монте-Карло имеет значение: оценка динамики функций распределения или (и) частот столкновений частиц, броуновского движения, других каких-то практических или теоретических физических задач. Принимая объём за единицу, мы, видимо, применяем нормировку какой-то величиной, являющейся в данной области константой. Или это не так? Большое значение в этой области статистики является выбор типа распределения, право исключения Т-выбросов (экстремальных точек), распределений с "тяжёлыми хвостами". Имеют ли эти задачи-проблемы к теме этой работы? Уважаемый Сергей Александрович, я только задаю вопросы, а не критикую, и прежде чем дать рецензию, я хотел бы понять суть этого серьёзного труда.


12.05.2017, 13:24 Некрасов Сергей Александрович
Отзыв: Уважаемый Эдуард Григорьевич, цифры, о которых Вы пишете, появились из программы имитационного моделирования. Для подтверждения, что такая программа существует, я добавил в список литературы ссылку на свою статью в авторитетном вузовском издании. Практическое применение результаты находят при имитационном моделировании различных технических и естественных объектов. С уважением, Некрасов С.А.


13.05.2017, 17:24 Мирмович-Тихомиров Эдуард Григорьевич
Отзыв: Уважаемы Сергей Александрович! Так как ни на какие конкретные вопросы Вы не ответили, то пусть ещё кто-нибудь пояснит, как может точность модели, аппроксимации, решения любой задачи (точность - это относительная, безразмерная величина в диапазоне 0-1) повышаться в десятки тысяч раз. Т.е., например, она была 10%, а стала 10 в минус 5 процентов? Так?


23.05.2017, 19:40 Некрасов Сергей Александрович
Отзыв: Уважаемый Эдуард Григорьевич, что тут неясного, да погрешность много меньше. Объяснение простое: эпсилон стало меньше, точность приближенной модели стала лучше, что улучшает эффективность метода коррелированных процессов. С уважением, Некрасов С.А.


Оставить комментарий


 
 

Вверх