ИССЛЕДОВАНИЕ ЧАСТОТЫ ПОЯВЛЕНИЯ УСТОЙЧИВЫХ РАВНОВЕСИЙ В ИГРЕ СО СЛУЧАЙНЫМИ ФУНКЦИЯМИ ВЫИГРЫША - Студенческий научный форум

IX Международная студенческая научная конференция Студенческий научный форум - 2017

ИССЛЕДОВАНИЕ ЧАСТОТЫ ПОЯВЛЕНИЯ УСТОЙЧИВЫХ РАВНОВЕСИЙ В ИГРЕ СО СЛУЧАЙНЫМИ ФУНКЦИЯМИ ВЫИГРЫША

Кучина А.В. 1
1Федеральное государственное бюджетное образовательное учреждение высшего образования «Ивановский государственный энергетический университет имени В.И. Ленина»
 Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке "Файлы работы" в формате PDF
1. Введение.

Основная задача: с помощью процедуры нащупывания по Курно мы можем приближенно найти в игре равновесие по Нэшу. Однако заметим, что этот процесс не всегда приводит к устойчивому исходу. Исследуем частоту появления устойчивых равновесий в игре со случайными функциями выигрыша квадратичного вида. Затем заменим функции выигрыша на более сложные и найдем частоту появления устойчивых равновесий уже для этой игры и сделаем соответствующие выводы.

Рассмотрим игру двух партнеров с пространствами стратегий и с функциями выигрыша у первого игрока и у второго игрока, в которой и имеют вид:

и

,

где – случайные величины, имеющие равномерное распределение на интервале , а и – отрезки и вещественной оси R, где отрезки взяты достаточно большими для того, чтобы устойчивый исход , определяемый системой принадлежал прямому произведению

В этой игре есть равновесие по Нэшу (согласно теореме на стр. 3), которое можно найти приближенно методом нащупывания по Курно, но стоит заметить, что этот процесс не всегда приводит к устойчивому равновесию. Чтобы определить, будет ли процесс нащупывания по Курно нам давать устойчивый исход или нет, используется условие (6).

Для нашей игры Г проверим условие устойчивости 1000 раз и выясним, с какой вероятностью исход игры будет устойчив. Получим более точное значение с помощью программы. Далее возьмем игру Г с более сложными функциями выигрыша первого и второго игрока:

и

где – случайные величины, имеющие равномерное распределение на интервале , а и – отрезки и вещественной оси R, где отрезки взяты достаточно большими для того, чтобы устойчивый исход , определяемый системой принадлежал прямому произведению

Выясним, как будет выглядеть условие устойчивости равновесия для данной игры, проведем 100 наблюдений за этой величиной и вычислим вероятность устойчивости равновесия второй игры. Получим более точную вероятность с помощью программы. Сравним вероятности устойчивости равновесия в первой и второй игре, сделаем выводы.

Актуальность: данное исследование актуально при рассматривании конфликтных ситуаций с двумя участниками.

Новизна: процесс нащупывания по Курно впервые рассматривается вигре со случайными функциями выигрыша.

Личный вклад: реализуются программы для вычисления вероятностей устойчивости равновесия в играх с различными функциями выигрыша, а так же последующее сравнение полученных вероятностей.

2. Общие сведения из теории игр и теории вероятностей.

  1. Теория игр.

Пусть – фиксированное конечное сообщество, множество игроков (участников), для обозначения которых используется индекс .

Игрой в нормальной форме называется совокупность, содержащая для каждого игрока

  • множество стратегий , элементы которого обозначаются ,

  • функцию выигрыша (функцию полезности) , являющуюся отображением из в .

Игрок выбирает любую стратегию . После того, как каждый игрок выбрал свою стратегию, определяются исход и выигрыш -го игрока . [4, стр. 15]

2) Равновесие по Нэшу[1, стр.26].

Исход игры двух и более игроков, в которой ни один участник не может увеличить выигрыш, изменив свою стратегию, когда другие участники стратегий не меняют, называется равновесием по Нэшу. Этот исход образован совокупностью стратегий, выбранных участниками. А именно,

пусть Через обозначим исход , в котором стратегия заменена на , а остальные стратегии оставлены без изменения. Исход называется равновесием (или устойчивым по Нэшу исходом), если

для всех и для всех

Множество всех равновесий игры обозначается

3) Теорема Нэша[1, стр.46].

Пусть пространства стратегий игроков в игре – выпуклые компактные подмножества в некоторых евклидовых пространствах: а функции выигрыша непрерывны и таковы, что при любой фиксированной ситуации функция – это выпуклая вверх функция аргумента . Тогда

4) Случайная величина.

Пусть – вероятностное пространство. Тогда случайной величиной называется функция, определенная на множестве исходов со значениями в , такая, что случайное событие .

Пусть – случайная величина. Если для любого борелевского множества из задана вероятность , то говорят, что задано распределение случайной величины .

Случайная величина имеет непрерывное равномерное распределение на отрезке , где – вещественные числа, если ее плотность имеет вид:

5) Процесс нащупывания по Курно[1, стр.311].

Пусть – исход игры и – множество оптимальных откликов игрока на ситуацию .

Фиксируется некоторая перестановка номеров игроков . Для простоты берется . Пусть – некоторый исход. Игрок

заменяет свою стратегию на оптимальный отклик (на один из оптимальных откликов, если их несколько), при этом получается исход . Затем игрок заменяет свою стратегию на оптимальный отклик, найденный уже с учетом предыдущей замены, сделанной игроком : и т.д., пока свои замены не сделают все игроки до последнего, . После этого получается исход .

Начав с исхода , получаем последовательность , в которой , Процесс построения последовательности называется процессом нащупывания по Курно.

Если последовательность исходов при любом начальном исходе дает один и тот же исход , то равновесие называется устойчивым.

Если сходимость последовательности к равновесию имеет место для всех начальных исходов, взятых в достаточно малой окрестности исхода и не являющихся равновесиями, то исход называется локально устойчивым равновесием.

Равновесие называется неустойчивым, если оно не локально устойчиво.

3.Условие устойчивости равновесия в играх двух игроков[1, стр.321].

Рассмотрим случай, когда n = 2 и пространства стратегий – отрезки вещественной прямой. Предположим, что – равновесие.

Предположим, что множества оптимальных откликов обоих игроков, то есть множества

},

,

имеют вид графиков непрерывных функций.

Эти два графика пересекаются в точке = ( ).

Предположим, что в этой точке графики и имеют касательные, угловые коэффициенты которых равны соответственно . (Штрих в первом равенстве означает производную по переменной , а во втором – по ).

Теорема. При сделанных предположениях и обозначениях исход является локально устойчивым равновесием, если

> , и неустойчивым, если <

Предположим, что функция выпукла кверху по переменной при любом фиксированном значении в окрестности точки *. Тогда точки максимума функции по переменной находятся из уравнения

,

задающего неявно функцию . Чтобы найти производную по переменной , применяется правило дифференцирования сложной функции:

откуда

Это тангенс угла наклона касательной к графику по отношению к оси , вычисленный в точке . Угловой коэффициент – это тангенс угла наклона той же самой касательной по отношению к оси .

Точно так же, пусть функция выпукла кверху по переменной при любом фиксированном значении в окрестности точки *. Тогда точки максимума функции по переменной находятся из уравнения

,

задающего неявно функцию . Чтобы найти производную по переменной , применяется правило дифференцирования сложной функции:

откуда

Это тангенс угла наклона касательной к графику по отношению к оси , вычисленный в точке . Угловой коэффициент получаем в виде:

Условие устойчивости переписывается в виде , то есть

и – угловые коэффициенты (оба относительно оси ) линий оптимальных откликов и соответственно, вычисленные в точке . Однако, если точка неизвестна и мы лишь собираемся ее отыскать приближенно с помощью процедуры нащупывания по Курно, то координаты и заранее не известны.

4. Исследование условия устойчивости равновесия для игры двух игроков с квадратичными функциями выигрыша.

Рассмотрим игру двух партнеров с пространствами стратегий и с функциями выигрыша у первого игрока и у второго игрока, в которой и имеют вид:

и

,

где - случайные величины, имеющие равномерное распределение на интервале , а и – отрезки и вещественной оси R, где отрезки взяты достаточно большими для того, чтобы устойчивый исход , определяемый системой принадлежал прямому произведению

Из теоремы Нэша следует, что .

Из вида функций и следует, что вторые производные (– 1,2), вычисленные в произвольной точке – это постоянные числа. Для нахождения вторых производных знать координаты точки не требуется. Следовательно, исходя из формул (4) и (5), знать координаты и также не требуется, как для нахождения чисел и , так и для вывода об устойчивости равновесия .

Для нашей игры выразим условие устойчивости через случайные величины :

Условие устойчивости (6) будет выглядеть следующим образом:

или

С помощью Excel получили столбец равномерно распределенных случайных величин. Реализовали выборку размером 1000.

 

Рисунок 1

 

Столбец A - столбец случайных величин, равномерно распределенных на интервале , E – результат наблюдения, то есть значение выражения , F – результат проверки устойчивости (значение 1 – равновесие устойчиво, 0 – неустойчиво), G – вероятность устойчивости равновесия для n = 1000.

Число является точечной оценкой истинной вероятности , с помощью этой точечной оценки мы построим доверительный интервал для оцениваемого параметра . Число является несмещенной оценкой параметра . [3, с.98]

5. Вычисление доверительного интервала для вероятности события.

Пусть событие А состоит в том, что при данном наборе случайных коэффициентов равновесие устойчиво. По результатам 1000 опытов частота события А оказалась равной С надежностью γ = 0,9 определяем доверительный интервал для вероятности события А. Значение = 1,643 мы смотрим в таблице значений функции Лапласа(для γ = 0,9).

При можно использовать следующее выражение для вычисления доверительного интервала [3, стр.103]:

Что при подстановке наших числовых данных даст интервал (0,765;0,807).

6. Распределение вероятности устойчивости равновесия.

Таблицы Excel позволяют нам провести как угодно много наблюдений величины вероятности устойчивости равновесия (каждый раз, при нажатии DEL, значения в столбцах A,E,F,G на рисунке 1 меняются).

Проведем 100 таких наблюдений и получим 100 значений вероятности устойчивости равновесия. Таким образом, получим некоторое распределение вероятности устойчивости равновесия. Упорядочим эти значения и построим график.

 

Рисунок 2

 

Для 100 наблюдений мы видим, что чаще всего значение вероятности принадлежит промежутку (0,78;0,8).

Сравним с полученным ранее доверительным интервалом:

 

Рисунок 3

 

На рисунке 3 верхняя и нижняя прямые – границы доверительного интервала, жирная черная линия – полученное выше значение

7. Уточнение значения вероятности устойчивости равновесия.

Чтобы получить более точное значение вероятности устойчивости равновесия напишем программу в Mathcad. В Mathcad rnd(1) выдает равномерно распределенную на (0;1) случайную величину, что нам и нужно. Теперь возьмем n = 100000.

Получили значение вероятности устойчивости равновесия 0.78858.

8. Исследование условия устойчивости равновесия для игры двух игроков с более сложными функциями выигрыша.

Далее возьмем игру Г с более сложными функциями выигрыша первого и второго игрока. Не забываем про то, что функции выигрыша должны быть выпуклы вверх по своей переменной, то есть для функции выигрыша первого игрока по , для функции выигрыша второго игрока по ; для этого возьмем

и

где – случайные величины, имеющие равномерное распределение на интервале , а и – отрезки и вещественной оси R, где отрезки взяты достаточно большими для того, чтобы устойчивый исход , определяемый системой принадлежал прямому произведению

Из теоремы Нэша следует, что .

Для нашей игры выразим условие устойчивости через случайные величины . Имеем:

Условие устойчивости будет выглядеть следующим образом:

где – равновесие по Нэшу.

Чтобы найти точку равновесия по Нэшу, необходимо решить систему уравнений:

 

Рисунок 4

 

Программа на рисунке 4 решает систему уравнений со случайными коэффициентами. Выражение в рамке – условие устойчивости равновесия (6). В данном случае условие не выполняется.

Реализуем выборку из 100 значений условия устойчивости для игры Г:

Рисунок 5

На рисунке 5: столбец T – значение условия устойчивости, U – результат проверки устойчивости (значение 1 – равновесие устойчиво, 0 – неустойчиво), V – вероятность устойчивости равновесия для n = 100.

Число является точечной оценкой истинной вероятности , с помощью этой точечной оценки мы построим доверительный интервал для оцениваемого параметра . Число является несмещенной оценкой параметра [3, с.98].

9. Вычисление доверительного интервала для вероятности события.

Пусть событие А состоит в том, что при данном наборе случайных коэффициентов равновесие устойчиво. По результатам 100 опытов частота события А оказалась равной С надежностью γ = 0,9 определяем доверительный интервал для вероятности события А. Значение = 1,643 мы смотрим в таблице значений функции Лапласа (для γ = 0,9).

При можно использовать следующее выражение для вычисления доверительного интервала [3, стр.103]:

Что при подстановке наших числовых данных даст интервал (0,335;0,385).

10. Уточнение значения вероятности устойчивости равновесия.

Чтобы получить более точное значение вероятности устойчивости равновесия напишем программу в Mathcad. В Mathcad rnd(1) выдает равномерно распределенную на (0;1) случайную величину, что нам и нужно. Теперь возьмем n = 100000.

Получили значение вероятности устойчивости равновесия 0.36798.

11. Выводы.

Итак, мы исследовали игру двух партнеров с функциями выигрыша, которые имеют простейший квадратичный вид:

и

где – случайные величины, имеющие равномерное распределение на интервале .

Выразили через эти величины для данной игры условие устойчивости и провели 1000 наблюдений. В результате получили вероятность устойчивости исхода игры (рисунок 1). Получили более точное значение с помощью программы.

Далее рассмотрели игру с более сложными функциями выигрыша:

и

где – случайные величины, имеющие равномерное распределение на интервале , и получили для нее вероятность устойчивости исхода игры. Эта вероятность равна 0,36 (рисунок 5). С помощью программы получили более точное значение. Вероятность устойчивости равновесия во второй игре гораздо меньше, чем в первой, когда у игроков были квадратичные функции выигрыша. Можно сделать вывод о том, что сам процесс нащупывания по Курно не всегда подходит для приближенного нахождения равновесия по Нэшу для игры двух игроков в случае, если функции выигрыша не имеют простейшего квадратичного вида.

Список используемой литературы

1. Киселёв В.Ю., Калугина Т.Ф. Теория игр: Учеб. пособие / ФГБОУВПО «Ивановский государственный энергетический университет имени В. И. Ленина». ­­– Иваново, 2013. – 508 с.

2. Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов/В.Е. Гмурман. – 9-е изд., стер.- М.: Высш. шк., 2003. – 479 с.

3. Калугина Т.Ф., Киселёв В.Ю. Математическая статистика: Учеб. пособие / ФГБОУВПО «Ивановский государственный энергетический университет имени В. И. Ленина». ­­– Иваново, 2001. – 324 с.

4. Мулен Э. Теория игр с примерами из математической экономики: Пер с франц.- М . Мир, 1985 – 200 с.

Просмотров работы: 458