Подгонка параметров распределения
мы приведем сделки к стандартным значениям, можно отсортировать их в порядке возрастания. На основе полученных данных мы сможем провести тест К-С. Нашей целью является поиск таких значений LOC, SCALE, SKEW и KURT, которые наилучшим образом подходят для фактического распределения сделок. Для определения «наилучшего приближения» мы полагаемся на тест К-С. Рассчитаем значения параметров, используя «метод грубой силы двадцатого века». Мы просчитаем каждую комбинацию для KURT от 3 до 0,5 с шагом -0,1 (мы можем также взять интервал от 0,5 до 3 с шагом 0,1, так как направление не имеет значения). Далее просчитаем каждую комбинацию для SCALE от 3 до 0,5 с шагом -0,1. Пока оставим LOC и SKEW равными 0. Таким образом, нам надо обработать следующие комбинации:
LOC SCALE SKEW KURT
0 3 0 3
о 3 0 2,9
о 3 0 2,8
о 3 0 2,7
о 3 0 2,6
о 3 0 2,5
о 3 0 2,4
о 3 0 2,3
о 3 0 2,2 о 3 0 2,1
о 3 0 2
о 3 0 1,9
* * * *
* * * *
о 2,9 0 3
о 2,9 0 2,9
* * * *
о 0,5 0 0,6
о 0,5 0 0,5
Для каждой комбинации проведем тест К-С. Комбинацию, которая даст наименьшую статистику К-С, будем считать оптимальной для параметров SKALE и KURT (на данный момент). Чтобы провести тест К-С для каждой комбинации, нам необходимо как фактическое распределение, так и теоретическое распределение (определяемое параметрами тестируемого характеристического распределения). Мы уже знаем, как создать функцию распределения вероятности X/N, где N является общим числом сделок, а Х является рангом (от 1 до N) данной сделки.
Теперь нам надо рассчитать ФРВ для теоретического распределения при данных значениях параметров LOC, SCALE, SKEW и KURT. У нас есть характеристическая функция регулируемого распределения, она задается уравнением (4.06). Чтобы получить ФРВ из характеристической функции, необходимо найти интеграл характеристической функции. Мы обозначаем интеграл, т.е. площадь под кривой характеристической функции в точке X, как N(X). Таким образом, так как уравнение (4.06) дает первую производную интеграла, мы обозначим уравнение (4.06) как N\'(X). В большинстве случаев вы не сможете вывести интеграл функции, даже если вы опытный математик. Поэтому вместо интегрирования функции (4.06) мы будем использовать другой метод. Этот метод потребует больших усилий, но он применим к любой функции. Вероятность для любой точки на графике характеристической функции можно оценить, если распределение представить себе как последовательность узких прямоугольников. Тогда для любого данного прямоугольника в распределении вы можете рассчитать вероятность, ассоциированную с этим прямоугольником, как отношение суммы площадей всех прямоугольников слева от вашего прямоугольника (включая площадь вашего прямоугольника) к сумме площадей всех прямоугольников в распределении. Чем больше прямоугольников вы используете, тем более точными будут полученные вероятности. Если бы вы использовали бесконечное число прямоугольников, то ваш расчет был бы точным. Рассмотрим процедуру поиска площадей под кривой характеристического распределения на примере. Допустим, мы хотим найти вероятности, ассоциированные с каждым отрезком длиной 0,1 в интервале от -3 до +3 сигма. Отметьте, что в таблице (с. 183) рассмотрен интервал от -5 до +5 сигма. Дело в том, что лучше выйти на 2 сигмы за ограничительные параметры (-3 и +3 сигма в нашем случае), чтобы получить более точные результаты. Отметьте, что Х — это число стандартных единиц, на которое мы смещены от среднего значения. Далее идут значения четырех параметров. Следующий столбец — это столбец N\'(X), который отражает высоту кривой в точке Х при этих значениях параметров. N\'(X) рассчитывается из уравнения (4.06). Воспользуемся уравнением (4.06). Допустим, нам надо рассчитать N\'(X) для Х= -3 со значениями параметров 0,02, 2,76, 0 и 1,78 для LOC, SCALE, SKEW и KURT соответственно. Сначала рассчитаем показатель асимметрии для уравнения (4.06). Формула для расчета С задается уравнением (4.07):Х LOG SCALE SKEW KURT N\'(X) Ур. (4.06) Накопленная сумма N(X)\r\n-5,0 0,02 2,76 0 1,78 0,0092026741 0,0092026741 0,000388\r\n-4,9 0,02 2,76 0 1,78 0,0095350519 0,018737726 0,001178\r\n-4,8 0,02 2,76 0 1,78 0,0098865117 0,0286242377 0,001997\r\n-4,7 0,02 2,76 0 1,78 0,01025857 0,0388828077 0,002847\r\n-4,6 0,02 2,76 0 1,78 0,0106528988 0,0495357065 0,003729\r\n-4,5 0,02 2,76 0 1,78 0,0110713449 0,0606070514 0,004645\r\n-4,4 0,02 2,76 0 1,78 0,0115159524 0,0721230038 0,005598\r\n-4,3 0,02 2,76 0 1,78 0,0119889887 0,0841119925 0,006590\r\n-4,2 0,02 2,76 0 1,78 0,0124929748 0,0966049673 0,007622\r\n-4,1 0,02 2,76 0 1,78 0,0130307203 0,1096356876 0,008699\r\n-4,0 0,02 2,76 0 1,78 0,0136053639 0,1232410515 0,009823\r\n-3,9 0,02 2,76 0 1,78 0,0142204209 0,1374614724 0,010996\r\n-3,8 0,02 2,76 0 1,78 0,0148798398 0,1523413122 0,012224\r\n-3,7 0,02 2,76 0 1,78 0,0155880672 0,1679293795 0,013509\r\n-3,6 0,02 2,76 0 1,78 0,0163501266 0,184279506 0,014856\r\n-3,5 0,02 2,76 0 1,78 0,0171717099 0,2014512159 0,016270\r\n-3,4 0,02 2,76 0 1,78 0,0180592883 0,2195105042 0,017756\r\n-3,3 0,02 2,76 0 1,78 0,0190202443 0,2385307485 0,019320\r\n-3,2 0,02 2,76 0 1,78 0,0200630301 0,2585937786 0,020969\r\n-3,1 0,02 2,76 0 1,78 0,0211973606 0,2797911392 0,022709\r\n-3,0 0,02 2,76 0 1,78 0,0224344468 0,302225586 0,024550\r\n-2,9 0,02 2,76 0 1,78 0,0237872819 0,3260128679 0,026499\r\n-2,8 0,02 2,76 0 1,78 0,0252709932 0,3512838612 0,028569\r\n-2,7 0,02 2,76 0 1,78 0,0269032777 0,3781871389 0,030770\r\n-2,6 0,02 2,76 0 1,78 0,0287049446 0,4068920835 0,033115\r\n-2,5 0,02 2,76 0 1,78 0,0307005967 0,4375926802 0,035621\r\nПродолжение \r\nX LOG SCALE SKEW KURT N\'(X) Ур.
(4.06) Накопленная сумма N(X)\r\n-2,4 0,02 2,76 0 1,78 0,0329194911 0,4705121713 0,038305\r\n-2,3 0,02 2,76 0 1,78 0,0353966362 0,5059088075 0,041186\r\n-2,2 0,02 2,76 0 1,78 0,0381742015 0,544083009 0,044290\r\n-2,1 0,02 2,76 0 1,78 0,041303344 0,5853863529 0,047642\r\n-2,0 0,02 2,76 0 1,78 0,0448465999 0,6302329529 0,051276\r\n-1,9 0,02 2,76 0 1,78 0,0488810452 0,6791139981 0,055229\r\n-1,8 0,02 2,76 0 1,78 0,0535025185 0,7326165166 0,059548\r\n\r\n-1,7 0,02 2,76 0 1,78 0,0588313292 0,7914478458 0,064287\r\n-1,6 0,02 2,76 0 1,78 0,0650200649 0,8564679107 0,069511\r\n-1,5 0,02 2,76 0 1,78 0,0722644105 0,9287323213 0,075302\r\n-1,4 0,02 2,76 0 1,78 0,080818341 1,0095506622 0,081759\r\n-1,3 0,02 2,76 0 1,78 0,0910157581 1,1005664203 0,089007\r\n-1,2 0,02 2,76 0 1,78 0,1033017455 1,2038681658 0,097204\r\n-1,1 0,02 2,76 0 1,78 0,1182783502 1,322146516 0,106550\r\n-1,0 0,02 2,76 0 1,78 0,1367725028 1,4589190187 0,117308\r\n-0,9 0,02 2,76 0 1,78 0,1599377464 1,6188567651 0,129824\r\n-0,8 0,02 2,76 0 1,78 0,1894070001 1,8082637653 0,144560\r\n-0,7 0,02 2,76 0 1,78 0,2275190511 2,0357828164 0,162146\r\n-0,6 0,02 2,76 0 1,78 0,2776382822 2,3134210986 0,183455\r\n-0,5 0,02 2,76 0 1,78 0,3445412618 2,6579623604 0,209699\r\n-0,4 0,02 2,76 0 1,78 0,4346363128 3,0925986732 0,242566\r\n-0.3 0,02 2,76 0 1,78 0,5550465747 3,6476452479 0,284312\r\n-0,2 0,02 2,76 0 1,78 0,7084848615 4,3561301093 0,337609\r\n-0,1 0,02 2,76 0 1,78 0,8772840491 5,2334141584 0,404499\r\n0,0 0,02 2,76 0 1,78 1 6,2334141584 0,483685\r\n0,1 0,02 2,76 0 1,78 0,9363557429 7,1697699013 0,565363\r\n0,2 0,02 2,76 0 1,78 0,776473162 7,9462430634 0,637613\r\nПродолжение \r\nX ЬОО ЗСЛЬБ SKEW кият №(Х) Ур. (4.06) Накопленная сумма ^Х)\r\n0,3 0,02 2,76 0 1,78 0,6127219404 8,5589650037 0,696211\r\n0,4 0,02 2,76 0 1,78 0,4788099392 9,0377749429 0,742253\r\n0,5 0,02 2,76 0 1,78 0,377388991 9,4151639339 0,778369\r\n0,6 0,02 2,76 0 1,78 0,3020623672 9,7172263011 0,807029\r\n0,7 0,02 2,76 0 1,78 0,2458941852 9,9631204863 0,830142\r\n0,8 0,02 2,76 0 1,78 0,2034532796 10,1665737659 0,849096\r\n0,9 0,02 2,76 0 1,78 0,1708567846 10,3374305505 0,864885\r\n1,0 0,02 2,76 0 1,78 0,1453993995 10,48282995 0,878225\r\n1,1 0,02 2,76 0 1,78 0,1251979811 10,6080279311 0,889639\r\n1,2 0,02 2,76 0 1,78 0,1089291462 10,7169570773 0,899515\r\n1,3 0,02 2,76 0 1,78 0,0956499316 10,8126070089 0,908145\r\n1,4 0,02 2,76 0 1,78 0,0846780659 10,8972850748 0,915751\r\n1,5 0,02 2,76 0 1,78 0,0755122067 10,9727972814 0,922508\r\n1,6 0,02 2,76 0 1,78 0,0677784099 11,0405756913 0,928552\r\n1,7 0,02 2,76 0 1,78 0,0611937787 11,10176947 0,933993\r\n1,8 0,02 2,76 0 1,78 0,0555414402 11,1573109102 0,938917\r\n1,9 0,02 2,76 0 1,78 0,0506530744 11,2079639847 0,943396\r\n2,0 0,02 2,76 0 1,78 0,0463965419 11,2543605266 0,947490\r\n\r\n2,1 0,02 2,76 0 1,78 0,0426670018 11,2970275284 0,951246\r\n2,2 0,02 2,76 0 1,78 0,0393804519 11,3364079803 0,954707\r\n2,3 0,02 2,76 0 1,78 0,0364689711 11,3728769515 0,957907\r\n2,4 0,02 2,76 0 1,78 0,0338771754 11,4067541269 0,960874\r\n2,5 0,02 2,76 0 1,78 0,0315595472 11,4383136741 0,963634\r\n2,6 0,02 2,76 0 1,78 0,0294784036 11,4677920777 0,966209\r\n2,7 0,02 2,76 0 1,78 0,0276023341 11,4953944118 0,968617\r\n2,8 0,02 2,76 0 1,78 0,0259049892 11,5212994011 0,970874\r\n2,9 0,02 2,76 0 1,78 0,0243641331 11,5456635342 0,972994\r\nПродолжение\r\nX то ЗСАЬБ SKEW кият №(Х) Ур. (4.06) Накопленная сумма М(Х)\r\n3,0 0,02 2,76 0 1,78 0,0229608959 11,5686244301 0,974990\r\n3,1 0,02 2,76 0 1,78 0,0216791802 11,5903036102 0,976873\r\n3,2 0,02 2,76 0 1,78 0,0205051855 11,6108087957 0,978653\r\n3,3 0,02 2,76 0 1,78 0,0194270256 11,6302358213 0,980337\r\n3,4 0,02 2,76 0 1,78 0,0184344179 11,6486702392 0,981934\r\n3,5 0,02 2,76 0 1,78 0,0175184304 11,6661886696 0,983451\r\n3,6 0,02 2,76 0 1,78 0,0166712734 11,682859943 0,984893\r\n3,7 0,02 2,76 0 1,78 0,0158861285 11,6987460714 0,986266\r\n3,8 0,02 2,76 0 1,78 0,0151570063 11,7139030777 0,987576\r\n3,9 0,02 2,76 0 1,78 0,014478628 11,7283817056 0,988826\r\n4,0 0,02 2,76 0 1,78 0,0138463263 11,742228032 0,990020\r\n4,1 0,02 2,76 0 1,78 0,0132559621 11,7554839941 0,991164\r\n4,2 0,02 2,76 0 1,78 0,012703854 11,7681878481 0,992259\r\n4,3 0,02 2,76 0 1,78 0,0121867187 11,7803745668 0,993309\r\n4,4 0,02 2,76 0 1,78 0,0117016203 11,7920761871 0,994316\r\n4,5 0,02 2,76 0 1,78 0,0112459269 11,8033221139 0,995284\r\n4,6 0,02 2,76 0 1,78 0,0108172734 11,8141393873 0,996215\'\r\n4,7 0,02 2,76 0 1,78 0,0104135298 11,8245529171 0,997110\r\n4,8 0,02 2,76 0 1,78 0,0100327732 11,8345856903 0,997973\r\n4,9 0,02 2,76 0 1,78 0,0096732643 11,8442589547 0,998804\r\n5,0 0,02 2,76 0 1,78 0,0093334265 11,8535923812 0,999606\r\n
(4.07) С = (1 + (АВ8(8КЕ\\?) л АВ8(1 / X - ШС)) * з1вп(Х) * * ^п^КЕХУ))) л 0,5 = (1 + (АВ8(0) л АВ8(1 / (-3 - 0,02)) * -1 * -1)) л 0,5 = (1 + 0) А0,5 = 1
Затем подставляем С = 1 в уравнение (4.06): \r\n(4.06) Y = (j / (>^S(^LOC) I SCALE) л KURT + 1)) л С
Таким образом, в точке Х = -3 N\'(X) = 0,02243444681 (отметьте, что мы рассчитываем значения в столбце N\'(X) для каждого значения X).
Рассчитаем очередной столбец, текущую сумму N\'(X), накапливающуюся с ростом X. Это сделать достаточно просто. Далее рассчитаем столбец N(X) для вероятности, ассоциированной с каждым значением Х при данных значениях параметров. Формула для расчета N(X) выглядит следующим образом:
С С-1 м
(4.12) N(C) = (]Г N\'(X.) + ? N\'(Xj)) / 2 / ? ЩХ.), i—1 i—1 i=l где С = текущее количество точек X; М = общее количество точек X.
Уравнение (4.12) означает, что при каждом изменении Х необходимо добавить текущую сумму при данном значении Х к текущей сумме предыдущего значения X, затем разделить полученную сумму на 2. Далее полученный результат следует разделить на последнее значение в столбце текущей суммы N\'(X) (накопленная сумма значений N\'(X)). Это даст нам вероятность для значения Х при данных значениях параметров.
Таким образом, для Х = -3 текущая сумма N(X) = 0,302225586, а для предыдущего значения Х = -3,1 текущая сумма равна 0,2797911392. Сумма двух этих величин равна 0,5820167252. При делении на 2 мы получаем 0,2910083626. Разделив эту величину на последнее значение в столбце накопленной суммы N\'(X), равное 11,8535923812, мы получаем 0,02455022522. Это и есть вероятность N(X) при стандартном значении Х = -3.
После того как мы вычислили накопленные вероятности для каждой сделки в фактическом распределении и вероятности для каждого приращения стандартного значения в нашем характеристическом распределении, мы можем осуществить тест К-С для значений параметров характеристического распределения, которые используются в настоящий момент. Однако сначала рассмотрим два важных момента.
В примере с таблицей накопленных вероятностей, показанной ранее для нашего регулируемого распределения, мы рассчитывали вероятности с приращением стандартных значений 0,1. Это было сделано для наглядности. На практике вы можете получить большую степень точности, используя меньший шаг приращения. Приращение 0,01 в большинстве случаев является вполне приемлемым.
Скажем несколько слов о том, как для регулируемого распределения выбрать ограничительные параметры, то есть количество сигма с каждой стороны от среднего.
В нашем примере мы использовали 3 сигма, но в действительности следует использовать абсолютное значение самой отдаленной точки от среднего. Для нашего примера с 232 сделками крайнее левое (самое меньшее) стандартное значение составляет -2,96 стандартной единицы, а крайнее правое (самое большое) составляет 6,935321 стандартной единицы. Так как 6,93 больше, чем ABS(-2,96), мы должны взять 6,935321. Теперь добавим еще 2 сигма к этому значению для надежности и найдем вероятности для распределения от -8,94 до +8,94 сигма. Так как нам нужна хорошая точность, мы будем использовать приращение 0,01. Рассчитаем вероятности для стандартных значений:-8,94 -8,93
-8,92
-8,91 *
* *
+8,94
Последнее, что мы должны сделать, прежде чем провести тест К-С, — это округлить фактические стандартные значения отобранных сделок с точностью 0,01 (так как мы используем 0,01 в качестве шага для теоретического распределения). Например, значение 6,935321 не будет иметь соответствующей теоретической вероятности, ассоциированной с ним, так как оно находится между значениями 6,93 и 6,94. Так как 6,94 ближе к 6,935321, мы округляем 6,935321 до 6,94. Прежде чем начать процедуру оптимизирования наших параметров регулируемого распределения путем применения теста К-С, мы должны округлить фактические отсортированные нормированные сделки в соответствии с выбранным шагом. Вместо округления стандартных значений сделок до ближайшего десятичного Х можно использовать линейную интерполяцию по таблице накопленных вероятностей, чтобы вычислить вероятности, соответствующие фактическим стандартным значениям сделок. Чтобы больше узнать о линейной интерполяции, посмотрите хорошую книгу по статистике, например «Управление деньгами на товарном рынке» Фреда Гема. Другие интересные книги указаны в списке рекомендованной литературы. До настоящего момента мы оптимизировали только параметры KURT и SCALE. Может показаться, что при нормировании данных параметр LOC должен быть приравнен к 0, а параметр SCALE — к 1. Это не совсем верно, так как реальное расположение распределения может не совпадать со средним арифметическим, а оптимальное значение ширины отличаться от единицы. Значения KURT и SCALE сильно связаны друг с другом. Таким образом, мы сначала попытаемся приблизительно определить оптимальные значения параметров KURT и SCALE. Для наших 232 сделок получаем SCALE =2,7, а KURT =1,9. Теперь попытаемся найти наиболее подходящие значения параметров. Этот процесс займет достаточно много времени, даже если у вас хороший компьютер. Мы проведем цикл, изменяя параметр LOC от 0,1 до -0,1 по -0,05, параметр SCALE от 2,6 до 2,8 по 0,05, параметр SKEW от 0,1 до -0,1 по -0,05 и параметр KURT от 1,86 до 1,92 по 0,02. Результаты этого цикла дают оптимальное (самое низкое значение статистики К-С) при LOC = О, SCALE = 2,8, SKEW =0 и KURT =1,86. Затем мы осуществим третий цикл. На этот раз будем просматривать LOC от 0,04 до -0,04 по -0,02, SCALE от 2,76 до 2,82 по 0,02, SKEW от 0,04 до - 0,04 по -0,02 и KURT от 1,8 до 1,9 по 0,02. Результаты третьего цикла дают оптимальные значения LOC = 0,02, SCALE = 2,76, SKEW = 0 и KURT = 1,8. Мы нашли оптимальную окрестность, в которой параметры дают наилучшее приближение регулируемой характеристической функции к распределению реальных данных. Для последнего цикла мы будем просматривать LOC от 0 до 0,03 по 0,01, SCALE от 2,76 до 2,73 по -0,01, SKEW от 0,01 до -0,01 и KURT от 1,8 до 1,75 по -0,01. Результаты этого последнего прохода дают следующие оптимальные параметры для наших 232 сделок: LOC = 0,02, SCALE =2,76, SKEW = 0 и KURT =1,78.