Scientific journal
International Journal of Applied and fundamental research
ISSN 1996-3955
ИФ РИНЦ = 0,593

ECONOMETRIC MODELING OF THE IMPACT OF INVESTMENT IN TOURISM ON THE VOLUME OF TOURIST FLOW IN THE SOFTWARE ENVIRONMENT R

Babeshko L.O. 1
1 The Financial University under the Government of the Russian Federation
4005 KB
The work is aimed at building a model for assessing the impact of investment in tourism on the volume of the tourist flow. To test the model, the indicators were used in the context of the central federal district of the Russian Federation for 2009-2015. As an econometric tool selected apparatus of systems of externally unrelated equations and models for panel data. Implementation of methods for estimating the parameters of models is performed in the software environment R, the main power of which is manifested in the analysis of statistical data – from calculating the average values to simulating time series. The constructed models for predicting the volume of the tourist flow, within the framework of models of systems of externally unrelated equations and models for panel data that take into account the heterogeneity of the regions of the central federal district of the Russian Federation, will be useful for developing a marketing strategy.
investments
tourist flow
panel data
the general feasible generalized least-squares method
wooldridge test

Учитывая изношенность основных фондов предприятий туристической инфраструктуры в России (свыше 70 %), развитие сферы туризма невозможно без привлечения инвестиций в развитие экономики, в том числе и на уровне регионов [1]. Строительство новых или реконструкция старых объектов туристской рекреации региона требуют прогнозной оценки эффективности инвестиций в сферу туризма. Данный прогноз может быть получен в рамках эконометрического моделирования с привлечением аппарата систем внешне не связанных уравнений и моделей для панельных данных [2–4].

Статистические данные

Использованы данные Российского статистического ежегодника 2016 г. [5]. Показатели приведены в разрезе Центрального федерального округа Российской Федерации за 2009–2015 гг.: по объему инвестиций в основной капитал, направленных на развитие коллективных средств размещения (гостиниц, прочих мест для временного проживания) (в млн рублей); по численности лиц, размещённых в гостиницах и аналогичных средствах размещения (в тыс. человек). По каждой области имеется информация за 6 лет, число областей – 18. Названия областей приведены в табл. 1.

Таблица 1

Названия областей

Номер области

i

Название области

Номер области

i

Название области

1

Белгородская

10

Московская

2

Брянская

11

Орловская

3

Владимирская

12

Рязанская

4

Воронежская

13

Смоленская

5

Ивановская

14

Тамбовская

6

Калужская

15

Тверская

7

Костромская

16

Тульская

8

Курская

17

Ярославская

9

Липецкая

18

г. Москва

Выбор эконометрического инструментария и анализ результатов

Выборочные данные состоят из наблюдений за большим числом однотипных объектов (18 областей) в течение небольшого периода времени (6 лет). Поэтому в качестве инструмента выбран аппарат систем внешне не связанных уравнений (Seemingly Unrelated Regression, SUR) и модели для панельных данных, позволяющие выполнять оценивание при небольшом объеме выборки для отдельных экономических единиц [6–8].

Система внешне не связанных уравнений отличается от системы одновременных уравнений тем, что в ней переменные отдельных уравнений независимы, но их случайные возмущения коррелированы, поскольку моделируемые каждым отдельным уравнением объекты функционируют в «одной экономической среде».

Уравнения системы можно рассматривать по отдельности для каждого экономического объекта (области), и оценивать обычным методом наименьших квадратов, однако если возмущения уравнений для отдельных областей коррелированы, то эта дополнительная информация дает возможность повысить эффективность оценок параметров в рамках системы внешне не связанных уравнений. Спецификация модели SUR имеет вид

bab01.wmf, (1)

где bab02.wmf – вектор-столбец значений эндогенной переменной для i-го объекта, bab03.wmf – вектор-столбец возмущений для i-го уравнения, Xi – матрица регрессоров для i-го объекта, bab04.wmf, bab05.wmf, N – число объектов (число уравнений), n – число наблюдений. Систему (1) можно записать в матричном виде

bab06.wmf, (2)

где bab07.wmf – (nN×1) вектор-столбец значений эндогенных переменных, bab08.wmf – (nN×1) вектор-столбец возмущений,

bab09.wmf – матрица регрессоров,

bab10.wmf – (kN×1) вектор-столбец оценок параметров.

Относительно объединённого вектора случайных возмущений системы принимаются предпосылки: E(ε) = 0;

bab11.wmf (3)

– автоковариационная матрица вектора возмущений, In – единичная матрица размером n×n, bab12.wmf – символ кронекерова перемножения матриц,

bab13.wmf – ковариация между возмущениями i-го и j-го уравнений, Σ – ковариационная матрица с элементами σij, bab14.wmf.

Для оценки параметров модели (2) с числовыми характеристиками (3) применяется обобщенный метод наименьших квадратов (ОМНК)

bab15.wmf. (4)

Для вычисления ОМНК-оценок (4) необходимо оценить автоковариационную матрицу возмущений Ω (3). В эконометрических пакетах прикладных программ для этой цели используется доступный вариант SUR – FGLS (The general feasible generalized least-squares method), в котором МНК-оценки параметров отдельных уравнений, входящих в систему, служат основой для вычисления элементов матрицы Σ [9]:

bab16.wmf, bab17.wmf,

bab18.wmf, bab19.wmf, (5)

и далее, по формуле (3), вычисляются элементы матрицы bab20.wmf. В случае если уравнения системы (2) действительно не связаны друг с другом, σij = 0 при i ≠ j, оценки параметров (4) совпадают с МНК-оценками, полученными для каждого отдельного уравнения. Ниже приведен протокол оцененной модели SUR, полученный в программной среде R (при помощи функции systemfit , библиотеки systemfit):

bab21.wmf, R2 = 0,791,

bab22.wmf, F = 400.

Данный результат совпадает с оценками модели Pooled (объединенной) для панельных данных (функция plm, библиотеки plm в программной среде R).

Основными регрессионными моделями, применяемыми к панельным данным, являются:

- объединённая модель (pooled model, Pool), предполагающая, что у экономических объектов нет индивидуальных различий

bab23.wmf, bab24.wmf, (6)

где yit – зависимая переменная,

xit – вектор-строка регрессоров (размерностью k),

εit – случайное возмущение; i = 1, …, n, t = 1, …, T,

n – число объектов (панелей), T – число наблюдений в рамках одной панели,

μ = const – постоянное для всех объектов значение свободного члена – параметр «местоположения», β = βpool – вектор параметров «влияния», постоянный для всех объектов (панелей),

- модель с фиксированным эффектом (fixed effect model, FE), базирующаяся на «уникальности» экономических объектов

bab25.wmf, bab26.wmf, (7)

μi – параметр местоположения i-го объекта, bab27.wmf,

- модель со случайным эффектом (random effect model, RE), учитывающая «случайность» попадания объекта в панель в результате выборки из большой совокупности:

bab28.wmf, bab29.wmf, bab30.wmf,

bab31.wmf, (8)

где mi – независящая от времени специфическая составляющая ошибки.

Для оценки регрессионных моделей для панельных данных в программной среде R используется функция plm (библиотеки plm), одним из параметров которой является название модели (model) из списка основных: model="pooling" (объединенная модель), model="within" (модель с фиксированными эффектами), model="random" (модель со случайными эффектами).

Выбор одной модели из списка основных выполняется на основании формальных тестов. Так, например, при тестировании объединённой модели против модели с фиксированными эффектами, в качестве нулевой гипотезы выбирается bab32.wmf. Эта гипотеза проверяется при помощи F-теста

bab33.wmf,

где используются следующие обозначения:

k – число параметров влияния, ESSpool – сумма квадратов остатков объединённой модели, ESSFE – сумма квадратов остатков модели с фиксированными эффектами. Если F > Fα, при определенном уровне значимости α, то гипотеза bab34.wmf отвергается и наиболее адекватной признается модель с фиксированными эффектами, в противном случае нулевая гипотеза принимается, и лучшее соответствие результатам наблюдений должна обеспечить объединенная модель.

При тестировании объединённой модели против модели со случайными эффектами нулевой гипотезой является bab35.wmf. Для проверки этой гипотезы используется тест множителей Лагранжа, который базируется на статистике

bab36.wmf,

где e – вектор-столбец остатков модели в объединённой регрессии, D – матрица фиктивных переменных. Если bab37.wmf, то нулевая гипотеза отвергается при уровне значимости α, и наиболее адекватной признается модель со случайными эффектами.

Тестирование модели со случайными эффектами против модели с фиксированными эффектами основано на проверке справедливости нулевой гипотезы bab38.wmf, против альтернативной bab39.wmf. Статистика теста, статистика Хаусмана, определяется по правилу

bab40.wmf,

где bab41.wmf – оценка параметров модели с фиксированными эффектами, bab42.wmf – оценка параметров модели со случайными эффектами, bab43.wmf – оценка автоковариационной матрицы вектора bab44.wmf.

Тестирование характера эффектов, выполненное в программной среде R (при помощи функций: pFtest() – модель Pooled против модели FE, plmtest() – модель Pooled против модели RE, phtest() – модель RE против модели FE), показало значимость модели (7) с фиксированными эффектами.

В табл. 2 и 3 приводятся оценки параметров положения и влияния, полученные в рамках модели FE для панельных данных при помощи функции plm [10].

Таблица 2

Оценка параметра (bab45.wmf) влияния в модели FE

bab46.wmf

bab47.wmf

t-статистика

0,1396

0,0126

11,034

R2 = 0,59. F-statistic: 121,76 on 1 and 89 DF, p-value: < 2.22e-16

Таблица 3

Оценки параметров местоположения (bab48.wmf) в модели FE

Номер

области

i

bab49.wmf

bab50.wmf

t

Номер

области

i

bab51.wmf

bab52.wmf

t

1

2

3

4

1

2

3

4

1

171,586

48,806

3,5156

10

2192,401

57,717

37,9851

2

125,271

48,805

2,5668

11

97,166

48,818

1,9904

3

425,660

48,813

8,718

12

218,454

48,805

4,4760

4

298,024

48,805

6,1064

13

185,358

48,808

3,7977

5

194,090

48,805

3,9769

14

109,107

48,805

2,2355

6

300,331

49,006

6,1285

15

329,569

48,862

6,7407

7

184,887

48,805

3,7883

16

216,625

48,805

4,4386

8

136,170

48,805

2,7901

17

364,967

49,214

7,4159

9

134,247

48,808

2,7505

18

3340,442

91,690

36,4317

Функция pggls, для обобщенного FGLS метода, позволяет построить аналоги моделей панельных данных со случайными (random effect model, RE) и фиксированными эффектами (fixed effect model, FE).

Фиксированный эффект pggls – метода включает, как и алгоритм FGLS, два шага. Первый шаг базируется на «внутригрупповой (within) оценке модели FE, второй – в соответствии FGLS. Если в модели FE отсутствует автокорреляция, результаты FE и обобщенного pggls совпадают.

В программной среде R тест на автокорреляцию возмущений i-го объекта в модели FE выполняется при помощи функции pwartest, реализующей алгоритм теста Вулдриджа. Для тестируемой модели получен протокол [11]:

pwartest(mpd, data=PANEL, index=c("P"))

Wooldridge’s test for serial correlation in FE panels

data: plm.model

chisq = 41.901, p-value = 9.603e-11,

т.е. нулевая гипотеза об отсутствии автокорреляции отвергается на любом разумном уровне значимости. Принимая во внимание полученный результат, оценим зависимость туристического потока от объема инвестиций в рамках pggls метода:

pggls(mpd,data=PANEL,index=c("P"), model="within", effect="individual").

Результаты оценки параметров приведены в табл. 4 и 5 соответственно.

Таблица 4

Оценка параметра (bab53.wmf) влияния в модели FE

bab54.wmf

bab55.wmf

t-статистика

0,1387

0,0047

29,255

R2 = 0,99.

Таблица 5

Оценки параметров местоположения (bab56.wmf) в модели FE

Номер

области

i

bab57.wmf

bab58.wmf

t

Номер

области

i

bab59.wmf

bab60.wmf

t

1

2

3

4

1

2

3

4

1

171,616

44,512

3,8555

10

2194,622

45,985

47,7246

2

125,275

44,512

2,8144

11

97,248

44,514

2,1847

3

425,623

44,513

9,5617

12

218,468

44,512

4,9081

4

298,041

44,512

6,6957

13

185,395

44,512

4,1650

5

194,096

44,512

4,3605

14

109,132

44,512

2,4517

6

300,651

44,543

6,7497

15

329,538

44,521

7,4019

7

184,892

44,512

4,1538

16

216,638

44,512

4,8669

8

136,177

44,512

3,0593

17

365,423

44,575

8,1979

9

134,289

44,513

3,0169

18

3346,039

53,173

62,9278

Оценки параметров, полученные в рамках модели c фиксированными эффектами при помощи функции plm и при помощи функции pggls, различаются незначительно, но точность и значимость оценок, полученных в рамках метода pggls, выше.

Построенные модели прогнозирования объема туристического потока, в рамках моделей систем внешне не связанных уравнений и моделей для панельных данных, учитывающих неоднородность областей Центрального федерального округа Российской Федерации, будут полезными для разработки маркетинговой стратегии.