Licencja
Ekonometryczne modelowanie popytu na energię elektryczną za pomocą danych wysokiej częstotliwości
Abstrakt (PL)
Niewątpliwie energia elektryczna we współczesnym świecie odgrywa ogromną rolę. Specyfika elektryczności, a w zasadzie brak możliwości jej ekonomicznego magazynowania, sprawia, że analizowanie popytu na energię elektryczną jest niezmiernie ważne dla wszystkich podmiotów z rynku energii. Na rynku energii elektrycznej w Polsce, od momentu jego liberalizacji 1 lipca 2007, wyróżnia się wytwórców energii, pośredników, firmy zajmujące się przesyłem energii oraz odbiorców. Dysponowanie idealnymi prognozami zapotrzebowania na energię elektryczną mogłoby pozwolić każdemu uczestnikowi tego rynku na ekonomiczne gospodarowanie, ponieważ każde niedostateczne zakontraktowanie energii lub przeszacowanie zapotrzebowania generuje koszty. W centrum zainteresowania są wysokoczęstotliwościowe charakterystyki rynku energii, a dane 15-minutowe wydają się być idealne do tego typu analiz. W niniejszej pracy sprawdzone zostały dwie główne hipotezy badawcze. Pierwsza z nich dotyczyła istnienia nieliniowego wpływu temperatury powietrza na zapotrzebowanie na energię elektryczną w obserwowanych danych 15-minutowych. Drugą zasadniczą hipotezą badawczą jest istotność pozytywnego wpływu cyklu koniunkturalnego na analizowane zapotrzebowanie na moce przesyłowe krajowych sieci elektroenergetycznych czyli sensowność wykorzystania prognoz zagregowanego stanu gospodarki do sporządzania prognoz średniookresowych. Wybór tych dwóch hipotez uargumentowany jest chęcią formalnego sprawdzenia postaci i pokazania nieliniowej zależności między temperaturą a zapotrzebowaniem na energię, natomiast druga, związana z cyklem koniunkturalnym, wydaje się niezwykle ciekawa dla autora. Poza wymienionymi hipotezami głównymi wartymi rozważenia wydają się być jeszcze dodatkowe kwestie. Pierwszą hipotezą poboczną jest istnienie w obserwowanych danych kwadransowych opisujących zapotrzebowanie na moce przesyłowe potrójnej struktury sezonowej związanej z wahaniami rocznymi, tygodniowymi oraz fluktuacjami charakterystycznymi dla poszczególnych godzin. Drugim wartym weryfikacji stwierdzeniem jest to o istnieniu w rozważanych danych tendencji wzrostowej - trendu. Trzecim dodatkowym zagadnieniem rozważanym w pracy jest weryfikacja przypuszczenia o tym, że metoda prognozowania oparta o modele regresji liniowej dla poszczególnych kwadransów powinna okazać się najlepsza dla polskich danych. Hipotezy główne i dodatkowe wydają się być ekonomicznie intuicyjne. Obserwowany wzrost gospodarczy Polski w okresie 2002-2014 przekładać się powinien na wzrost zapotrzebowania na energię elektryczną. Oczekiwanie skomplikowanej struktury wahań okresowych zdaje się być bezdyskusyjne dla każdego analityka i uczestnika rynku energii. Cykle dni i nocy, tygodniowe struktury dni pracy i weekendów oraz serie pór roku, czyli zmiennej długości dnia, uzasadniają postawienie hipotezy o potrójnej strukturze wahań sezonowych. Hipoteza o przekładaniu się koniunktury na potrzeby elektroenergetyczne gospodarujących podmiotów wydaje się mieć uzasadnienie w teorii mikroekonomii. Przedsiębiorca lub firma planuje produkcję w zależności od bieżącego i spodziewanego popytu. Słabszy zagregowany popyt związany jest z okresami gorszej koniunktury, więc rozsądnym wydaje się oczekiwanie przekładania się sytuacji gospodarczej na energię elektryczną. W niektórych przypadkach wydawać się może, że zależność ta ma przeciwny zwrot, gdyż proces produkcyjny wyprzedza moment sprzedaży. Dokładnie z tego samego powodu oczekiwać można logiczności wykorzystania prognoz sytuacji ekonomicznej do wyznaczania przyszłych potrzeb energetycznych podmiotów. Zdecydowana większość badań wpływu cyklu koniunkturalnego na popyt na energię elektryczną wykorzystuje dane roczne i kwartalne. Wartość dodana niniejszej pracy polega także na analizowaniu wspomnianej relacji dla danych o wyższej, miesięcznej częstotliwości. W niniejszej pracy podstawą analizy są dane 15-minutowego zapotrzebowania na moce przesyłowe krajowych sieci elektroenergetycznych (KSE). Informacje te bez wątpienia można określić mianem wysokoczęstotliwościowych. Dane są dostępne dla całej sieci, więc poziomem zagregowania jest cały kraj. Zamiennie używane są pojęcia zapotrzebowania na moce przesyłowe KSE, popytu na energię i popytu na moce przesyłowe. Definicyjnie nie są to tożsame pojęcia, jednak ze względu na poziom zagregowania danych (cały kraj) pojęcia te mogą być postrzegane jako tożsame. Dane dostępne są na stronie internetowej Polskich Sieci Elektroenergetycznych od pierwszego kwadransa 2002 roku i na bieżąco są rozszerzane. Dane próbkowane są co kwadrans, dzięki czemu mogą być nazwane wysokoczęstotliwościowymi. Wybrane do analizy zostały obserwacje od pierwszej dostępnej za 1 stycznia 2002 r. do 10 października 2013 roku. W związku z tym, w próbie znajdują się 412892 obserwacje. Zapotrzebowanie na moce przesyłowe w krajowym systemie elektroenergetycznym jest zmienną stanu, w przeciwieństwie do wielu kategorii makroekonomicznych, które są przepływami. Oznacza to, ze szereg ten musi być analizowany podobnie jak temperatura, stan wody w rzece czy kurs walutowy. Zmiana częstotliwości na niższą nie odbywa się, jak dla przepływów, poprzez sumowanie, ale poprzez wybranie jednej z obserwacji z analizowanego okresu, na przykład średniego poziomu lub wartości na koniec okresu. Praca jest skonstruowana tak, że kolejno opisywane są poszczególne składowe szeregu 15-minutowego zapotrzebowania na moce przesyłowe KSE i weryfikowane kolejne hipotezy. Pierwszy rozdział zawiera krótki opis analizowanej zmiennej oraz jej podstawowe charakterystyki. Zaprezentowane są także wyniki analizy spektralnej szeregu, które dają podstawę do testowania obecności komponentów trendu i sezonowości. Weryfikacja hipotezy o istnieniu tendencji wzrostowej jest niezwykle istotna z punktu widzenia sposobu modelowani i prognozowania. Główna część tego rozdziału poświęcona jest sprawdzeniu istnienia tendencji wzrostowej oraz analizom stacjonarności szeregu. Dla tych drugich zaproponowana została specjalna wersja testu stacjonarności sezonowych danych Hylleberga, Engle’a, Grangera i Yoo oraz zaprezentowane zostały jego stablicowane wartości krytyczne. Wykorzystane zostało ponadto podstawowe narzędzie ekstrakcji komponentu trendu z szeregu jakim jest filtr Hodricka-Prescotta oraz przedstawione zostały jego parametry, jakie powinny zostać zastosowane w przypadku danych 15-minutowych. Wnioski z zastosowania filtra pokrywają się z wnioskami z testu o istnieniu stochastycznego trendu w danych o zapotrzebowaniu na energię elektryczną. Co więcej, uwzględnione w analizach zmiany czasu okazały się nie mieć wpływu na uzyskiwane wnioski. W rozdziale drugim zaprezentowane zostały analizy struktury sezonowej szeregu zapotrzebowania na moce przesyłowe krajowych sieci elektroenergetycznych. Wahania sezonowe odpowiadają tej części zmienności danych czasowych które powtarzają się z pewną ustaloną częstotliwością i najczęściej związane są z efektami kalendarzowymi. Im wyższa częstotliwość analizowanych danych, to jest im częściej są one zbierane, tym bardziej złożone powinny być wahania sezonowe. W szeregu 15-minutowych danych o zapotrzebowaniu na energię elektryczną występować powinno kilka komponentów. Pierwszy przypisywany jest sezonowości rocznej i związany jest z długością dnia i średnią temperaturą w poszczególnych miesiącach. Druga sezonowość przypisywana jest do dnia tygodnia. Wydaje się nie budzić większych kontrowersji stwierdzenie, że zużycie energii jest inne w dni robocze niż w weekendy. W końcu sezonowość dzienna związana jest ze zmiennym zapotrzebowaniem na energię w ciągu dnia. Mniejsze zużycie obserwowane jest w nocy, podczas gdy szczyt zapotrzebowania przypada na godziny pracy. W rozdziale tym nie tylko sprawdzone zostało istnienie wielorakiej struktury wahań okresowych, ale także przeanalizowane zostały wersje tych wahań. Wychodząc od podstawowego modelu wygładzania wykładniczego Holta zaprezentowane zostały jego kolejne rozszerzone wersje wyestymowane dla polskich danych. Kolejne jego rozszerzenia, czyli model Holta-Wintersa, model Taylora oraz model Hyndmana i innych pozwalają modelować coraz to bardziej złożone modele i struktury sezonowe. Zaprezentowane zostało dodatkowe podejście do modelowania wahań sezonowych, które pozwala analizować zarówno ich stochastyczną jak i deterministyczną wersję, za pomocą zmiennych zerojedynkowych i funkcji trygonometrycznych. Wyniki wszystkich przedstawionych modeli potwierdzają założoną hipotezę o wielorakiej strukturze sezonowej szeregu 15-minutowego zapotrzebowania na energię. Rozdział trzeci poświęcony jest analizom cyklu koniunkturalnego i podstawowym sposobom sprawdzenia jego przekładania się na popyt na energie elektryczna. Zaprezentowane zostały powody, dla których istotne jest rozważanie tej kwestii oraz uwzględnienie jej w procesie modelowania i przede wszystkim prognozowania. Analiza częstotliwościowa danych rocznych, miesięcznych oraz szeregów z łamaną częstotliwością pozwala zaobserwować obecność przekładania się cyklu koniunkturalnego na popyt na energię. Istnienie relacji zostało zweryfikowane za pomocą pojęcia przyczynowości w sensie Grangera w modelach wektorowej autoregresji. Wyniki nie pozwalają odrzucić hipotezy powściągliwości zgodnie z którą bieżąca sytuacja gospodarcza przekłada się na zapotrzebowanie na energię. Zmiany w zagregowanej produkcji mają odzwierciedlenie w popycie na energię. Dało to podstawy do weryfikacji drugiej głównej hipotezy badawczej. Zaprezentowane zostały dwa sposoby oszacowania indeksu przybliżającego cykl koniunkturalny. Pierwszy z nich jest metodą wykorzystywaną w literaturze, natomiast drugi jest własną propozycją szacowania szeregu miesięcznego produktu krajowego brutto, który mógłby najdokładniej odzwierciedlać sytuacje w gospodarce. Przedstawiona została także propozycja miesięcznego wskaźnika wyprzedzającego, który ilustruje przyszły stan gospodarki. Wykorzystanie zmiennych egzogenicznych w modelowaniu zapotrzebowania na energię elektryczną jest tematyką rozdziału czwartego. Warunki atmosferyczne mają wpływ na wiele decyzji podmiotów. O ile cześć wahań popytu na energię może być przypisana do stałych efektów kalendarzowych, na przykład do godziny wschodu i zachodu słońca, to inna cześć, przypisywana warunkom atmosferycznym, dla przykładu zachmurzeniu, nie może mieć deterministycznej postaci. Intuicja ekonomiczna wskazuje na istnienie istotnej zależności miedzy wyborami gospodarujących podmiotów a bieżącymi i prognozowanymi warunkami atmosferycznymi. Dane pogodowe przedstawiają sumaryczny obraz stanu pogody dla wszystkich, dostępnych serwisowi ogimet.com stacji meteorologicznych. Zawarte w nich są informacje o temperaturze (maksimum, minimum i mediana), temperaturze punktu rosy, wilgotności, wietrze (kierunku, intensywności i porywie), ciśnieniu atmosferycznym, wielkości opadów, poziomie zachmurzenia, nasłonecznieniu, widoczności poziomej i pokrywie śnieżnej Zaprezentowane i wykorzystane zostały stochastyczne i deterministyczne zmienne objaśniające, czyli zmienne pogodowe i dni wolne od pracy. Modele regresji dla danych miesięcznych i dziennych wskazują na słuszność wykorzystania informacji pogodowych. Główna hipoteza badawcza o nieliniowym wpływie temperatury powietrza na popyt na energię elektryczną zweryfikowana została za pomocą modeli parametrycznych i nieparametrycznych. Na ich podstawie wyciągnięty został wniosek o istnieniu nieliniowej zależności, a jej kształt określić można jako przekrzywione „l” lub kij od hokeja. Rozdział piaty zawiera eksperymenty, w których porównane zostały sposoby prognozowania zapotrzebowania na energię. Hipoteza, o tym, że najlepszy model dla rynku amerykańskiego powinien być najlepszy także dla Polski, jest weryfikowana poprzez porównanie go z innymi modelami ekonometrycznymi uznanymi w literaturze za najdokładniejsze na polskich danych. Pierwszy eksperyment miał w związku z tym na celu porównanie zaobserwowanych wartości zapotrzebowania na moce przesyłowe krajowych sieci elektroenergetycznych z prognozami porównywanych modeli. Porównanie prognoz krótkookresowych polegało na oszacowaniu modelu na próbie od stycznia 2002 do 10 października 2013 w pierwszym kroku i wyznaczeniu prognoz na trzy kolejne dni. W każdym kolejnym kroku okres, na którym szacowany był model, zwiększany był o kolejny dzień. W ten sposób dla każdego modelu przeprowadzonych zostało 445 iteracji, aż do 30 grudnia 2014. Porównanie modeli dla prognozowania krótkookresowego wypada niezwykle korzystnie dla najprostszego modelu ARDL. Na podstawie uzyskanych wartości błędów odrzucić należy pomocniczą hipotezę o wyższości dla polskich danych sposobu modelowania zaproponowanego w literaturze. Weryfikacja hipotezy o użyteczności informacji o cyklu koniunkturalnym do prognozowania średniookresowego została wykonana za pomocą podobnego eksperymentu. W tym przypadku, dla 3-miesięcznego horyzontu wyznaczane były prognozy z modelu regresji bez i z wykorzystaniem zaproponowanych indeksów koniunktury. Modele z informacjami o stanie koniunktury charakteryzowały się niższą wartością błędów prognoz niż modele bez tych informacji. Stanowiło to podstawę do pozytywnego zweryfikowania głównej hipotezy badawczej o potrzebie wykorzystania wiedzy o stanie gospodarki w sporządzaniu prognoz popytu na energię elektryczną. Praca ma charakter akademicki z pewnymi elementami praktycznymi. Praktycy mogą mieć wypracowane własne metody i sposoby, które pozwalają uzyskać bardzo dobre rezultaty. Osoby zajmujące się zawodowo prognozowaniem popytu na energie elektryczna mogą mieć dostęp do komputerów z większymi możliwościami obliczeniowymi, dzięki czemu mogą analizować bardziej złożone problemy. Dokładne prognozy można uzyskać na wiele sposobów, a przedstawione zostały te atrakcyjne i najbliższe autorowi.
Abstrakt (EN)
Without doubt, electricity plays an important role in the modern world. The necessity for electricity and the lack of economical storage makes analysis electricity demand extremely important for all sectors of the energy market. With regard to the electricity market in Poland, since the privatisation on July 1, 2007, energy producers, intermediaries, power distribution companies and consumers have been distinguished. Perfect forecasts for electricity demand would allow each sector of the market rational cost management as insufficient energy contracting and overestimation of demand can generates costs. The focus is on high frequency characteristics of the energy market and 15-minute data seems to be the ideal for this type of analyses. In this study, two main hypotheses have been examined. The first concerns the existence of a non-linear relationship between air temperature and electricity demand in the observed 15-minute data. According to the second fundamental hypothesis of the research positive impact of the business cycle on electricity load is observed. To paraphrase, the use of forecasts of the aggregated economy state to calculate medium-term forecasts is reasonable. The choice of the first hypothesis is justified by a willingness for formal verification the form of the nonlinear relationship between air temperature and energy demand. The latter, related to the business cycle, is of the most interest to the author. Besides the aforementioned hypotheses, other issues appear to be worthy of consideration. The first additional hypothesis relates to the existence of a threefold seasonality structure in 15-minute data describing electricity demand. The complex seasonal pattern is associated with fluctuations in annual, weekly and daily periods. The second verification statement concerns the existence of an upward tendency in the data - trend. The last additional issue considered in the dissertation gives regard to the suspicion that the forecasting method based on linear regression models for individual 15-minute periods in one day outperforms other methods. While some research may suggest that there might be a superior model for the American energy market, it is tempting to test whether the model may also be optimal for Polish data. Both the main and auxiliary hypotheses appear to be economically intuitive. Polish economic growth observed from 2002-2014 should affect an increase in demand for electricity. Expecting complicated structure in periodic fluctuations seems to be indisputable for analysts and other parties in the energy market. The cycles of day and night, working days, weekends and seasons justify the hypothesis concering a threefold structure of seasonality. The hypothesis of the business cycle’s influence on consumer needs for power appears to be justified in microeconomic theory. Entrepreneurs and company production plans are dependant on the current and the expected demands. A weak aggregate demand is normally associated with periods of economic slowdown, therefore it seems reasonable to expect it as a cause of electricity demand. However, in some cases it may seem that this relationship has an opposing sense because production precedes the moment of sale. For this reason the plausibility of using forecasts of the business cycle to determine future energy needs may be justified. The vast majority of research on the impact of the economic situation on the electricity demand concerns annual and quarterly data. The value added of this study is analysis of the aforementioned relationship using higher frequency data. In this dissertation, the basis for the analyses is a 15-minute time series of transmission demand capacity on the Polish Power System. Data is available for the entire network, so the level of aggregation is the entire country. The demand for transmission capacity and the energy demand are not identical by definition, however, while the level of data aggregation is the entire country these concepts can be equated. The data is available on the Polish Power System Operator website and covers the period from January 1, 2002, and is continuously updated. The frequency of the time series is 15-minutes, so it may undoubtedly be called high frequency data. The data range selected for analyses covers the period from the first 15-minutes for January 1, 2002 to October 10, 2013. Therefore, the dataset consists of 412,892 observations. The electricity load in the domestic power system is a state variable unlike many macroeconomic variables which are flows. This means that the series must be analysed in the same manner as temperature, river waterlevels, interest rates or exchange rates. Transmission to a lower frequency must be carried out differently, instead of a summation of values in a given aggregated period (for flows), by choosing one observation in every period. For instance, the average level or the selection of the value at the end of a specific period. The thesis is organised in order that individual components of 15-minute electricity load time series are consecutively described and adequate hypotheses tested The first chapter provides a brief description of the analysed variable and its basic characteristics. The results of spectral analysis of the series have been presented in order to motivate testing the presence of trend and seasonality components. In general, verification of the hypothesis concering upward trend is extremely important for modelling and forecasting. The main part of this chapter is devoted to testing stationarity analyses. A special version of the data Hylleberg, Engle, Granger and Yoo test is proposed. What is more, critical values for the specific test version have been tabulated. Moreover, a classical tool, the Hodrick-Prescott filter, for extracting the trend component from the series is used. Additionally, the filter parameters, which should be applied in the case of 15-minute data, are discussed. The conclusions from the use of the filter coincide with those for the test and existence of the stochastic trend in the data is affirmed. What is more, it was found that including time changes in the analyses has had no effect on the findings. In the second chapter meticulous analyses of the seasonal structure of demand are presented. Seasonal variations correspond to that part of the variability of a time series that repeat with a predetermined frequency and most often associated with calendar effects. The higher the frequency of analysed data, i.e. the more often data is collected, the more complex should the seasonal structure be. The 15-minute time series on the electricity demand should then comprise some seasonal components. The first is attributed to the annual frequency and is related to the length of the day and monthly average temperatures. The second seasonality is assigned to the day of the week. It may be of little controversy to say that energy demand differs on weekdays and on weekends. Finally, the last seasonal pattern is associated with the variation in energy consumers’ daytime needs. Reduced consumption is observed at the night, while peaks fall on working hours. This chapter not only proves the presence of multiple periodic fluctuations, but also analyses their versions. Starting from the basic exponential smoothing model, its subsequent enhanced variations are presented and estimated using Polish data. The Holt-Winters model, Taylor model and Hyndman et al model allow the consideration of greater and more complex seasonality structures.. An additional approach for modelling seasonal fluctuations is discussed: state space models are used to investigate the character of seasonality. Stochastic and deterministic versions, using dummy variables and trigonometric functions, are examined. The results confirm the additional hypothesis about complex seasonal pattern in the energy demand of 15-minute series. The third chapter is devoted to analyses of the business cycle and basic methods of checking its effect on electricity demand.. The importance of considering the business climate in the modelling process and, above all, forecasting is considered. Frequency analyses of many time series – annual, monthly and with changing frequency – allow the observation of the presence of fluctuations in electricity load, which may be attributed to the business cycle. The existence of a relationship is verified by the concept of Granger causality in vector autoregressive models. Conservation hypothesis, according to which the current economic situation affects the energy demand is positively verified. Therefore, every change in aggregate production is reflected in the energy demand. This stands as the basis of verification for the second main hypothesis. What is more, two methods of calculating indices approximating business cycle are presented. The former is the method proposed in the literature, while the latter is a new proposal for estimating the monthly gross domestic product, which could more accurately reflect the economic situation. A monthly leading indicator, showing the future state of the economy, is also proposed. The use of exogenous variables in modeling the electricity demand is the subject of chapter four. Weather conditions affect many decisions. While some fluctuations in energy demand may be attributed to fixed calendar effects, for example, sunrise and sunset hours, others , attributed to atmospheric conditions, such as cloud cover, may not have a deterministic character. Economic intuition indicates the existence of a significant relationship between entities’ choices and current and forecasted weather conditions. The weather information used in the research depicts the total picture of aggregated weather conditions measured by every station offered by ogimet.com for Poland. It contains information about temperature (maximum, minimum and median), dew point, humidity, wind (direction, intensity and gust), atmospheric pressure, rainfall, cloud cover level, sunlight, horizontal visibility and snow conditions. Besides this information, additional data on public holidays is used in modelling and forecasting demand. Regression models for monthly and daily observations show the validity of the use of meteorological data. The main hypothesis of the research about nonlinear effects of air temperature on the electricity demand is verified with parametric and non-parametric models. On this basis a non-linear relationship is confirmed its shape can be described as a lopsided "L" or hockey stick. The final chapter includes two experiments that compare methods of forecasting the energy demand. The hypothesis that the best model for the US market should also outperform other models for Polish data is verified by comparing it with other econometric models recognized in literature as being the most accurate. The first experiment therefore compares the observed values on the demand of power system transmission capacity with forecasts from different models. The first step in the challenge of short-term forecasts was to estimate a model on data from January 2002 to 10 October 2013 and to calculate forecasts for three consecutive days. In each successive step, the data range was increased by the next day. In this way, for each model, 445 iterations were conducted. The results of the experiment for short-term forecasting turned out to be extremely favorable for the simplest autoregressive model with distributed lags. On the basis of error value comparison the auxiliary hypothesis of superiority for the Polish data modeling method proposed in the literature was rejected. The second experiment was conducted to verify the second main hypothesis. The functionality of business cycle information for forecasting in the medium-term was performed using 3-month forecasts. Forecasts from regression models with and without the use of proposed economic indices were confronted. Using information about the business cycle allows lower forecast error values thus more accurate forecasts. That was the key argument for positive verification of the main hypothesis concerning the need to use information about the state of the economy in forecasting electricity load. The thesis is an academic study with some practical elements. Some practitioners may have developed their own methods and procedures that allow good results. Those involved in professional forecasting electricity demand may have access to computers with greater calculation capacity, enabling them to analyse more complex problems. Accurate forecasts can be achieved in many ways and those presented, which are most familiar to the author, may also be found attractive.