Metaheuristics in Optimization of Complex Processes
Abstrakt (PL)
Optymalizacja procesów złożonych odgrywa kluczową rolę w wielu dziedzinach, w tym w inżynierii, kontroli ruchu i finansach. Nieodłączna złożoność, jak sama nazwa wskazuje, i nieliniowość tych procesów stanowi poważne wyzwanie dla tradycyjnych technik optymalizacji. W celu rozwiązania tego problemu w niniejszej pracy zaproponowano i zbadano technikę opartą na integracji symulacji komputerowych, metaheurystyk (algorytmów optymalizacji przeszukujących duże przestrzenie potencjalnych rozwiązań) i modeli surogatywnych (matematycznych przybliżeń bardziej złożonych modeli). Początek pracy przedstawia motywację proponowanych badań i podsumowuje ich cele, m.in. głębsze zrozumienie natury procesów złożonych oraz opracowanie uniwersalnych, skalowalnych metod ich analizy i optymalizacji z wykorzystaniem metaheurystyk. W badaniach skupiono się na dwóch procesach złożonych, ale w niniejszej pracy zawarte są również bardziej ogólne rozważania dotyczące procesów złożonych. Pierwszym badanym procesem złożonym był ruch drogowy w mieście sterowany sygnalizacją świetlną, a celem była optymalizacja niektórych ważnych charakterystyk ruchu z wykorzystaniem metaheurystyk i zbadanie, które z nich są najlepsze pod względem jakości rozwiązań i skalowalności, w tym czasu obliczeń. Drugim badanym procesem złożonym była ewolucja nowotworu podczas radioterapii, a celem było zminimalizowanie liczby komórek nowotworowych po leczeniu poprzez kontrolowanie wielkości dawek i czasu podawania radioterapii. Po wprowadzeniu praca podsumowuje stan wiedzy w powiązanych z rozprawą obszarach, w szczególności w obszarze modelowania i optymalizacji procesów złożonych. Przedstawione są również główne metaheurystyki, które zostały użyte w prezentowanych w tej pracy eksperymentach, wraz z ich pseudokodem. Następnie w pracy przedstawiono oryginalny wkład autora, w tym oprogramowanie Traffic Simulation Framework (TSF), które było jednym z głównych narzędzi wykorzystywanych w eksperymentach, oraz ogólną metodologię optymalizacji procesów złożonych z wykorzystaniem symulacji komputerowych, metaheurystyk i modeli surogatywnych bazujących na uczeniu maszynowym. W pracy zawarte są zarówno rozważania teoretyczne, m.in. wprowadzenie kilku nowych formalizmów i definicji, jak i opisy eksperymentów mających na celu sprawdzenie jakości proponowanych metod w praktyce. Opisano wiele serii eksperymentów z różnymi metaheurystykami, modelami surogatywnymi i konfiguracjami dla dwóch głównych przypadków użycia, tzn. sterowania syg nalizacją świetlną i optymalizacji radioterapii w leczeniu nowotworu. Praca zawiera opisy konfiguracji eksperymentów, a także przedstawia i omawia ich wyniki. Następnie przedstawione są zidentyfikowane ograniczenia opracow anych metod, a także potencjalne sposoby ich pokonania oraz możliwe rozsz erzenia tych metod zmierzające do ich praktyczne zastosowania. W podsumowaniu pracy uzyskane wyniki skonfrontowane są z celami badawczymi. Okazało się, że połączenie metaheurystyk populacyjnych z mod elami surogatywnymi bazującymi na uczeniu maszynowym, przede wszys tkim modelami LightGBM oraz nowymi architekturami rzadkich grafowych sieci neuronowych zaproponowanych w ramach badań, dało najlepsze wyniki w przeprowadzonych eksperymentach. Ponadto, opracowana i przetestowana przez autora pracy metoda okazała się skuteczna dla obu badanych procesów złożonych. Chociaż wciąż istnieje wiele przeszkód na drodze do pomyślnego zastosowania opracowanej metody w rzeczywistych scenariuszach, osiągnięte wyniki są obiecujące. Udało się przezwyciężyć początkowe wyzwania oblczeniowe, a uzyskane wyniki otworzyły wiele nowych kierunków badawczych, co doprowadziło m.in. do powstania grupy badawczej TensorCell. Ponadto, badania omówione w niniejszej rozprawie zostały podsumowane i opublikowane łącznie w 25 artykułach naukowych i nagrodzone kilkoma prestiżowymi wyróżnieniami. Trwają też już dyskusje na temat zastosowań opracowanych w ramach przedstawionych badań metod w rzeczywistych systemach zarządzania ruchem oraz wykorzystania programu Traffic Simulation Framework w niedawno powstałym SmartCity Lab w Chełmie. Ponieważ oprogramowanie TSF zostało opracowane na podstawie sieci drogowej i danych o ruchu z pomiarów w Warszawie, istnieje również potencjał do przeprowadzenia pilotażowych projektów i zaplanowania możliwych wdrożeń w tym mieście. Pojawiło się też zainteresowanie ze strony innych naukowców przetestowaniem opracowanej metody w zupełnie nowym obszarze - inżynierii materiałowej. Większość zbiorów danych i niektóre programy użyte w eksperymentach zostały udostępnione publicznie, aby zapewnić odtwarzalność wyników i ułatwić dalsze badania.
Abstrakt (EN)
The optimization of complex processes plays a critical role in several do mains, including engineering, traffic control, and finance. However, the inher ent complexity and nonlinearity of these processes pose significant challenges to traditional optimization techniques. This thesis proposes and examines a technique based on the integration of computer simulations, metaheuristics (i.e., high-level optimization algorithms that explore large spaces of candi date solutions), and surrogate models (i.e., mathematical approximations of more complex models) to address this problem. First, the thesis outlines the motivation behind the proposed research and summarizes its objectives. The main objective of this research was to gain a deeper understanding of the nature of complex processes and to take a step towards the development of universal, scalable methods for analyz ing and optimizing complex processes using metaheuristics. This was done in the presented research on the basis of considering two complex processes, but some general and theoretical considerations regarding complex processes are included in this thesis too. The first and main complex process studied was urban road traffic controlled by traffic signals. The aim was to optimize selected important traffic characteristics using metaheuristics and to investi gate which of them give the best performance in terms of quality of solutions and scalability, including time of computations. The second complex process studied was cancer evolution under radiotherapy treatment. The goal was to minimize the number of cancer cells after treatment by controlling the size and timing of the radiotherapy doses. After the introduction, the thesis summarizes related works, including the state of the art in understanding, modeling, and optimizing complex systems and processes. The main metaheuristics that were used in the experiments described in this thesis are also presented along with their pseudocodes. Next, the thesis discusses the author’s original contribution, including the Traffic Simulation Framework software (TSF), which was one of the main tools used in the experiments, as well as the general methodology for optimizing complex processes using metaheuristics, computer simulations, and surrogate models based on machine learning. The thesis contains theoretical considerations (including the introduction of several new formalisms and definitions) as well as descriptions of experiments aimed at testing the proposed methods in practice. Many series of experiments are described, they were carried out with different metaheuristics, surrogate models, and configurations for the two main use cases (traffic signal control and optimization of radiotherapy for cancer treatment). The thesis includes the descriptions of the setup of the experiments, as well as the presentations and discussions of their results. This is followed by a discussion of the identified limitations of the introduced method, potential ways to overcome them, and possible extensions to enable real-world applications of the developed techniques and tools. Finally, the conclusions of the thesis summarize the achieved results and confront them with the initial research objectives. It turned out that the combination of population-based metaheuristics with surrogate models based on machine learning (especially techniques based on LightGBM and proposed architectures of sparse graph neural networks) gave the best results in the experiments conducted, and the method developed and tested by the author of this thesis proved successful for both studied complex processes. Although there are still many obstacles on the way to a successful application of the developed methods in real-world scenarios, the achieved results are promising. It was possible to overcome the initial computational challenges, and the achieved results opened many new research directions, which led to the establishment of a research group TensorCell. Moreover, the research covered in this thesis has been summarized and published in 25 research publications and awarded with several prestigious prizes. There are already ongoing discussions about the applications of the considered method in real traffic management systems and the use of the Traffic Simulation Framework in the recently established SmartCity Lab in Chełm (Poland). Since the TSF software has been developed using the road network and traffic data from the measurements in Warsaw, there is also a potential to run some pilot projects and plan the possible implementations in this city. There is also interest from other scientists to test the developed method for optimizing complex processes in a new field - materials science. Most of the datasets and some programs used in the experiments have been made publicly available to facilitate further studies.