Praca doktorska
Ładowanie...
Miniatura
Licencja

FairUseKorzystanie z tego materiału możliwe jest zgodnie z właściwymi przepisami o dozwolonym użytku lub o innych wyjątkach przewidzianych w przepisach prawa. Korzystanie w szerszym zakresie wymaga uzyskania zgody uprawnionego.
 

Combining instance-based learning and rule-based methods for imbalanced data

Uproszczony widok
dc.abstract.enThis thesis presents methods and systems for learning concepts from examples considering two levels of data difficulty represented by balanced and imbalanced data. However, we focus more on imbalanced data. The RIONA algorithm combines instance- and rule-based approaches. It uses rules with conditions expressing groups of values for both numerical and symbolic attributes. Using the neighbourhood of a test case (instead of the whole training set) of appropriate size, it is both fast and effective (in classification). Additionally, searching for the optimal neighbourhood size is also done efficiently. RIONA is showing the accuracy comparable to the well-known systems. RIONIDA is an extension of RIONA for imbalanced data. Additionally, RIONIDA combines instance- and rule-based approaches in another aspect, namely by using special rules that are more general than in RIONA. RIONIDA realises a few additional ideas compared to RIONA: optimisation of the explicitly given performance measure, weights for two classes, the idea of scaled rules, optimisation of parameters related to two latter ideas. RIONIDA is relatively fast and significantly outperforms state-of-the-art algorithms analysed in the thesis. Presented and proved theoretical results for RIONA and RIONIDA help: (i) to make the produced classifiers explainable, and (ii) to accelerate RIONIDA.
dc.abstract.plRozprawa przedstawia metody i systemy uczenia się pojęć z przykładów dla danych zbalansowanych i niezbalansowanych ze szczególnym uwzględnieniem tych drugich. Algorytm RIONA łączy podejście oparte na instancjach i regułach. Stosuje on reguły z warunkami grupującymi wartości dla atrybutów numerycznych, jak i symbolicznych. Dzięki użyciu otoczenia obiektu testowego (zamiast całego zbioru uczącego) z właściwie dobranym rozmiarem, jest on zarówno szybki, jak i skuteczny (w klasyfikacji). Także wyszukiwanie optymalnego rozmiaru otoczenia jest szybkie. Algorytm RIONA wykazuje skuteczność porównywalną ze znanymi systemami. Algorytm RIONIDA jest rozszerzeniem algorytmu RIONA dla danych niezbalansowanych. Łączy on podejście oparte na instancjach i regułach w nowy sposób stosując specjalne reguły, bardziej ogólne niż w RIONA. RIONIDA realizuje kilka dodatkowych idei w porównaniu do RIONA: optymalizację jawnie podanej miary jakości, wagi dla dwóch klas, skalowane reguły, a także optymalizację parametrów dla dwóch poprzednich idei. Algorytm RIONIDA jest stosunkowo szybki i daje istotnie lepsze wyniki niż znane algorytmy analizowane w pracy. Wyniki teoretyczne pomagają w: (i) tworzeniu klasyfikatorów z własnością wyjaśnialności dla obu algorytmów oraz (ii) przyspieszeniu algorytmu RIONIDA.
dc.affiliation.departmentWydział Matematyki, Informatyki i Mechaniki
dc.contributor.authorGóra, Grzegorz
dc.date.accessioned2022-06-06T11:10:05Z
dc.date.available2022-06-06T11:10:05Z
dc.date.defence2022-06-21
dc.date.issued2022-06-06
dc.description.additionalLink archiwalny https://depotuw.ceon.pl/handle/item/4219
dc.description.promoterSkowron, Andrzej
dc.identifier.urihttps://repozytorium.uw.edu.pl//handle/item/4219
dc.language.isoen
dc.rightsFairUse
dc.subject.enexplainability
dc.subject.enimbalanced learning
dc.subject.enmulti-strategy learning
dc.subject.enrule induction
dc.subject.enk-nearest neighbours
dc.subject.eninstance-based learning
dc.subject.ensupervised learning
dc.subject.enclassification
dc.subject.plwyjaśnialność
dc.subject.pluczenie z danych niezbalansowanych
dc.subject.pluczenie z wieloma strategiami
dc.subject.plindukcja reguł
dc.subject.plk najbliższych sąsiadów
dc.subject.pluczenie w oparciu o przykłady
dc.subject.pluczenie nadzorowane
dc.subject.plklasyfikacja
dc.titleCombining instance-based learning and rule-based methods for imbalanced data
dc.title.alternativeŁączenie metody bazującej na instancjach z metodą indukcji reguł dla danych niezbalansowanych
dc.typeDoctoralThesis
dspace.entity.typePublication