Licencja
Narodowy Korpus Diachroniczny Polszczyzny. Projekt
Abstrakt (PL)
Artykuł przedstawia projekt Narodowego Korpusu Diachronicznego Polszczyzny (NKDP), który w założeniu ma być uspójnioną i rozszerzoną kolekcją mniejszych korpusów, powstających w różnych ośrodkach naukowych i obejmujących różne zakresy czasowe. W skład owego uspójnionego korpusu wejdą teksty obejmujące lata 1380-1939, co będzie stanowiło uzupełnienie Narodowego Korpusu Języka Polskiego. Celem projektu jest stworzenie zbalansowanego korpusu ukazującego historię rozwoju języka polskiego i stanowiącego bazę materiałów dla badaczy języka oraz punkt porównania dla korpusów historycznych języków europejskich i światowych. Poszczególne części składowe korpusu składają się z 24 mln słów, natomiast docelowo NKDP będzie stanowił repozytorium 40 mln słów.
Abstrakt (EN)
The paper presents the project of the Diachronic Corpus of Polish (DCP), which is intended as a cohesive collection of smaller corpora, arising in various scientific centers and covering various time ranges. This corpus will include texts covering the years 1380-1939, which will complement the National Corpus of Polish. The aim of the project is to create a balanced corpus presenting the history of the development of the Polish language and constituting the data basis for language researchers and a point of comparison for the historical corpora of European and world languages. The different parts of the corpus consist of 24 million words in total, while the target NPDC will constitute a repository of 40 million words.