Zrealizowane tematy prac licencjackich i inżynierskich:
Klasyfikacja szeregów czasowych za pomocą algorytmu Proximity Forest (2025, matematyka )
Wykorzystanie krzywych eliptycznych w szyfrowaniu na przykładzie krzywej Montgomerego (2024, matematyka )
Sample-efficient semantic segmentation (2024, matematyka )
Metody Monte Carlo w grach losowych (2024, matematyka )
Metody wyjaśniania modeli typu ,,czarna skrzynka” (2024, matematyka )
Lasy losowe z udoskonaloną regresją (2024, matematyka )
Proces analizy danych statystycznych (2024, informatyka )
Spektralna analiza skupień (2023, matematyka )
Robust Random Cut Forest jako metoda usuwania anomalii z danych (2023, matematyka )
Algorytm LightGBM jako efektywna metoda klasyfikacji i regresji (2022, matematyka )
Metoda LLE jako metoda redukcji wymiarowości (2022, matematyka )
Algorytm Catboost jako efektywna metoda klasyfikacji i regresji w przypadku występowania cech jakościowych (2022, matematyka )
Segmentacja obrazu na bloki tekstowe (2021, matematyka )
Analiza skupień za pomocą algorytmów DBSCAN i OPTICS (2020, matematyka )
Redukcja wymiaru danych za pomocą metody t-SNE (2020, matematyka )
Uogólniona analiza składowych głównych dla danych nie-normalnych (2020, matematyka )
Las izolacyjny (2020, matematyka )
Redukcja wymiaru w celu wykrywania obserwacji odstających za pomocą metody DOBIN (2020, matematyka )
Prognozowanie szeregów czasowych za pomocą metody ETS (2020, matematyka )
Klasyfikacja za pomocą metody DANN (2020, matematyka )
Jądrowa analiza składowych głównych (2020, matematyka )
Analiza skupień dla danych jakościowych za pomocą algorytmu ROCK (2019, matematyka )
Wykrywanie anomalii w danych za pomocą algorytmu LOF (2019, matematyka )
Las rotacyjny (2018, matematyka )
Wybrane zastosowania ukrytych modeli Markowa w nauczaniu maszynowym (2017, matematyka )
Wybrane metody statystyczne w analizie danych RNA-seq (2017, matematyka )
Klasyfikacja zdarzeń rzadkich (2017, matematyka )
Głębokie uczenie (2017, matematyka )
Zastosowanie algorytmu SVM do klasyfikacji (2017, matematyka )
Zrealizowane tematy prac magisterskich:
Wykorzystanie konwolucyjnych sieci neuronowych w transferze stylu obrazów (2024, analiza i przetwarzanie danych )
Analiza porównawcza wybranych narzędzi Business Intelligence (2024, analiza i przetwarzanie danych )
Porównanie skuteczności metod statystycznych oraz metod uczenia maszynowego w prognozowaniu szeregów czasowych (2024, analiza i przetwarzanie danych )
Zastosowanie sieci neuronowych w predykcji kursów walut na światowym rynku Forex (2024, analiza i przetwarzanie danych )
Prognozowanie wyników meczów tenisowych za pomocą algorytmów uczenia maszynowego (2024, analiza i przetwarzanie danych )
Systemy rekomendacyjne z wykorzystaniem modeli generatywnych na przykładzie wspomagania żywienia (2024, analiza i przetwarzanie danych )
Wykrywanie zdarzeń dźwiękowych za pomocą metod uczenia maszynowego (2024, analiza i przetwarzanie danych )
Ocena wykorzystania subgoali w silnikach szachowych opartych na MCTS (2024, analiza i przetwarzanie danych )
Rozpoznawanie emocji z twarzy za pomocą konwolucyjnych sieci neuronowych (CNN) (2024, analiza i przetwarzanie danych )
Power Iteration Clustering jako efektywna metoda grupowania danych (2023, analiza i przetwarzanie danych )
Klasyfikacja dzieł kultury na podstawie reprezentujących je grafik (2023, analiza i przetwarzanie danych )
Generowanie obrazów z wykorzystaniem sieci typu GAN (2023, analiza i przetwarzanie danych )
Regularized Implicit Neural Representations for Controlled Shape Interpolation (2023, analiza i przetwarzanie danych )
Uczenie głębokie w detekcji epizodów zamrożenia chodu (2023, informatyka )
White Box Attacks in Adversarial Machine Learning (2023, matematyka )
Analiza statystyczna i uczenie maszynowe w procesie wsparcia decyzji transferowych w piłce nożnej (2023, analiza i przetwarzanie danych )
Rozpoznawanie typu lokalizacji dla sklepu Żabka (2023, analiza i przetwarzanie danych )
Wykorzystanie VBA dla MS Excel w celu stworzenia cennika dla działu sprzedaży jako dopełnienie funkcjonującego systemu ERP (2022, analiza i przetwarzanie danych )
Predykcja sukcesu w piłce nożnej w oparciu o dane historyczne i uczenie maszynowe (2022, informatyka )
Sieci głębokich stert (2022, matematyka )
Predykcja wyników w oparciu o analizę historycznych danych dotyczących zdarzeń w piłce nożnej z wybranych lig europejskich (2022, informatyka )
Rola hiperparametrów w celu osiągnięcia najwyższej jakości predykcji sukcesu w Ekstraklasie (2022, informatyka )
Analiza geostatystyczna rozprzestrzeniania się wirusa SARS-CoV-2 (2021, analiza i przetwarzanie danych )
Porównanie wybranych gradientowych algorytmów uczenia maszynowego GB, XGBoost, LightGBM oraz CatBoost (2021, matematyka )
Uczenie przez wzmacnianie (2021, analiza i przetwarzanie danych )
Predykcja rotacji z wykorzystaniem technik uczenia maszynowego (2021, analiza i przetwarzanie danych )
Analiza wydźwięku na podstawie muzyki (2021, analiza i przetwarzanie danych )
Zastosowanie metod uczenia maszynowego w analizie przeżycia (2021, analiza i przetwarzanie danych )
Metody analizy danych geostatystycznych (2021, analiza i przetwarzanie danych )
Analiza jakości życia emerytów w wybranych krajach UE w latach 2008-2017 (2021, analiza i przetwarzanie danych )
Porównanie metod uzupełniania danych (2021, analiza i przetwarzanie danych )
Użycie konwolucyjnych sieci neuronowych do wykrywania malarii na podstawie rozmazów krwi (2021, analiza i przetwarzanie danych )
Analiza anomalii pogodowych za pomocą metod głębokiego uczenia (2021, analiza i przetwarzanie danych )
Klasyfikacja ekstremalna (2021, analiza i przetwarzanie danych )
Metody uczenia głębokich sieci neuronowych (2021, analiza i przetwarzanie danych )
Optymalizacja hiperparametrów w nauczaniu maszynowym (2021, analiza i przetwarzanie danych )
Rozmyte sieci neuronowe (2021, analiza i przetwarzanie danych )
Diagnostyka zdjęć medycznych z plików DICOM z wykorzystaniem uczenia transferowego (2020, informatyka )
Aplikacja do analizy danych za pomocą podstawowych statystyk (2020, analiza i przetwarzanie danych )
Imputacja danych za pomocą algorytmu Amelia II (2020, analiza i przetwarzanie danych )
Zastosowanie lasów losowych oraz XGBoost do analizy przeżycia (2020, analiza i przetwarzanie danych )
Metody uczenia maszynowego w klasyfikacji utworów muzycznych i systemach rekomendacji (2020, analiza i przetwarzanie danych )
Metody regularyzacji stosowane w analizie regresji (2020, analiza i przetwarzanie danych )
Zastosowania algorytmów uczenia maszynowego w projektowaniu doświadczeń użytkownika (2020, analiza i przetwarzanie danych )
Analiza wyników uzyskanych przez uczniów z zadań matematycznych (2020, analiza i przetwarzanie danych )
Generowanie emotikonów z tekstu za pomocą sieci GAN (2020, analiza i przetwarzanie danych )
Uczenie ze wzmacnianiem w grach planszowych (2020, analiza i przetwarzanie danych )
Analiza wpływu wdrożenia elektronicznego obiegu dokumentów na przedsiębiorstwo (2020, analiza i przetwarzanie danych )
Zastosowanie głębokich sieci neuronowych do przygotowywania posiłków (2020, informatyka )
Prognozowanie sprzedaży z wykorzystaniem platformy Hadoop + Spark (2020, analiza i przetwarzanie danych )
Generowanie muzyki przy pomocy głębokiego uczenia (2020, analiza i przetwarzanie danych )
Analiza danych oraz raportowanie w Tableau (2020, analiza i przetwarzanie danych )
Uczenie wielowystąpieniowe (2019, analiza i przetwarzanie danych )
Skuteczne wykrywanie obserwacji odstających (2019, analiza i przetwarzanie danych )
Segmentacja szeregów czasowych (2019, analiza i przetwarzanie danych )
Klasyfikacja wieloetykietowa (2019, analiza i przetwarzanie danych )
Algorytm XGBoost jako efektywna metoda klasyfikacji i regresji (2019, analiza i przetwarzanie danych )
Interpretacja sieci neuronowych (2019, matematyka )
Jak poprawnie porównywać klasyfikatory (2019, analiza i przetwarzanie danych )
Konwolucyjne sieci neuronowe (2019, analiza i przetwarzanie danych )
Prognozowanie szeregów czasowych za pomocą algorytmu Prophet (2019, analiza i przetwarzanie danych )
Regresja funkcjonalna dla odpowiedzi skalarnych (2019, analiza i przetwarzanie danych )
Zastosowanie metod uczenia maszynowego w muzyce (2019, analiza i przetwarzanie danych )
Uzupełnianie danych za pomocą algorytmu MICE (2018, matematyka )
Nieparametryczne metody estymacji funkcji przeżycia (2017, matematyka )
Metoda rzutowania jako nieliniowa metoda redukcji wymiaru (2017, matematyka )
Zalecana literatura:
Przykładowe pytania na egzaminach dyplomowych:
Analiza danych (magister)
Co to jest model regresji wielomianowej?
W jaki sposób możemy rozwiązać problem brakujących obserwacji?
Model lasu losowego.
Co to jest las izolacyjny?
Co to jest wykres pudełkowy?
Na czym polega dekompozycja szeregu czasowego?
Co znaczy, że szereg jest stacjonarny (słabo)?
Czy różnią się metody bagging i boosting?
Co to jest MAE i jak się ma do MSE?
Co to są bazy analityczne, czym się charakteryzują?
Co to jest jezioro danych?
Bazy nierelacyjne. Rodzaje i sposób działania.
Na czym polega model Kimballa projektowania hurtowni danych?
Metoda k-najbliższych sąsiadów. Co to jest i do czego służy?
Współczynnik korelacji Pearsona.
Na czym polega web-scraping?
Metody imputacji danych?
Na czym polega analiza post hoc?
Metoda one-hot-encoding i jej działanie na przykładzie.
Co to jest standaryzacja/normalizacja danych i po co jej używamy?
Wykorzystanie algebry liniowej w obliczeniach dotyczących krigingu.
Co to jest kowariancja dwóch zmiennych losowych?
Co to jest meshgrid i do czego służy?
Czy dane w tabeli pakietu numpy są ciągłe czy dyskretne?
Jakie cechy języka Python zdecydowały o jego wyborze w projekcie?
Co to jest wariogram?
Co to jest semiwariancja i do czego służy?
Uczenie nadzorowane i nienadzorowane. Główne cechy i przykłady.
Metoda sprawdzania krzyżowego.
Czym są sieci konwolucyjne?
Naiwny klasyfikator bayesowski.
Czym jest test statystyczny?
Czym jest oraz jak wyznaczamy AUC?
Na czym polega metoda gradientu prostego?
W jaki sposób badamy jakość modeli regresji?
Rodzaje metod nienadzorowanych?
Jakie są główne różnice pomiędzy algorytmem XGBoost i LightGBM?
Test Shapiro-Wilka.
Budowa jednowarstwowej regresyjnej sieci neuronowej.
Na czym polega analiza skupień? Proszę podać przykłady algorytmów analizy skupień.
Na czym polega obciążenie i wariancja w algorytmach uczenia maszynowego?
Na czym polega problem niezbalansowania danych? Jak możemy rozwiązać ten problem?
Na czym polega operacja splotu?
W jaki sposób przeciwdziałamy zjawisku przeuczenia sieci?
Czy możemy wykorzystywać współczynnik determinacji do porównywania modeli regresji
liniowej bez i z wyrazem wolnym?
Budowa wielowarstwowej sieci jednokierunkowej.
Jakie są główne zalety i wady pakietu ggplot2?
Co to jest funkcja jądrowa?
Co to jest metoda najmniejszych kwadratów? Jakie ma własności?
Co to jest graf? Rodzaje grafów?
Na czy polega niestabilność drzew klasyfikacyjnych?
W jaki sposób drzewa klasyfikacyjne radzą sobie z brakującymi danymi?
Proszę omówić inne niż drzewa metody klasyfikacji.
Jakie założenia przyjmujemy o błędach w metodzie najmniejszych kwadratów?
Algorytm k-średnich.
Rozkład t-Studenta.
Jakie założenia przyjmujemy o wektorze X i wektorze błędów w modelu wielokrotnej regresji liniowej?
Kryterium AIC vs kryterium BIC.
Co to jest analiza wariancji?
Czym różni się metoda lasso od klasycznej metody regresji wielokrotnej?
Co to jest funkcja wiarogodności?
Czym jest framework Dash i jakie ma cechy charakterystyczne?
Test t-studenta dla dwóch prób.
Co to znaczy, że szereg czasowy jest stacjonarny?
Jaką i jak zmienną zależną modelujemy w regresji logistycznej?
Co to jest autokorelacja?
Czym są dane przestrzenne.
Czym jest i do czego służy histogram?
Optymalizacja wyszukiwania w bazach danych.
Wykres typu kwantyl-kwantyl.
Informatyka (magister)
Do czego służy i jak działa algorytm DBSCAN?
Ewaluacja modeli uczenia maszynowego.
Czym różni się uczenie pod nadzorem od uczenia nienadzorowanego?
Co to jest sieć typu transformer?
Jakie są zalety i wady wykorzystywania w medycynie botów komunikacyjnych działających w oparciu o architekturę GPT?
Co to są i do czego służą sztuczne sieci neuronowe? Zasada uczenia się sztucznych sieci neuronowych.
W jaki sposób mierzymy jakość systemów regresyjnych w uczeniu maszynowym?
Uczenie maszynowe podstawowe typy z przykładami.
Do czego służy funkcja aktywacji w sieciach neuronowych? Jak działa funkcja ReLU?
Na czym polega algorytm klasyfikacji. Przykładowy algorytm klasyfikacji.
Uczenie nadzorowane, a uczenie nienadzorowane.
Sieć konwolucyjna.
Na czym polega uczenie przez wzmacnianie?
Macierz pomyłek (błędów) i jej interpretacja.
Metody oceny jakości w systemach regresyjnych.
Na czym polega problem braku zbalansowania danych w zadaniu klasyfikacji i jak możemy sobie z nim radzić?
Imputacja danych.
Jak badamy jakość metod klasyfikacji dla problemów dwuklasowych?
Do czego służy i na czym polega metoda LASSO?
Co to jest wariancja i na czym polega jej wykorzystanie w eliminacji cech?
Architektura Faster R-CNN.
Indeks Jaccarda: definicja i zastosowanie.
Działanie metody batch normalizacji i dlaczego działa?
Na czym polega zastosowanie algorytmu Winner Takes All? Jakie są jego wady i zalety?
Matematyka (licencjat)
Co to jest miara i jak ma się do prawdopodobieństwa?
Czym jest estymator nieobciążony o minimalnej wariancji, jego przykład i interpretacja?
Czym różni się podejście bayesowskie od podejścia częstościowego?
Czym różni się ryzyko bayesowskie od częstościowego?
W jaki sposób określamy rozkład jednostajny a priori dla parametru o rozkładzie określonym na zbiorze nieograniczonym, np. na R?
Jak działa algorytm lasu losowego?
Czym są wartość oczekiwana i wariancja oraz jakie mają własności?
Co to jest uczenie pod nadzorem?
Jak oszacować wartość oczekiwaną i wariancję?
Co to jest zmienna losowa i jej przykłady?
Jak definiujemy indeks Giniego? Do czego jest potrzebny przy konstrukcji drzew decyzyjnych?
Na czym polega analiza regresji?
Co to jest pierścień? Przykłady.
Czym różni się pierścień od ciała? Przykład pierścienia, który nie jest ciałem.
Algorytm Euklidesa, przykład.
Na czym polega algorytm zwany drabiną Montgomery’ego?
Przykłady regresji poza regresją wielokrotną?
Na czym polega metoda najmniejszych kwadratów?
Co to jest estymator nieobciążony?
Metody estymacji funkcji parametrycznej.
Na czym polega test permutacyjny? Jakie ma własności?
Twierdzenie Słuckiego.
Własności estymatorów.
Schemat Bernoullego i związki z rozkładami prawdopodobieństwa.
Prawdopodobieństwo warunkowe i jego zastosowanie.
Prawo pełnej wariancji.
Optymalny estymator w klasie estymatorów nieobciążonych.
Czym jest jednostronny przedział ufności?
Dystrybuanta zmiennej losowej i jej własności.
Wielowymiarowy rozkład normalny.
Rozkład chi-kwadrat i jego własności.
Analiza składowych głównych.
Testy zgodności dla zmiennych ciągłych.
Własności metody permutacyjnej i jej wersja bootstrapowa.
Test t-Studenta dla dwóch prób zależnych.
Jak konstruujemy test statystyczny?
Jak badamy dobroć testu statystycznego?
Co to jest semiwariogram i jak go szacujemy na podstawie danych?
Czym jest współczynnik determinacji?
Proszę porównać techniki OLS i GLS.
Co to są warunkowe i bezwarunkowe estymatory największej wiarogodności? Przykład.
Na czym polega schemat Bernoullego i jaki jest jego związek z ujemnym rozkładem
dwumianowym?
Metody estymacji punktowej poza metodą największej wiarogodności?
Na czym polega symulacja Monte Carlo?
Czym są dane funkcjonalne?
Co to jest baza w przestrzeni L2? Przykłady baz.
Na czym polega analiza wariancji?
Metody estymacji parametrów modelu.
Dlaczego algorytm składowych głównych zaliczamy do algorytmów redukcji wymiaru?
Czy składowe główne są niezmiennicze względem zmiany skali?
Przykłady definiowania iloczynu skalarnego i jego własności.
Na czym polega różnica pomiędzy pojęciami kwantyl i percentyl?
Jak definiujemy przestrzeń statystyczną?
Na czym polega metoda percentylowa i czym różni się od metody momentów?
Jak inaczej niż punktowo możemy estymować parametry?
O czym mówią centralne twierdzenia graniczne?
Czym jest gęstość i jakie ma własności?
Kryteria jakości estymatorów.
Jak estymujemy funkcje parametryczne metodą największej wiarogodności?
Co to są kontrasty w modelach analizy wariancji? Jak je estymujemy?
Na czym polega standaryzacja, a na czym polega studentyzacja?
Jakie założenia ma test F jednoczynnikowej analizy wariancji i jak możemy je sprawdzić?
Na czym polega metoda losowych projekcji?
Co to jest iloczyn skalarny?
Jakie błędy popełniamy przy testowaniu hipotez statystycznych?
Co to jest prawdopodobieństwo?
Jak ocenia się jakość drzewa klasyfikacyjnego?
Czym jest współczynnik determinacji?
Jaką metodą szacujemy parametry w modelu regresji liniowej?
Matematyka (magister)
Wielokrotna regresja liniowa vs korelacje kanoniczne.
Na czym polega trik jądrowy?
Iloczyn skalarny, definicja i przykłady.
Jakie własności ma kowariancja dwóch wektorów losowych?
Co to są jądra reprodukujące?
Jakie własności estymatorów wyróżniamy?
Czym są dane funkcjonalne?
Co to jest baza w przestrzeni L2? Przykłady baz.
Jakie modele regresji dla danych funkcjonalnych wyróżniamy?
Jakie własności może mieć estymator?
Metody estymacji parametrów modelu, przykłady.
Jaka jest ogólna konstrukcja testu statystycznego?
Proszę podać definicję i przykłady przestrzeni Hilberta.
Na czym polega analiza post hoc? Klasyczny test post hoc?
Czym różni się bootstrap parametryczny od nieparametrycznego?
Gdzie poza testami statystycznymi stosuje się bootstrap i permutacje danych?
Na czym polega poprawka Bonferroniego?
Co to jest estymator nieobciążony o minimalnej wariancji?
Gradient, Jakobian, Hesjan.
Jakie metody uzupełniania braków danych wyróżniamy?
Metodę bootstrap.
Na czym polega metoda PCA?
Proszę podać przykłady funkcji łączących w uogólnionych modelach liniowych.
Rozkład chi-kwadrat.
Jakie błędy popełniamy przy testowaniu hipotez statystycznych?
Co to jest mediana?
Co to jest analiza skupień?
Co to jest histogram?