Seminaria

Zrealizowane tematy prac licencjackich i inżynierskich:

  • Klasyfikacja szeregów czasowych za pomocą algorytmu Proximity Forest (2025, matematyka)
  • Wykorzystanie krzywych eliptycznych w szyfrowaniu na przykładzie krzywej Montgomerego (2024, matematyka)
  • Sample-efficient semantic segmentation (2024, matematyka)
  • Metody Monte Carlo w grach losowych (2024, matematyka)
  • Metody wyjaśniania modeli typu ,,czarna skrzynka” (2024, matematyka)
  • Lasy losowe z udoskonaloną regresją (2024, matematyka)
  • Proces analizy danych statystycznych (2024, informatyka)
  • Spektralna analiza skupień (2023, matematyka)
  • Robust Random Cut Forest jako metoda usuwania anomalii z danych (2023, matematyka)
  • Algorytm LightGBM jako efektywna metoda klasyfikacji i regresji (2022, matematyka)
  • Metoda LLE jako metoda redukcji wymiarowości (2022, matematyka)
  • Algorytm Catboost jako efektywna metoda klasyfikacji i regresji w przypadku występowania cech jakościowych (2022, matematyka)
  • Segmentacja obrazu na bloki tekstowe (2021, matematyka)
  • Analiza skupień za pomocą algorytmów DBSCAN i OPTICS (2020, matematyka)
  • Redukcja wymiaru danych za pomocą metody t-SNE (2020, matematyka)
  • Uogólniona analiza składowych głównych dla danych nie-normalnych (2020, matematyka)
  • Las izolacyjny (2020, matematyka)
  • Redukcja wymiaru w celu wykrywania obserwacji odstających za pomocą metody DOBIN (2020, matematyka)
  • Prognozowanie szeregów czasowych za pomocą metody ETS (2020, matematyka)
  • Klasyfikacja za pomocą metody DANN (2020, matematyka)
  • Jądrowa analiza składowych głównych (2020, matematyka)
  • Analiza skupień dla danych jakościowych za pomocą algorytmu ROCK (2019, matematyka)
  • Wykrywanie anomalii w danych za pomocą algorytmu LOF (2019, matematyka)
  • Las rotacyjny (2018, matematyka)
  • Wybrane zastosowania ukrytych modeli Markowa w nauczaniu maszynowym (2017, matematyka)
  • Wybrane metody statystyczne w analizie danych RNA-seq (2017, matematyka)
  • Klasyfikacja zdarzeń rzadkich (2017, matematyka)
  • Głębokie uczenie (2017, matematyka)
  • Zastosowanie algorytmu SVM do klasyfikacji (2017, matematyka)

Zrealizowane tematy prac magisterskich:

  • Wykorzystanie konwolucyjnych sieci neuronowych w transferze stylu obrazów (2024, analiza i przetwarzanie danych)
  • Analiza porównawcza wybranych narzędzi Business Intelligence (2024, analiza i przetwarzanie danych)
  • Porównanie skuteczności metod statystycznych oraz metod uczenia maszynowego w prognozowaniu szeregów czasowych (2024, analiza i przetwarzanie danych)
  • Zastosowanie sieci neuronowych w predykcji kursów walut na światowym rynku Forex (2024, analiza i przetwarzanie danych)
  • Prognozowanie wyników meczów tenisowych za pomocą algorytmów uczenia maszynowego (2024, analiza i przetwarzanie danych)
  • Systemy rekomendacyjne z wykorzystaniem modeli generatywnych na przykładzie wspomagania żywienia (2024, analiza i przetwarzanie danych)
  • Wykrywanie zdarzeń dźwiękowych za pomocą metod uczenia maszynowego (2024, analiza i przetwarzanie danych)
  • Ocena wykorzystania subgoali w silnikach szachowych opartych na MCTS (2024, analiza i przetwarzanie danych)
  • Rozpoznawanie emocji z twarzy za pomocą konwolucyjnych sieci neuronowych (CNN) (2024, analiza i przetwarzanie danych)
  • Power Iteration Clustering jako efektywna metoda grupowania danych (2023, analiza i przetwarzanie danych)
  • Klasyfikacja dzieł kultury na podstawie reprezentujących je grafik (2023, analiza i przetwarzanie danych)
  • Generowanie obrazów z wykorzystaniem sieci typu GAN (2023, analiza i przetwarzanie danych)
  • Regularized Implicit Neural Representations for Controlled Shape Interpolation (2023, analiza i przetwarzanie danych)
  • Uczenie głębokie w detekcji epizodów zamrożenia chodu (2023, informatyka)
  • White Box Attacks in Adversarial Machine Learning (2023, matematyka)
  • Analiza statystyczna i uczenie maszynowe w procesie wsparcia decyzji transferowych w piłce nożnej (2023, analiza i przetwarzanie danych)
  • Rozpoznawanie typu lokalizacji dla sklepu Żabka (2023, analiza i przetwarzanie danych)
  • Wykorzystanie VBA dla MS Excel w celu stworzenia cennika dla działu sprzedaży jako
    dopełnienie funkcjonującego systemu ERP (2022, analiza i przetwarzanie danych)
  • Predykcja sukcesu w piłce nożnej w oparciu o dane historyczne i uczenie maszynowe (2022, informatyka)
  • Sieci głębokich stert (2022, matematyka)
  • Predykcja wyników w oparciu o analizę historycznych danych dotyczących zdarzeń w piłce nożnej z wybranych lig europejskich (2022, informatyka)
  • Rola hiperparametrów w celu osiągnięcia najwyższej jakości predykcji sukcesu w Ekstraklasie (2022, informatyka)
  • Analiza geostatystyczna rozprzestrzeniania się wirusa SARS-CoV-2 (2021, analiza i przetwarzanie danych)
  • Porównanie wybranych gradientowych algorytmów uczenia maszynowego GB, XGBoost, LightGBM oraz CatBoost (2021, matematyka)
  • Uczenie przez wzmacnianie (2021, analiza i przetwarzanie danych)
  • Predykcja rotacji z wykorzystaniem technik uczenia maszynowego (2021, analiza i przetwarzanie danych)
  • Analiza wydźwięku na podstawie muzyki (2021, analiza i przetwarzanie danych)
  • Zastosowanie metod uczenia maszynowego w analizie przeżycia (2021, analiza i przetwarzanie danych)
  • Metody analizy danych geostatystycznych (2021, analiza i przetwarzanie danych)
  • Analiza jakości życia emerytów w wybranych krajach UE w latach 2008-2017 (2021, analiza i przetwarzanie danych)
  • Porównanie metod uzupełniania danych (2021, analiza i przetwarzanie danych)
  • Użycie konwolucyjnych sieci neuronowych do wykrywania malarii na podstawie rozmazów krwi (2021, analiza i przetwarzanie danych)
  • Analiza anomalii pogodowych za pomocą metod głębokiego uczenia (2021, analiza i przetwarzanie danych)
  • Klasyfikacja ekstremalna (2021, analiza i przetwarzanie danych)
  • Metody uczenia głębokich sieci neuronowych (2021, analiza i przetwarzanie danych)
  • Optymalizacja hiperparametrów w nauczaniu maszynowym (2021, analiza i przetwarzanie danych)
  • Rozmyte sieci neuronowe (2021, analiza i przetwarzanie danych)
  • Diagnostyka zdjęć medycznych z plików DICOM z wykorzystaniem uczenia transferowego (2020, informatyka)
  • Aplikacja do analizy danych za pomocą podstawowych statystyk (2020, analiza i przetwarzanie danych)
  • Imputacja danych za pomocą algorytmu Amelia II (2020, analiza i przetwarzanie danych)
  • Zastosowanie lasów losowych oraz XGBoost do analizy przeżycia (2020, analiza i przetwarzanie danych)
  • Metody uczenia maszynowego w klasyfikacji utworów muzycznych i systemach rekomendacji (2020, analiza i przetwarzanie danych)
  • Metody regularyzacji stosowane w analizie regresji (2020, analiza i przetwarzanie danych)
  • Zastosowania algorytmów uczenia maszynowego w projektowaniu doświadczeń użytkownika (2020, analiza i przetwarzanie danych)
  • Analiza wyników uzyskanych przez uczniów z zadań matematycznych (2020, analiza i przetwarzanie danych)
  • Generowanie emotikonów z tekstu za pomocą sieci GAN (2020, analiza i przetwarzanie danych)
  • Uczenie ze wzmacnianiem w grach planszowych (2020, analiza i przetwarzanie danych)
  • Analiza wpływu wdrożenia elektronicznego obiegu dokumentów na przedsiębiorstwo (2020, analiza i przetwarzanie danych)
  • Zastosowanie głębokich sieci neuronowych do przygotowywania posiłków (2020, informatyka)
  • Prognozowanie sprzedaży z wykorzystaniem platformy Hadoop + Spark (2020, analiza i przetwarzanie danych)
  • Generowanie muzyki przy pomocy głębokiego uczenia (2020, analiza i przetwarzanie danych)
  • Analiza danych oraz raportowanie w Tableau (2020, analiza i przetwarzanie danych)
  • Uczenie wielowystąpieniowe (2019, analiza i przetwarzanie danych)
  • Skuteczne wykrywanie obserwacji odstających (2019, analiza i przetwarzanie danych)
  • Segmentacja szeregów czasowych (2019, analiza i przetwarzanie danych)
  • Klasyfikacja wieloetykietowa (2019, analiza i przetwarzanie danych)
  • Algorytm XGBoost jako efektywna metoda klasyfikacji i regresji (2019, analiza i przetwarzanie danych)
  • Interpretacja sieci neuronowych (2019, matematyka)
  • Jak poprawnie porównywać klasyfikatory (2019, analiza i przetwarzanie danych)
  • Konwolucyjne sieci neuronowe (2019, analiza i przetwarzanie danych)
  • Prognozowanie szeregów czasowych za pomocą algorytmu Prophet (2019, analiza i przetwarzanie danych)
  • Regresja funkcjonalna dla odpowiedzi skalarnych (2019, analiza i przetwarzanie danych)
  • Zastosowanie metod uczenia maszynowego w muzyce (2019, analiza i przetwarzanie danych)
  • Uzupełnianie danych za pomocą algorytmu MICE (2018, matematyka)
  • Nieparametryczne metody estymacji funkcji przeżycia (2017, matematyka)
  • Metoda rzutowania jako nieliniowa metoda redukcji wymiaru (2017, matematyka)


Zalecana literatura:

Przykładowe pytania na egzaminach dyplomowych:

  1. Analiza danych (magister)
    • Co to jest model regresji wielomianowej?
    • W jaki sposób możemy rozwiązać problem brakujących obserwacji?
    • Model lasu losowego.
    • Co to jest las izolacyjny?
    • Co to jest wykres pudełkowy?
    • Na czym polega dekompozycja szeregu czasowego?
    • Co znaczy, że szereg jest stacjonarny (słabo)?
    • Czy różnią się metody bagging i boosting?
    • Co to jest MAE i jak się ma do MSE?
    • Co to są bazy analityczne, czym się charakteryzują?
    • Co to jest jezioro danych?
    • Bazy nierelacyjne. Rodzaje i sposób działania.
    • Na czym polega model Kimballa projektowania hurtowni danych?
    • Metoda k-najbliższych sąsiadów. Co to jest i do czego służy?
    • Współczynnik korelacji Pearsona.
    • Na czym polega web-scraping?
    • Metody imputacji danych?
    • Na czym polega analiza post hoc?
    • Metoda one-hot-encoding i jej działanie na przykładzie.
    • Co to jest standaryzacja/normalizacja danych i po co jej używamy?
    • Wykorzystanie algebry liniowej w obliczeniach dotyczących krigingu.
    • Co to jest kowariancja dwóch zmiennych losowych?
    • Co to jest meshgrid i do czego służy?
    • Czy dane w tabeli pakietu numpy są ciągłe czy dyskretne?
    • Jakie cechy języka Python zdecydowały o jego wyborze w projekcie?
    • Co to jest wariogram?
    • Co to jest semiwariancja i do czego służy?
    • Uczenie nadzorowane i nienadzorowane. Główne cechy i przykłady.
    • Metoda sprawdzania krzyżowego.
    • Czym są sieci konwolucyjne?
    • Naiwny klasyfikator bayesowski.
    • Czym jest test statystyczny?
    • Czym jest oraz jak wyznaczamy AUC?
    • Na czym polega metoda gradientu prostego?
    • W jaki sposób badamy jakość modeli regresji?
    • Rodzaje metod nienadzorowanych?
    • Jakie są główne różnice pomiędzy algorytmem XGBoost i LightGBM?
    • Test Shapiro-Wilka.
    • Budowa jednowarstwowej regresyjnej sieci neuronowej.
    • Na czym polega analiza skupień? Proszę podać przykłady algorytmów analizy skupień.
    • Na czym polega obciążenie i wariancja w algorytmach uczenia maszynowego?
    • Na czym polega problem niezbalansowania danych? Jak możemy rozwiązać ten problem?
    • Na czym polega operacja splotu?
    • W jaki sposób przeciwdziałamy zjawisku przeuczenia sieci?
    • Czy możemy wykorzystywać współczynnik determinacji do porównywania modeli regresji
    • liniowej bez i z wyrazem wolnym?
    • Budowa wielowarstwowej sieci jednokierunkowej.
    • Jakie są główne zalety i wady pakietu ggplot2?
    • Co to jest funkcja jądrowa?
    • Co to jest metoda najmniejszych kwadratów? Jakie ma własności?
    • Co to jest graf? Rodzaje grafów?
    • Na czy polega niestabilność drzew klasyfikacyjnych?
    • W jaki sposób drzewa klasyfikacyjne radzą sobie z brakującymi danymi?
    • Proszę omówić inne niż drzewa metody klasyfikacji.
    • Jakie założenia przyjmujemy o błędach w metodzie najmniejszych kwadratów?
    • Algorytm k-średnich.
    • Rozkład t-Studenta.
    • Jakie założenia przyjmujemy o wektorze X i wektorze błędów w modelu wielokrotnej regresji liniowej?
    • Kryterium AIC vs kryterium BIC.
    • Co to jest analiza wariancji?
    • Czym różni się metoda lasso od klasycznej metody regresji wielokrotnej?
    • Co to jest funkcja wiarogodności?
    • Czym jest framework Dash i jakie ma cechy charakterystyczne?
    • Test t-studenta dla dwóch prób.
    • Co to znaczy, że szereg czasowy jest stacjonarny?
    • Jaką i jak zmienną zależną modelujemy w regresji logistycznej?
    • Co to jest autokorelacja?
    • Czym są dane przestrzenne.
    • Czym jest i do czego służy histogram?
    • Optymalizacja wyszukiwania w bazach danych.
    • Wykres typu kwantyl-kwantyl.
  2. Informatyka (magister)
    • Do czego służy i jak działa algorytm DBSCAN?
    • Ewaluacja modeli uczenia maszynowego.
    • Czym różni się uczenie pod nadzorem od uczenia nienadzorowanego?
    • Co to jest sieć typu transformer?
    • Jakie są zalety i wady wykorzystywania w medycynie botów komunikacyjnych działających w oparciu o architekturę GPT?
    • Co to są i do czego służą sztuczne sieci neuronowe? Zasada uczenia się sztucznych sieci neuronowych.
    • W jaki sposób mierzymy jakość systemów regresyjnych w uczeniu maszynowym?
    • Uczenie maszynowe podstawowe typy z przykładami.
    • Do czego służy funkcja aktywacji w sieciach neuronowych? Jak działa funkcja ReLU?
    • Na czym polega algorytm klasyfikacji. Przykładowy algorytm klasyfikacji.
    • Uczenie nadzorowane, a uczenie nienadzorowane.
    • Sieć konwolucyjna.
    • Na czym polega uczenie przez wzmacnianie?
    • Macierz pomyłek (błędów) i jej interpretacja.
    • Metody oceny jakości w systemach regresyjnych.
    • Na czym polega problem braku zbalansowania danych w zadaniu klasyfikacji i jak możemy sobie z nim radzić?
    • Imputacja danych.
    • Jak badamy jakość metod klasyfikacji dla problemów dwuklasowych?
    • Do czego służy i na czym polega metoda LASSO?
    • Co to jest wariancja i na czym polega jej wykorzystanie w eliminacji cech?
    • Architektura Faster R-CNN. 
    • Indeks Jaccarda: definicja i zastosowanie.
    • Działanie metody batch normalizacji i dlaczego działa? 
    • Na czym polega zastosowanie algorytmu Winner Takes All? Jakie są jego wady i zalety?
  3. Matematyka (licencjat)
    • Co to jest miara i jak ma się do prawdopodobieństwa?
    • Czym jest estymator nieobciążony o minimalnej wariancji, jego przykład i interpretacja?
    • Czym różni się podejście bayesowskie od podejścia częstościowego?
    • Czym różni się ryzyko bayesowskie od częstościowego?
    • W jaki sposób określamy rozkład jednostajny a priori dla parametru o rozkładzie określonym na zbiorze nieograniczonym, np. na R?
    • Jak działa algorytm lasu losowego?
    • Czym są wartość oczekiwana i wariancja oraz jakie mają własności?
    • Co to jest uczenie pod nadzorem?
    • Jak oszacować wartość oczekiwaną i wariancję?
    • Co to jest zmienna losowa i jej przykłady?
    • Jak definiujemy indeks Giniego? Do czego jest potrzebny przy konstrukcji drzew decyzyjnych?
    • Na czym polega analiza regresji?
    • Co to jest pierścień? Przykłady.
    • Czym różni się pierścień od ciała? Przykład pierścienia, który nie jest ciałem.
    • Algorytm Euklidesa, przykład.
    • Na czym polega algorytm zwany drabiną Montgomery’ego?
    • Przykłady regresji poza regresją wielokrotną?
    • Na czym polega metoda najmniejszych kwadratów?
    • Co to jest estymator nieobciążony?
    • Metody estymacji funkcji parametrycznej.
    • Na czym polega test permutacyjny? Jakie ma własności?
    • Twierdzenie Słuckiego.
    • Własności estymatorów.
    • Schemat Bernoullego i związki z rozkładami prawdopodobieństwa.
    • Prawdopodobieństwo warunkowe i jego zastosowanie.
    • Prawo pełnej wariancji.
    • Optymalny estymator w klasie estymatorów nieobciążonych.
    • Czym jest jednostronny przedział ufności?
    • Dystrybuanta zmiennej losowej i jej własności.
    • Wielowymiarowy rozkład normalny.
    • Rozkład chi-kwadrat i jego własności.
    • Analiza składowych głównych.
    • Testy zgodności dla zmiennych ciągłych.
    • Własności metody permutacyjnej i jej wersja bootstrapowa.
    • Test t-Studenta dla dwóch prób zależnych.
    • Jak konstruujemy test statystyczny?
    • Jak badamy dobroć testu statystycznego?
    • Co to jest semiwariogram i jak go szacujemy na podstawie danych?
    • Czym jest współczynnik determinacji?
    • Proszę porównać techniki OLS i GLS.
    • Co to są warunkowe i bezwarunkowe estymatory największej wiarogodności? Przykład.
    • Na czym polega schemat Bernoullego i jaki jest jego związek z ujemnym rozkładem
    • dwumianowym?
    • Metody estymacji punktowej poza metodą największej wiarogodności?
    • Na czym polega symulacja Monte Carlo?
    • Czym są dane funkcjonalne? 
    • Co to jest baza w przestrzeni L2? Przykłady baz. 
    • Na czym polega analiza wariancji? 
    • Metody estymacji parametrów modelu.
    • Dlaczego algorytm składowych głównych zaliczamy do algorytmów redukcji wymiaru? 
    • Czy składowe główne są niezmiennicze względem zmiany skali? 
    • Przykłady definiowania iloczynu skalarnego i jego własności. 
    • Na czym polega różnica pomiędzy pojęciami kwantyl i percentyl? 
    • Jak definiujemy przestrzeń statystyczną? 
    • Na czym polega metoda percentylowa i czym różni się od metody momentów? 
    • Jak inaczej niż punktowo możemy estymować parametry?
    • O czym mówią centralne twierdzenia graniczne? 
    • Czym jest gęstość i jakie ma własności? 
    • Kryteria jakości estymatorów. 
    • Jak estymujemy funkcje parametryczne metodą największej wiarogodności?
    • Co to są kontrasty w modelach analizy wariancji? Jak je estymujemy? 
    • Na czym polega standaryzacja, a na czym polega studentyzacja? 
    • Jakie założenia ma test F jednoczynnikowej analizy wariancji i jak możemy je sprawdzić?
    • Na czym polega metoda losowych projekcji? 
    • Co to jest iloczyn skalarny? 
    • Jakie błędy popełniamy przy testowaniu hipotez statystycznych? 
    • Co to jest prawdopodobieństwo?
    • Jak ocenia się jakość drzewa klasyfikacyjnego? 
    • Czym jest współczynnik determinacji? 
    • Jaką metodą szacujemy parametry w modelu regresji liniowej?
  4. Matematyka (magister)
    • Wielokrotna regresja liniowa vs korelacje kanoniczne. 
    • Na czym polega trik jądrowy? 
    • Iloczyn skalarny, definicja i przykłady. 
    • Jakie własności ma kowariancja dwóch wektorów losowych? 
    • Co to są jądra reprodukujące? 
    • Jakie własności estymatorów wyróżniamy?
    • Czym są dane funkcjonalne? 
    • Co to jest baza w przestrzeni L2? Przykłady baz. 
    • Jakie modele regresji dla danych funkcjonalnych wyróżniamy? 
    • Jakie własności może mieć estymator? 
    • Metody estymacji parametrów modelu, przykłady.
    • Jaka jest ogólna konstrukcja testu statystycznego? 
    • Proszę podać definicję i przykłady przestrzeni Hilberta. 
    • Na czym polega analiza post hoc? Klasyczny test post hoc? 
    • Czym różni się bootstrap parametryczny od nieparametrycznego? 
    • Gdzie poza testami statystycznymi stosuje się bootstrap i permutacje danych? 
    • Na czym polega poprawka Bonferroniego?
    • Co to jest estymator nieobciążony o minimalnej wariancji? 
    • Gradient, Jakobian, Hesjan. 
    • Jakie metody uzupełniania braków danych wyróżniamy? 
    • Metodę bootstrap. 
    • Na czym polega metoda PCA? 
    • Proszę podać przykłady funkcji łączących w uogólnionych modelach liniowych.
    • Rozkład chi-kwadrat. 
    • Jakie błędy popełniamy przy testowaniu hipotez statystycznych? 
    • Co to jest mediana? 
    • Co to jest analiza skupień? 
    • Co to jest histogram?