Skip to content

Big Data Project for analysis of Warsaw public bus IoT data, enriched with meteorological data. Authors: Paulina Jaszczuk, Kacper Grzymkowski, Jakub Fołtyn

Notifications You must be signed in to change notification settings

niegrzybkowski/bus-route-analysis

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

31 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Projekt z przedmiotu Big Data- zespół KPK

  • Autorzy: Paulina Jaszczuk, Kacper Grzymkowski, Jakub Fołtyn
    Niniejsze repozytorium obejmuje projekt z przedmiotu Big Data, realizowanego w ramach studiów inżynierskich na wydziale Matematyki i Nauk Informacyjnych Politechniki Warszawskiej.
    Projekt skupia się na przetwarzaniu i analizie danych dotyczących autobusów warszawskiego transportu miejskiego (udostępnionych przez ZTM), pozyskiwanych ze strony Dane po warszawsku. Ponadto analizy wzbogacane są danymi dotyczącymi warunków pogodowych ze strony Meteostat. Przetwarzanie oraz składowanie danych wykonywane jest przy użyciu narzędzi i oprogramowania związanego z szeroko rozumianym pojęciem dziedziny Big Data.

Struktura folderów i plików:

  • nifi\ - folder ten zawiera szablony przetwarzania w Apache Nifi, jak i wszelkie skrypty "pomocnicze", wspomagające owe przetwarzanie.
  • enrichment\ - folder ten zawiera skrypty PySpark związane z ubogacaniem danych dotyczących autobusów.
  • spark_analysis\ - folder zawierający skrypty z dalszymi analizami w PySpark.
  • hbase\ - folder zawierający skrypty tworzące bazy danych HBase, jak i również umożliwiające dostęp do HBase z poziomu jupyter notebook.
  • visualization\ - folder zawierający notatnik Jupyter notebook z wizualizacjami.
  • raport\ - folder zawierający dokumentację oraz prezentację projektu.

About

Big Data Project for analysis of Warsaw public bus IoT data, enriched with meteorological data. Authors: Paulina Jaszczuk, Kacper Grzymkowski, Jakub Fołtyn

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 86.4%
  • Python 13.5%
  • Shell 0.1%