niegrzybkowski / bus-route-analysis Public

forked from jakfol1217/BigData-kpk

Notifications You must be signed in to change notification settings
Fork 0
Star 0

Big Data Project for analysis of Warsaw public bus IoT data, enriched with meteorological data. Authors: Paulina Jaszczuk, Kacper Grzymkowski, Jakub Fołtyn

0 stars 1 fork Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 31 Commits
enrichment		enrichment
hbase		hbase
nifi		nifi
raport		raport
spark_analysis		spark_analysis
visualization		visualization
README.md		README.md

Repository files navigation

Projekt z przedmiotu Big Data- zespół KPK

Autorzy: Paulina Jaszczuk, Kacper Grzymkowski, Jakub Fołtyn
Niniejsze repozytorium obejmuje projekt z przedmiotu Big Data, realizowanego w ramach studiów inżynierskich na wydziale Matematyki i Nauk Informacyjnych Politechniki Warszawskiej.
Projekt skupia się na przetwarzaniu i analizie danych dotyczących autobusów warszawskiego transportu miejskiego (udostępnionych przez ZTM), pozyskiwanych ze strony Dane po warszawsku. Ponadto analizy wzbogacane są danymi dotyczącymi warunków pogodowych ze strony Meteostat. Przetwarzanie oraz składowanie danych wykonywane jest przy użyciu narzędzi i oprogramowania związanego z szeroko rozumianym pojęciem dziedziny Big Data.

Struktura folderów i plików:

nifi\ - folder ten zawiera szablony przetwarzania w Apache Nifi, jak i wszelkie skrypty "pomocnicze", wspomagające owe przetwarzanie.
enrichment\ - folder ten zawiera skrypty PySpark związane z ubogacaniem danych dotyczących autobusów.
spark_analysis\ - folder zawierający skrypty z dalszymi analizami w PySpark.
hbase\ - folder zawierający skrypty tworzące bazy danych HBase, jak i również umożliwiające dostęp do HBase z poziomu jupyter notebook.
visualization\ - folder zawierający notatnik Jupyter notebook z wizualizacjami.
raport\ - folder zawierający dokumentację oraz prezentację projektu.

About

Big Data Project for analysis of Warsaw public bus IoT data, enriched with meteorological data. Authors: Paulina Jaszczuk, Kacper Grzymkowski, Jakub Fołtyn

Report repository

Releases

No releases published

Packages

No packages published

Languages

Jupyter Notebook 86.4%
Python 13.5%
Shell 0.1%