Presentado por:
- Douglas Andrés Ramírez Brujes
- Marianne Solangel Rojas Robles
Universidad Industrial de Santander
2019
El proyecto aprovecha el poder del machine learning para la estimación de la popularidad de un show animado 2d, a través de un regresor. Para esto se usan varios parámetros, entre los cuales se encuentran los siguientes:
- Número de personas interesadas en ver el show.
- Número de persosas que marcaron el show como favorito.
- Número de episodios que tiene cada show.
- Puntaje dado por las personas que vieron el show.
- Géneros del show animado.
Dado que existen en el mundo de la animación oriental 2d demasiados géneros, el cómputo necesario es increíblemente alto, por lo tanto, decidimos reducir la complejidad de los géneros mediante el agrupamiento de géneros.
La tupla que compone los géneros de un show animado se construye a partir de grupos definidos de géneros que tienen algún tipo de relación.
Los grupos de géneros fueron planteados a partir del dendrograma siguiente:
Autor: Racinmat
Finalmente, los grupos de géneros resultantes son los mostrados a continuación:
- Romance
- Shoujo
- Sports
- Sci-Fi
- Action
- Shounen
- Comedy
- Fantasy
- Music
- Supernatural
- Gore
- Historical
- Thriller
- Mistery
- Hentai
El objetivo del proyecto es, al pasarse una tupla de datos que contenga los géneros del show, el número estimado de episodios y la fuente (manga, novela, etc.), el regresor retorne una aproximación de su popularidad.
Los datos usados para el dataset provienen de MyAnimeList
- https://www.kaggle.com/azathoth42/myanimelist#anime_filtered.csv
- https://www.kaggle.com/azathoth42/myanimelist#anime_cleaned.csv
- https://www.kaggle.com/CooperUnion/anime-recommendations-database
- https://raw.githubusercontent.com/racinmat/mal-analysis/master/genres-hierarchical.png
- https://myanimelist.net/