-
Going on with Kaggle's bike competition
Going on with the Kaggle competition about bike rentals, I tried out a decision tree classifier for finding out the importances of features. I gotta admit, I am not sure yet, what are the exact drawbacks of this method (i.e. what can be missed by this approach), but at least it shows you what you should also look at.
-
Gaussian-Mixture-Model in R
In meinem letzten Eintrag zum Kaggle-Wettbewerb zur Fahrradnutzung habe ich zwei Verteilungen der Uhrzeiten geplottet, zu welchen Fahrräder gemietet wurden. In einer davon waren zwei Spitzen zu erkennen und grob sieht es auch nach zwei Gaussglocken aus.
-
My first-impressions approach to the Kaggle "Bike Sharing Demand" contest
In this article I will share my approach to the Kaggle contest named “Bike Sharing Demand”. It is in my opinion a quite easy dataset, so it’s easy for me to learn with. It’s also a very good dataset for visualisations.
-
Liste von Transformationen
Bei der Datenanalyse macht es oft Sinn, die Daten in einen anderen Raum (x-Achse) zu transformieren und erst dann zu analysieren. Dadurch kann oft eine Reduzierung der Dimensionalität des Problems und eine bessere Separierbarkeit erreicht werden. Die richtige Funktion muss jeweils anhand der Daten und dem Ziel gewählt werden.
-
Liste von Distanzmetriken
Verschiedene häufig verwendete Distanzmetriken: