-
My first-impressions approach to the Kaggle "Bike Sharing Demand" contest
In this article I will share my approach to the Kaggle contest named “Bike Sharing Demand”. It is in my opinion a quite easy dataset, so it’s easy for me to learn with. It’s also a very good dataset for visualisations.
-
Liste von Transformationen
Bei der Datenanalyse macht es oft Sinn, die Daten in einen anderen Raum (x-Achse) zu transformieren und erst dann zu analysieren. Dadurch kann oft eine Reduzierung der Dimensionalität des Problems und eine bessere Separierbarkeit erreicht werden. Die richtige Funktion muss jeweils anhand der Daten und dem Ziel gewählt werden.
-
Liste von Distanzmetriken
Verschiedene häufig verwendete Distanzmetriken:
-
Bloom- und Counting-Filter - probabilistische Datenstrukturen
Eine nützliche Datenstruktur, wenn man schnell ein Ergebnis braucht, ob etwas definitiv nicht vorhanden ist, sind Bloom-Filter. Sie sind eine probabilistische Datenstruktur, die falsch Positive aufweisen kann. Das bedeutet, dass die Antwort “X befindet sich in der Datenstruktur” nicht unbedingt richtig sein muss. Falsch Negative treten hingegen nicht auf, d.h. die Antwort “X befindet sich nicht in der Datenstruktur” ist immer richtig.
-
Raspberry Pi und Attiny 84V über I2C verbinden
Will man die Funktionalität seines Raspberry Pi um einen Atmel Mikrocontroller, z.B. Atmega oder Attiny erweitern, braucht man irgendeine Kommunikationsstrategie. Ich habe mich hierbei für eine I2C-Schnittstelle entschieden, da eine eigene Implementierung doch sehr umständlich ist (man muss immer auf einen Takt o.Ä. achten und somit doch ein komplettes Protokoll implementieren).