-
Videospiele-Reviews ausgewertet mit R
Ich habe mir mal die Mühe gemacht, eine etwas größere Anzahl an Videospiele-Reviews (etwa 40.000) über mehrere Konsolen hinweg auszuwerten. Die Daten liegen als CSV-Datei vor und enthalten mehrere Spalten: Name des Spiels, Release-Datum des Spiels, Plattform, Bewertung.
-
Wie Sportwettquoten funktionieren und wie man damit rechnet
Da ich heute darüber nachdachte, algorithmisch an Sportwetten teilzunehmen, habe ich ein wenig mit den Quoten herumgerechnet.
-
150.000 SQLite-INSERTs beschleunigen
Bei Sprakit hatte ich das Problem, dass ich 150.000 Wikipedia-Artikel in eine SQLite-Datenbank eintragen musste (für Kroatisch, d.h. für Englisch oder Deutsch noch mehr). Mit einer normalen SQLite-Datenbank auf der Festplatte dauerte das mind. 1h - etwa so lange war ich weg und das Skript war immer noch nicht fertig.
-
Es ist vollbracht!
-
Rewriting University of Zagreb's Croatian Stemmer to a nltk-compliant class
The Faculty of Humanities and Social Sciences, University of Zagreb (FFZG) has published a croatian stemmer as a Python file. However, it is intended to be used as a command line script for stemming all words within a file.