BAföG-Ausgaben im Vergleich zur wirtschaftlichen Entwicklung
Nach einer Diskussion über das BAföG und notwendige Reformen, bin ich bei bafoeg-rechner.de auf Zahlen zu den BAföG-Gesamtausgaben (ganz unten) gestoßen. Die prozentualen Steigerungen hier schienen mir so hoch, dass es lohnend schien, dies einmal zu visualisieren.
Distribution of torrent files in categories (at kickass.to)
Just a quick chart: Since kickass.to provides its whole archive for download, I was able to analyze which category contains how many torrents.
Scrapy: Fix wrong sitemap URLs with custom downloader middleware
On stackoverflow, the topic was discussed, how to solve the problem of some sitemaps having absolute URLs without a scheme. According to RFC this is fine, but as the maintainers of scrapy pointed out, sitemaps require the contents of
to include a scheme (called protocol in the sitemap specs). -
Einen einfachen Sprachklassifikator bauen
Im Web fehlen häufig Angaben darüber, in welcher Sprache eine Seite geschrieben ist. Trotzdem würden wir gerne den Benutzern unseres Dienstes nur diejenigen Inhalte anzeigen, die sie auch verstehen. Auch in anderen Bereichen erhalten wir oft Texte, deren Sprachen wir nicht kennen.
Going on with Kaggle's bike competition
Going on with the Kaggle competition about bike rentals, I tried out a decision tree classifier for finding out the importances of features. I gotta admit, I am not sure yet, what are the exact drawbacks of this method (i.e. what can be missed by this approach), but at least it shows you what you should also look at.