Accountdaten von geocaching.com auf dem Seziertisch

Tag-Wolke zur Angabe Location im ProfilWie viele Premium-Mitglieder mag es wohl geben? Wie ist das Verhältnis von Basic- zu Premium-Mitgliedschaften? Diese und ähnliche Fragen tauchen hin und wieder in Diskussionen auf und auch ich habe mich das schon gefragt… und mit dieser Frage stand ich nicht ganz alleine da. Eine E-Mail mit „Interesse an Accountdaten“ flatterte vor zwei Wochen ins Postfach und weckte mein Interesse.

Jemand, der seinen Namen in diesem Zusammenhang nicht erwähnt haben möchte, bot mir eine Liste mit öffentlich verfügbaren Informationen aller Accounts von geocaching.com an. Ein kleiner Auszug der Daten und eine kurze Erklärung zum Aufbau, mein Interesse war geweckt.
Account-ID, Name, Anzahl der Funde, Anzahl der geloggten und discoverten Trackables, das Registrierungsdatum, der Mitgliedstyp, die im Profil angegebene Location und das Datum des letzten Logins.
Erhoben wurden diese Daten in einem Zeitraum von etwa einem halben Jahr und mit Hilfe eines schlichten Python-Scripts, sowie mit zwei Raspberry Pi. Alles in allem 52 Textfiles, 1,14GB Daten mit Infos zu etwas mehr als 20,5 Millionen Accounts. Nach einer kleinen Stichprobe habe ich zur Auswertung alles in eine Datenbank gepackt und anschließend der Statistik und Auswertung gefröhnt.
Man könnte vermutlich eine Diplomarbeit zu dem Thema schreiben… Ich versuche mich, im Gegensatz zum Artikel „War früher wirklich alles besser?“ kurz zu fassen.
Die Entwicklung der Mitgliederzahlen auf geocaching.com habe ich schon im April 2013 angeschaut und grafisch festgehalten. Spannend zu sehen wie sich die Accountzahlen in den letzten, etwas mehr als vier Jahren weiterentwickelt haben.
Accountentwicklung geocaching.com
Accountentwicklung Gesamt nach Monaten

Die Frage „Flacht der Boom ab?“ kann man rückblickend also mit einem klaren „Nein“ beantworten. Die Latte konnte mehrfach höher gelegt werden und gipfelte im Juli 2016 mit 746645 neuen Accounts in einem einzigen Monat.
Der Spitzenwert von 41886 neuen Accounts pro Tag wurde hierbei am 10.07.2016 erreicht.
Accountentwicklung geocaching.com 2016
Accountentwicklung 2016 nach Tagen

Das Jahr 2017 startete im Vergleich dazu eher verhalten, bislang liegt der Spitzenwert bei 15194 Neuanmeldungen am 06.05.2017.
Accountentwicklung geocaching.com 2017
Accountentwicklung 2017 nach Tagen

Man könnte unken, dass die Anzahl Anmeldungen nun auch langsam aber sicher abflachen oder zurückgehen, aber im Gegensatz zu den Cachezahlen, wo es schon Gewissheit ist, kann man hier aktuell nur Vermutungen anstellen.
Da mit dem Registrierungsdatum und dem Datum der letzten Anmeldung auf der Webseite auf die Nutzungsdauer der Accounts geschlossen werden kann – wenn auch mit Abstrichen – darf natürlich eben jene Statistik nicht fehlen.
Nutzungsdauer von GC-Accounts nach Jahren
Nutzungsdauer von GC-Accounts nach Jahren

Die Anzahl Accounts, die eingerichtet und nie benutzt wurden, ist extrem hoch. Bei genauer Betrachtung des ersten Jahres sind mehr als 6,2 Millionen Accounts registriert, in deren Profil bei „Last visit“ einfach nur „Never“ steht. Die Anzahl Accounts, welche offensichtlich nur einen Tag in Benutzung waren – gerade mal so viel um Geocaching auf die Schnelle auszuprobieren – liegt mit etwas mehr als 6 Millionen Accounts knapp darunter.
Nutzungsdauer von GC-Accounts im ersten Jahr
Nutzungsdauer von GC-Accounts im ersten Jahr

Allerdings machen hier die Smartphone-Nutzer der Auswertung einen Strich durch die Rechnung. Die Geocacher, die nur die App nutzen, werden beim Datum des letzten Besuchs nicht berücksichtigt, vermutlich weil sie schlicht die Webseite auf diese Weise gar nicht besuchen. Hier mal einen Überblick über die Accounts, die mehr als einen Cache gefunden haben, obwohl sie bis dato laut Profil nicht ein einziges Mal online waren.
Accounts mit Funden, obwohl mit diesen laut Profil nie jemand online war
Accounts mit Funden, obwohl mit diesen laut Profil nie jemand online war

Interessanterweise gibt es auch eine Anhäufung solcher Accounts im Jahr 2001 und Anfang des Jahres 2002 – welche Erklärung mag es wohl dafür geben?
Hauptsächlich handelt es sich hierbei um „Basic Member“ und „Not Validated Member“, letztere sind Accounts, die ihre E-Mailadresse nicht verifiziert haben.
Anzahl Accounts mit Funden, obwohl mit diesen laut Profil nie jemand online war, gruppiert nach Mitgliedstyp
Accounts mit Funden, obwohl mit diesen laut Profil nie jemand online war, gruppiert nach Mitgliedstyp

Bei der Untersuchung Basic-Member – Premium-Member gibt es dafür aber nur ein einheitliches schwarz oder weiß und keine Grautöne. Während bei der Eingangs gezeigten Entwicklung der Mitgliederzahlen alle Mitgliedstypen enthalten sind, hatte ich bei der folgenden Auswertung nur die Premium-Mitglieder im Blick.
Accountentwicklung nach Monaten, nur Premium Member
Accountentwicklung nach Monaten, nur Premium Member

Von den Geocachern, die sich im Juli 2016 angemeldet haben, besitzen 18262 eine Premium-Mitgliedschaft.
Accountentwicklung geocaching.com 2016, nur Premium Member
Accountentwicklung 2016 nach Tagen, nur Premium Member

Das Maximum lag am 10.07.2016 bei 1011 Geocachern, welche zum Zeitpunkt der Erhebung noch im Besitz einer Premium-Mitgliedschaft waren.
Accountentwicklung geocaching.com 2017, nur Premium Member
Accountentwicklung 2017 nach Tagen, nur Premium Member

In diesem Jahr konnten sich die Geocacher, die sich am 09.04.2017 angemeldet haben, am meisten für eine bezahlte Mitgliedschaft bei geocaching.com erwärmen. Man sieht hier, wie auch schon bei der Grafik zu den gesamten Mitgliedszahlen für das Jahr 2017, dass es am Wochenende die meisten Anmeldungen auf der Webseite gibt.
Die Frage nach der Anzahl Premium Mitglieder auf geocaching.com ist schnell beantwortet: 473599
Verteilung der Mitgliedschaften auf geocaching.com
Verteilung der Mitgliedschaften auf geocaching.com

Wer hier lieber eine logarithmische Darstellung bevorzugt, bitte sehr:
Verteilung der Mitgliedschaften auf geocaching.com, logarithmischer Maßstab
Verteilung der Mitgliedschaften auf geocaching.com, logarithmischer Maßstab

Jeder Account bekommt eine fortlaufende ID, in der Datenbank sind allerdings diverse IDs nicht vergeben worden. Daher gibt es 32290 nicht existierende Accounts (Beispiel: ID 10614). Manche Accounts besitzen noch den Zusatz „User“, allerdings habe ich keine Ahnung was sich dahinter verbirgt (Beispiel: Basic Member, UserPremium Member, User).
473599 Premium Mitglieder, davon ziehen wir Reviewer und Lackeys, sowie deren kostenlose PM-Playeraccounts mal ab und kehren vorsichtshalber noch ein paar Zehntausend, die vielleicht gerade eine kostenlose Probemitgliedschaft o.ä. genießen, unter den Teppich. Rechnen wir einfach mal mit 400000, das macht es einfacher. 400000 x 30 Dollar = 12 Millionen Dollar Umsatz. Den Preisunterschied Euro-Dollar (in Europa zahlt man seit ein paar Jahren 30 Euro, sonst 30 Dollar) vergessen wir mal eben und aufgrund der PM-Rabattaktion ziehen wir noch 2 Mille ab. Bleiben 10 Millionen Dollar Umsatz im Jahr, zuzüglich der Einnahmen durch Trackables – Das nenne ich mal Geocashing, Respekt! Im Schnitt 300-400 neue Premium-Mitglieder pro Tag (siehe Auswertung „Accountentwicklung 2017 nach Tagen, nur Premium Member“ weiter oben), da klingelt die Kasse ordentlich… aber die Souvenirs wollen schließlich auch bezahlt sein. #KleinerSeitenhiebMeinerseits
Interessant sind in diesem Zusammenhang auch die Verteilung der Funde – insgesamt rund 583,5 Millionen – auf die Mitgliedstypen.
Verteilung der Funde nach Mitgliedstyp
Verteilung der Funde nach Mitgliedstyp
Im Schnitt stechen allerdings die Charter Member hervor, dicht gefolgt von den ominösen „Premium Member, User“ – Accounts und den gesperrten Premium Membern.
Durchschnittliche Fundzahl nach Mitgliedstyp
Durchschnittliche Fundzahl nach Mitgliedstyp

Bei den geloggten und discoverten Trackables – fast 74,4 Millionen an der Zahl – gibt es folgende Verteilung:
Verteilung der geloggten und discoverten Trackables nach Mitgliedstyp
Verteilung der geloggten und discoverten Trackables nach Mitgliedstyp

Im Durchschnitt sind die von der Plattform „ausgeladenen“ Premium Mitglieder die treibende Kraft, die sechs Kollegen discovern wohl ganz gerne.

Durchschnittliche Fundzahl nach Mitgliedstyp
Durchschnittliche Fundzahl nach Mitgliedstyp

Insgesamt wurden 14728 Geocacher ihres Accounts enthoben, wobei es die Auszeichnung „Banned Premium Member“ gar nicht mehr zu geben scheint (nennt sich nicht „Banned“, sondern „Locked“).
Gesperrte Accounts nach Datum der Registrierung (Achtung, logarithmischer Maßstab)
Gesperrte Accounts nach Datum der Registrierung (Achtung, logarithmischer Maßstab)

Diejenigen, die sich im Januar 2016 angemeldet haben, sind hierfür besonders anfällig. Allerdings erkennt man am Muster der Anmeldungen – immer ein Name gefolgt mit einer scheinbar wahllosen Folge von Ziffern – dass hier wohl ein Bot zugange war. Wenn man nur die Accounts herauspickt, deren Fundzahl größer Null ist, ergibt sich folgendes Bild:
Gesperrte Accounts nach Datum des letzten Logins
Gesperrte Accounts nach Datum des letzten Logins

Es gibt im Schnitt also doch rund 40 Geocacher, die sich monatlich neu anmelden und ihre Funde nachloggen müssen…
:lachtot:

Zu guter Letzt gibt es in den Profilen noch das Freitext-Feld „Location“. Die Top-Angaben waren hier „home“, „Texas“, „Florida“, „Germany“ und „United States“. Die Top 300 habe ich hier mal in einer Tag-Wolke visualisiert.
Tag-Wolke zur Freitext-Angabe der Location
Tag-Wolke zur Freitext-Angabe der Location

So, nun werde ich den Brustkorb des untersuchten Patienten wieder zunähen. Wer begründetes Interesse an den Daten hat, darf sich gerne mit eben jenem Grund bei mir melden und gerne eigene Untersuchungen mit der erstellten Datenbank anstellen. Bei den Namen kann es allerdings vorkommen, dass aufgrund der UTF-8-Konvertierung die Sonderzeichen fehlen oder durch „?“ ersetzt wurden, gleiches gilt für die Angabe zur Location. Die von mir getätigten Stichproben waren, bis auf die Tatsache dass die Daten aufgrund des langen Zeitraums der Erhebung etwas verwaschen waren, alle plausibel und stimmig. Eine kleine Unstimmigkeit gibt es in der Auswertung bei der Verteilung der Nutzungsdauer – irgendwie fehlen mir hier 202 Accounts und ich konnte diese auf die Schnelle nicht finden – es ist in diesem Fall aber lediglich ein User-Problem bei der Abfrage der Datenbank #WhatTheMySQL.
Mein Dank geht an den Spender der Daten, ohne ihn würde es diese Auswertung und den Blick in die Accountdaten von geocaching.com nicht geben.
Vielen Dank. ;)

Tags » «

Autor:
Datum: Montag, 26. Juni 2017 8:32
Trackback: Trackback-URL Themengebiet: Allgemein

Feed zum Beitrag: RSS 2.0 Kommentare und Pings geschlossen.

6 Kommentare

  1. 6

    […] Zahlen muss man allerdings auch in Relation zu den Zahlen der Geocacher sehen und mit der steigenden Zahl der Dosensucher gibt es auch mehr Geocacher, die das CITO-Icon […]

  2. 5

    @odominiko: Ich arbeite in einer kleinen Firma mit vergleichbarer Anzahl Mitarbeiter und weniger Umsatz… Und obwohl wir noch hohe Ausgaben aufgrund von Materialeinkäufen haben, können wir hier im Süden, wo man für eine 100qm Wohnung schnell mal 800-1000 Euro Miete kalt bezahlt, alle gut davon leben. Für eine Firma, die zuerst einmal nichts Materielles verkauft, ist so ein Umsatz recht ordentlich. Keine Frage, die Programmierer sind teuer (vermutlich zu teuer, im Hinblick auf deren Leistung kann man sicher auch das Adverb auch noch streichen) in Seattle und die Miete dürfte nicht billig sein. Am Ende wird aber immer noch ein nettes Sümmchen hängen bleiben… Wieviel genau? Keine Ahnung, denn das werden wir wohl nie erfahren.

  3. #theRealRockefellerNo Gravatar
    Montag, 26. Juni 2017 17:09
    4

    Vielen Dank für diese Zusammenstellung! Diese Daten hatten mich schon immer mal interessiert! Stimme allerdings odominiko zu, dass das ein äußerst mickriger Umsatz ist. Selbst wenn das der Gewinn wäre, wäre ich noch absolut unbeeindruckt. Für ein weltweites, derart bekanntes Spiel? Das erklärt für mich komplett die legendär schlechte Umsetzung dringend notwendiger Änderungen am Code. Die haben einfach kein Geld für nen richtigen Programmierer. Die Souvenir-Zeichner sind ja wahrscheinlich wie die Reviewer alles unbezahlte Freiwillige. Man kann nur hoffen, dass die Trackables deutlich mehr abwerfen…

  4. 3

    „Bleiben 10 Millionen Dollar Umsatz im Jahr, zuzüglich der Einnahmen durch Trackables – Das nenne ich mal Geocashing, Respekt!“

    Nun rechne mal die betriebliche Kosten (Gehälter der Mitarbeiter, Miete, Strom, Reisen, Computer, Server-Betrieb usw) dagegen.
    Bleibt da noch soviel hängen?

  5. 2

    @ksued: Hab ich mir nicht genau angeschaut. Werde ich heute Abend mal analysieren, vielleicht fällt mir noch was auf.

  6. 1

    Spannende Zahlen. Gibt es denn einen Erklärungsansatz für die beiden Peaks am 27.3. und 10.7.2016 bei den Registrierungen? Waren das auch Bots wie im Januar 2016? Oder gab es an den Tagen (misslungene) Wartungen an der Datenbank?Erfolgreiche Werbemaßnahmen würden doch wohl eher ein kontinuierliches Ansteigen verursachen, aber nicht solche Ausschläge.