Warum spidern verboten ist und es keine API gibt (IMHO)

Viele Geocacher kennen das Problem, wie komme ich möglichst schnell und möglichst effektiv an möglichst viele Informationen von Caches um meine Datenbank (z.B. GSAK, Cachewolf, etc) zu füttern? Hier fällt ganz schnell der Begriff spidern. Ein Spider selbst ist nichts anderes als ein Programm, dass gezielt Internetseiten aufruft und die darin enthaltenen Informationen speichert (Weitere Informationen auf Wikipedia Webcrawler). Im Bezug auf Geocachingseiten bedeutet das so viel wie: Cachseite aufrufen, Name speichern, Koorinate speichern, Beschreibung speichern, Hint speichern, Seite schließen.

Wenn man dies von Hand machen würde, würde man vielleicht 2-3  Seiten in der Minute schaffen und es wäre nahezu unmöglich seinen Datenbankbestand von mehrere hunderten und tausenden Caches aktuell zu halten. Der Traffic (die Zugriffe auf die Server von Groundspeak) hält sich jedoch sehr in Grenzen. Ein Spider hingegen macht dies in wenigen Sekunden und kann die eigene Datenbank in wenigen Minuten auf den aktuellen Stand bringen. Problem jedoch, statt 2-3 Zugriffe in der Minute, können es auch schon mal mehrere hundert Zugriffe in der Minute sein, die den Traffic von Groundspeak nach oben schrauben. Dies sorgt für eine höhere Auslastung der Server und kann so sogar zu Ausfällen führen (dies ist im übrigen auch eine beliebte Methode bei “Hackern” um einen Server abzuschießen, siehe DDoS). Somit ist es also selbstverständlich, dass Groundspeak das crawlen/spidern der Webseite verbietet um eine gewisse Erreichbarkeit der Server gewährleisten zu können.

Aufgrund dessen, dass spidern sehr ineffektiv ist (es wird die komplette Internsetseite aufgerufen, obwohl nur Name, Koordinate und Beschreibung benötigt werden) und zudem von Groundspeak verboten ist und bestraft wird (Sperrung des Accounts), gibt es in der Community immer wieder Rufe nach einer API Schnittstelle. Mit dieser könnte man quasi direkt in die Datenbank von Groundspeak greifen und exakt nur die Informationen holen die man braucht. Man würde so schneller und effektiver an seine Daten kommen und es würde die Server von Groundspeak entlasten, somit also eine win-win Situation.

Aber wenn beide Seiten davon profitieren, warum stellt Groundspeak dann eine solche API nicht zur Verfügung?

Ganz einfach! Während wir Geocacher den Sport Geocaching als Freizeit ansehen, ist Geocaching für Groundspeak knallhartes Business! Groundspeak betreibt seine Server und Datenbank nicht aus Nächstenliebe oder um der Geocaching-Community etwas zurück zu geben, Groundspeak ist ein wirtschaftliches Unternehmen und somit gewinnorientiert! Es ist auch ziemlich unumstritten, dass Groundspeak der Marktführer der Onlineplattformen im Geocaching ist. Und woran liegt das? Groundspeak hat die größte und am besten gepflegte Datenbank mit Geocaches (ich sage nicht, dass alle Caches perfekt gepflegt und aktuell gehalten sind, aber es sind einfach nen Ticken mehr als bei anderen Plattformen). Diese Datenbank ist das Kapital von Groundspeak, denn darauf basiert das wirtschaftliche Konzept.

Konkurrenz belebt das Geschäft, wenn man also selbst Marktführer ist (und dies auch bleiben will) versucht man also aufkeimende Konkurrenz erst gar nicht entstehen zu lassen. Durch eine API Schnittstelle zur eigenen Datenbank würde man jedoch genau dies tun, das eigene Kapital jeden anderen zur Verfügung stellen. Das, woran Groundspeak seit Jahren arbeitet und pflegt, würden sie jedem Dahergelaufenen kostenlos zur Verfügung stellen. Dieser bräuchte nur eine neue Website über diese Daten stülpen und hätte sein eigenes Geocaching-Portal mit dem er versuchen könnte Geld zu verdienen und in direkte Konkurrenz zu Groundspeak tritt.

Unter diesen Gesichtspunkten, dass das Konzept Groundspeak auf ihrer Datenbank beruht, wird es wohl niemals eine Schnittstelle dazu geben und auch das crawlen zum replizieren dieser Daten wird weiterhin verboten bleiben und hart bestraft. Ansonsten würde es etwa dem gleichkommen, dass Coca Cola sein Rezept öffentlich im Internet kund tut und sich dann wundert nicht mehr Marktführer zu sein.

(IMHO = In My Honest Opinon; Meiner bescheidenen Meinung nach)

Welche Geo Cache Arten gibt es?

Ein Geocache ist nicht immer nur eine Dose die irgendwo im Wald verbuddelt ist. Es gibt eine Vielzahl an Geocache Arten die sich nicht nur in Form, Art, Versteck und Art des Loggens unterscheiden. Hier mal eine kleine Übersicht was so die gängigsten Formen und Arten sind die man draußen finden kann.


Alles lesen >>

Muggels? Was ist ein Muggel?

Muggel sind kleine grüne Kobolde mit rosa Fahrrädern und langen Bändel am Lenker. Ihre Ohren sind doppelt so groß wie ihr Kopf und nehmen die kleinste Veränderung in ihrer Umgebung wahr. Ihre Haut ist grün-gelblich und von einem giftigen Schleim überzogen, welcher bei kontakt zu starkem Juckreiz führen kann.Sie wohnen unter Brücken oder in Wäldern und erschrecken kleine Geocacher beim Suchen nach Geocaches.

Die kleinen Biester sind in der Regel nicht größer als 50 cm, gehören jedoch zu den größten Feinden des Geocachers! Viele mussten die Begegnung mit dem Leben bezahlen.

Alles lesen >>

Was ist ein “Nano Cache”?

Nano Cache mit LogbuchDies hat sich bestimmt jeder Geocacher im Laufe seiner Geocache-Karriere einmal gefragt! Doch was ist das nun genau? Ein Nano Cache ist ein Cache wie jeder andere auch, jedoch gibt es für ihn in den Geocache-Datenbanken keine offizielle Einstufung.

Ich hatte bisher schon zweimal das Glück bei meiner Geoccache-Tour auf einen Nano Cache zu stoßen und ich kann sagen die Dinger sind jenseits von Gut und Böse!

Alles lesen >>

Geocaching GPS-Gerät – Was braucht man alles?

Das GPS-Gerät gehört zur Grundausstattung beim Geocachen! Bei einfachen Traditional-Caches zeigt es einem an in welche Richtung der Cache liegt und bei Multi-Caches hilft es einem zusätzlich noch beim peilen der Luftrichtungen. Doch wer braucht welches GPS-Gerät? Hier ein kleiner Überblick was es so auf dem GPS Markt gibt.

Der Markt wird derzeit überhäuft von GPS Navigationssystemen für das Auto, wo hingegen sich die Hersteller für Outdoor GPS-Geräte an zwei Fingern abzählen lassen! Magellan und Garmin!

Alles lesen >>

Geocaching ohne GPS-Gerät? So geht es!

Ist das nicht ein Widerspruch in sich? Denn Geocaching bedeutet ja Schatzsuche mit Hilfe des GPS-Gerätes, schließlich sind alle Angaben ja in Himmelskoordinaten definiert. Aber nein es ist kein Widerspruch, denn Geocaching geht ganz klar auch ohne GPS Gerät!

Man mag es kaum glaub, so subtil es auch klingen mag, das Geocachin-Blog.de Team besitzt KEIN GPS-Gerät! Und wie man unten an den Countern sieht haben wir bereits die 70er Grenze erreicht! aber wie geht das? Hier ein paar Tipps und Tricks wie man auch ohne GPS-Gerät eine erfolgreiche Geocache Suche erleben kann.

Alles lesen >>

Freeware Geocache Plugin für Google Earth – Geocaches in Google Earth und Google Maps finden

Geocaching Google Earth Plugin Vorschau Beispiel BildUm sich einen besseren Überblick zu verschaffen wo es in der Umgebung Verstecke gibt, kann man sich Geocaches über ein Freeware Google Earth Plugin in der aktuellen Google Earth Version anzeigen lassen. Es zeigt die Position an, die Art des Caches (Traditional, Multi, … etc), die Größe des Caches (Micro(1), Small (2), … etc) und den generellen Schwierigkeitsgrad (1-5).

Alles lesen >>

Wie loggt man einen Webcam-Cache?

Einige Neulinge unter den Cachern haben sicherlich in ihrer Nähe einen Wabcam-Cache und wissen nicht wie sie diesen loggen können. Daher hier ein kleiner Überblick welche Möglichkeiten es gibt.

Alles lesen >>

Was ist Geocaching?

Geocaching.com LogoDiese Frage bekomme ich jedesmal gestellt wenn ich von meinem Hobby erzähle! Gerade mal eine Handvoll Menschen scheint mit dem Begriff “Geocaching” etwas anfangen zu können, da heißt es dann jedesmal wieder Aufklärungsarbeit zu leisten und vielleicht noch mehr Liebhaber anzuwerben.

Um auch im Internet ein wenig Aufklärungsarbeit zu leisten werden ich hier einmal die wichtigsten Fragen beantworten.
Alles lesen >>