Urheberrecht

Das lange Scheitern von digitaler Kundenübervorteilung

Es gibt mehr als einen Grund, warum die Kopierschutzmaßnahmen, die unter der Abkürzung DRM (Digital Rights Management) zusammengefasst werden, weitgehend erfolglos waren. Warum DRM nicht funktioniert, kann man Verbrauchern am besten in Worten erklären, die er versteht: „Was passiert mit der Musik, für die Du Geld bezahlt hast, wenn das Unternehmen seine Meinung ändert?“. Früher war das eine hypothetische Frage, heute ist es eine historische. Die Firma Rhapsody, ein großer US-Online-Musikdienst, musste gerade erst einen weiteren seiner mit DRM belasteten Dienste einstellen. In dieser Woche teilte Rhapsody seinen Nutzern mit, dass sie Musik im Rhapsody-eigenen Dateiformat RAX bis zum 7. November in anderes Format konviertieren müssten, ansonsten würden sie sie beim nächsten Aufrüsten ihrer Computer verlieren.

Web Scraping auf die einfache Art

Als Webentwickler stand ich schon oft vor dem Problem, dass ich gerne Informationen auf meiner Website anzeigen würde, diese Informationen auch existieren, nur leider nicht auf meinem Webserver. Das kann zum Beispiel das Kinoprogramm meiner Stadt sein. Dafür gibt es verschiedene Websites, die das Programm darstellen und die ihre Daten wiederum vermutlich von den Kinos geschickt bekommen, bloß ich komm nicht dran.

Natürlich könnte man ein Script schreiben, das mit Regulären Ausdrücken und etwas Programmierung die Daten extrahiert. Diese Herangehensweise ist aber mühsam, insbesondere wenn sich der Aufbau der Seiten ändert. Beim Versuch, ein solches Kinoprogramm zu scrapen stellte ich z.B. fest, dass das HTML offenbar nicht von einem System generiert, sondern manuell per copy&paste aktualisiert wurde, natürlich mit entsprechenden Fehlern. Diese führten dazu, dass die Regulären Ausdrücke nicht mehr trafen und keine Daten mehr extrahiert werden konnten.

Inhalt abgleichen