Projekt, ein Crawler zu schreiben, das zu einer gegebenen BeckOK-Titelseite das gesamte Buch in eine PDF speichert.
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
Wurzelkoch e55cacd224 Ich glaub ich krieg die Authentifizierung nicht hin 12 months ago
README.md README updated 12 months ago
crawler.js Ich glaub ich krieg die Authentifizierung nicht hin 12 months ago
package.json update metadata 12 months ago

README.md

BeckOK

Der Beck'sche OnlineKommentar ist nur mit Account nutzbar und zeigt den Kommentar nur Paragraphen- oder gar randnummerweise an. Das wollen wir ändern: BeckOK soll einmal aus dem Link zur Titelseite eines Gesetzbuchs ein PDF mit dem gesamten Buch machen.

Systemvorraussetzungen

node.js und npm.

Run with node crawler.js <START_URL>. Wird START_URL nicht angegeben, wird die Titelseite des Grundgesetzes verwendet.

Stand

Das Skript blättert alle aufeinanderfolgend frei zugänglichen Seiten ab der angegebenen durch, ohne sie abzuspeichern.

Todos

  • Abspeichern, obviously
  • evtl. Authentifizierung?