Skip to content

Übung zur Rails-Vorlesung an der HTWdS: Analysieren
Sie
die
gegebene
Log‐Datei
und
untersuchen
Sie,
wann
der
Google‐ Bot
die
Webseite
besucht
hat.


Notifications You must be signed in to change notification settings

railsvorlesung/rails_lecture_seo_bot

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

Übung zur Ruby on Rails Vorlesung der HTWdS – Julian Fischer

Schwerpunkt der Übung: Ruby Grundlagen

Fehlerbehandlung, Reguläre Ausdrücke, Datei- und HTTP-Zugriffe

Vorbereitung der Übung

Erzeugen Sie einige Klassen und Module nach eigenem Belieben. Testen Sie die Mix-In-Funktionalität.

Schauen Sie sich folgende Klassen in der Ruby Dokumentation (http://ruby-doc.org/core/) genau an. Sie werden diese für die folgende Übung benötigen:

• Array
• File
• Hash
• Net::HTTP
• Regexp
• String
URI

Eigentliche Übung

Hintergrund

Im Kontext der Suchmaschinenoptimierung (SEO) ist es wichtig den Suchmaschinen zu zeigen, dass ein Webprojekt stetig wächst. Die Suchmaschine kann zur Beurteilung des Wachstums natürlich nur die Informationen zu Rate ziehen, die ihr vorliegen. So wird ist es für diese Beurteilung entscheidend, wie sich das Webprojekt seit dem letzten Besuch des Such-Robots verändert hat. Von möglichen Aktualisierungen in der Zwischenzeit bekommt die Suchmaschine demnach nichts mit.
Um vorhandene Inhalte also möglichst SEO-effizient zu platzieren, ist es notwendig zu wissen, wann der bzw. die Such-Robots das Web-Projekt besucht haben. So kann nach jedem Besuch neuer Inhalt freigeschaltet bzw. hinzugefügt werden.

Ihre Aufgabe

Analysieren Sie die gegebene Log-Datei und untersuchen Sie, wann der Google-Bot die Webseite besucht hat.

Die Log-Datei finden Sie im “log”-Ordner dieses Projekts.

Um erkennen zu können, wann eine Anfrage von Google vorliegt, liest Ihr Programm eine Textdatei von der unten aufgeführten URL und vergleicht diese mit den Einträgen der Log-Datei.

Vergleichskriterien sind Name des User Agents (Browserbezeichnung) sowie die IP-Adresse des Aufrufenden (Referrer).

Stimmt entweder die IP-Adresse oder die Browserkennung mit einem der geladenen Werte überein, so geben Sie die betreffende Log-Zeie aus, indem Sie eine dafür vorgesehene Methode aufrufen. So ist es später möglich die Methode mit zusätzlicher Funktionalität zu versehen. Denkbar wäre das Versenden einer E-Mail bzw. das automatische Freischalten von Inhalt.
Die Blog-Software „Wordpress“ kann beispielsweise neue Einträge einfügen, die sie von einer vorher angegebenen E-Mail-Adresse abruft.

Bemerkung: Die IP-Adresse ist sicherlich die zuverlässigere Information, da die Browserkennung leicht gefälscht werden kann.

Verwenden Sie reguläre Ausdrücke um die Zeilen der Log-Datei zu zerlegen!

Liste der Suchmaschinen URLs sowie User Agent Bezeichnungen:

http://www.iplists.com/nw/google.txt

About

Übung zur Rails-Vorlesung an der HTWdS: Analysieren
Sie
die
gegebene
Log‐Datei
und
untersuchen
Sie,
wann
der
Google‐ Bot
die
Webseite
besucht
hat.


Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published