URL-Analyse

Web-Adressen durchschauen

Der C64 legte in den 80er Jahren wohl den Grundstein für meine spätere Karriere als IT-Redakteur. Wie bei so vielen Anwendern dieser Zeit kamen danach Amiga und schließlich der erste Intel-PC ins Haus. Dabei faszinierte mich immer wieder aufs neue der Fortschritt der Technologie. Spannend zu beobachten war die Entwicklung des Internets, das in meinen Studienzeiten noch aus der Startseite von Yahoo und Netscape bestand. Auch an Internet-Tarife mit Minutenabrechnung kann ich mich noch erinnern. Und bald war klar, dass ich für ein Online-Angebot arbeiten möchte - es wurde die PC-WELT. Neben der Evolution des Internets von einem Nerd-Spielzeug hin zum allgegenwärtigen Medium waren und sind vor allem alle Entwicklungen im Bereich Home Entertainment, Gadgets, Konsolen und mehr zu einem Steckenpferd geworden, über das ich immer wieder gerne schreibe. Es ist faszinierend, wie Themen wie beispielsweise das Musik-Streaming von kleinen Start-up-Buden über die Jahre hinweg zu Multimillionen-Dollar-Unternehmen wurden und mehr und mehr zum Mainstream werden. Ich finde es nach wie vor spannend, wie sich die Welt der IT und der Unterhaltungselektronik entwickelt und freue mich schon auf die kommenden Jahre. Mein aktuelles Aufgabengebiet als Vice President Portalmanagement und Analytics umfasst die komplette Steuerung des Content- und Portal- Managements für alle Websites von IDG Deutschland (pcwelt.de, macwelt.de, computerwoche.de, cio.de und channelpartner.de). Mein Team und ich kümmern uns um die Optimierung und Ausspielung der Online-Inhalte, die Steuerung der Homepages und Newsletter, die Weiterentwicklung der Web-Seiten, SEO sowie  Content- und Traffic-Analysen.
Die Adresse einer Web-Seite, die URL, kann ganz kurz und einfach sein – etwa www.pcwelt.de. Es gibt aber auch komplexe Monster aus mehr als hundert Zeichen. Was zunächst häufig wie ein ungeordneter Wust wirkt, folgt einer klaren Struktur. Diese ist leichter zu durchschauen, als es aussieht. Und wer Bescheid weiß, surft sicherer. Wir erklären es Ihnen.

Anforderung:

Fortgeschrittener

Zeitaufwand:

Mittel

Lösung:

Wenn Sie eine URL selbst entschlüsseln können, nehmen Sie damit Phishing-Angreifern die Waffe aus der Hand: Zwar sind aktuelle Browser mit wirksamer Anti-Phishing- Technik ausgestattet, Sie leben aber noch sicherer, wenn Sie eine verdächtige URL bereits auf den ersten Blick erkennen. Außerdem kann es passieren, dass Sie doch mit einer älteren Browser-Version arbeiten müssen – etwa bei einem Bekannten oder in einem Internet-Café im Ausland. URLs können bis zu acht Bestandteile haben, mindestens jedoch drei – das Protokoll, die Domain und den Pfad.

Protokolle: Das Protokoll steht immer ganz vorn, etwa „http“, „https“ oder „ftp“, und ist durch einen Doppelpunkt und zwei Slashes („/“) vom Rest der URL abgetrennt. In gedruckten Texten wird es gern weggelassen, da es so kürzer ist und Sie in den meisten Fällen die URL ohne Protokoll-Angabe in die Adresszeile Ihres Browsers eintragen können. Er ergänzt dann selbständig „http://“.

Domains: Nach dem Protokoll folgt bis zum nächsten Slash („/“) oder dem Ende der URL die Domain. Sie bezeichnet den Server, dessen Angebot Sie abrufen, entweder als Name oder als IP-Adresse. Hier lauert eine Phishing-Falle: Vor der Domain können noch ein Benutzername und eventuell das dazugehörige Passwort stehen, gefolgt von einem „@“. Diese Schreibweise sollte es ursprünglich möglich machen, die Anmeldung bei einer Web-Seite gleich ins Lesezeichen aufzunehmen oder das Eintippen der Adresse zu erledigen. Allerdings wird diese Funktion für eine Phishing-Methode missbraucht. Hier werden unnötige Anmeldedaten in Täuschungs-URLs untergebracht. Eine solche lautet dann etwa „http:// www.ihre-bank.de@phishersite.com“. Das „@“ ist leicht zu übersehen oder rutscht gar aus dem sichtbaren Bereich der Eingabezeile heraus – der flüchtige Betrachter wird annehmen, dass er sich auf „www.ihre-bank.de“ befindet. Inzwischen haben die Browser nachgerüstet: Der Internet Explorer verbindet gar nicht mehr zu Adressen, die ein @ enthalten, Firefox nur nach einer Warnmeldung. Wenn Sie ganz sicher sein wollen, sollten Sie sich merken: Alles vor dem „@“ gehört nicht zum Namen der Domain, sondern kann ein Versuch sein, Sie irrezuführen!

Ports: Folgt auf die Domain ein Doppelpunkt, verwendet der Web-Server einen anderen als die Standard-Ports 80 für HTTP und 443 für HTTPS. Der Port ist dann nach dem Doppelpunkt als Zahl angegeben. Eine solche Angabe bedeutet kein Sicherheitsproblem.

Pfade: Nun kommt der Pfad zu der auf dem Server befindlichen Datei, die Sie abrufen wollen – etwa „/news/index.html“. DabeiHist es erlaubt, als Pfad nur ein Verzeichnis ohne Datei anzugeben, etwa „/news“. Webserver sind so konfiguriert, dass sie in diesem Fall das Dokument liefern, das für dieses Verzeichnis voreingestellt ist, etwa „index.html“ – sprich: die Startseite. Fehlt es auf dem Server, sehen Sie eine Auflistung der Dokumente in diesem Verzeichnis oder die Fehlermeldung „Forbidden“ – letztere in dem Fall, dass der Server die Auflistung von Verzeichnissen verbietet. Ähnlich wie es beim Protokoll der Fall ist, können Sie den Pfad beim Eintippen oder in den Lesezeichen weglassen – der Browser ergänzt in diesem Fall selbständig einen Slash („/“).

Abfragen: Oft handelt es sich bei den aufgerufenen Dateien nicht um statische Dokumente, sondern um solche, denen Sie Parameter übergeben können, etwa bei einer Web-Suche. Diese Abfrageparameter sind durch ein Fragezeichen („?“) vom Dokumentnamen getrennt. Bei Google etwa heißt das Suchdokument „/search“ und verarbeitet als Parameter unter anderem „q=“, gefolgt vom Suchwort. Sie brauchen also nicht über das Eingabefeld zu gehen, sondern können eine Google- Suche auch direkt durch eine Ergänzung der URL in der Adresszeile starten. Nach der PC-WELT etwa suchen Sie so:

http://google.de/search?q=pc-welt

Sie erhalten sofort die Ergebnisseite der Suchmaschine.

Anker: Anstelle eines Fragezeichens kann auch ein „#“ hinter dem Dokument stehen. Damit wird ein Anker, eine Sprungmarke innerhalb eines Dokuments, angesprochen. Sie landen dann nicht am Anfang einer Web-Seite, sondern direkt an einer bestimmten Stelle. (PC-Welt/ wl)

Zur Startseite