Homepagebau
Dateiversion:
diesen Beitrag diskutieren,
ergänzen, eine Frage stellen

Dateinamen in URLs und Escapesequenzen

Schwierigkeitsgrad:

 

Beschreibung:

Dieses Tutorial soll sie mit der Theorie vertraut machen. Keine Angst - natürlich alles anhand praktischer Beispiele Sollte es Hinweise oder Ergänzungen geben, die unbedingt hier hin gehören, schreiben sie mir eine Mail.


Dateinamen unter Windows und Unix

Seitdem Windows die alten, angestaubten DOS Konventionen aufgehoben hat, was Dateinamen angeht geht es bunt zu auf deutschen Desktops. Windows unterscheidet Sonderzeichen und sogar Groß- und Kleinschreibung. ABER nur intern. Denn 2 Dateien mit gleichem Dateinamen darf es nicht geben und somit ist die Schreibweise zwar gespeichert, dem System an sich darüber hinaus aber völlig egal. Anders in Unix und Linux. Hier sind zum Beispiel "readme.txt" und "ReadMe.txt" zwei verschiedene Dateien, die sogar im gleichen Verzeichnis stehen dürfen.
Bei Sonderzeichen streikt Unix dagegen. So sind zum Beispiel Leerzeichen nichts, was Unix dem User gestattet auch wenn Windows da gern "ein Auge zu drückt".

Fazit: Beachten sie bitte bei Dateien für's Netz die Unix-Konventionen: verzichten sie auf Sonderzeichen oder Leerzeichen in den Dateinamen und beachten sie die Groß- und Kleinschreibung. Sonst gibt es ein böses Erwachen, wenn der Server auf dem sie veröffentlichen nicht zufällig ein Windows NT - sondern ein Unix- oder Linux-Server sein sollte.

Aufbau von URLs

URLs haben eine streng festgelegte Syntax.

Sie beginnen immer mit dem Namen des Übertragungsprotokolls, gefolgt von einem Punkt und zwei Schrägstrichen:
z.Bsp. file:// für lokale Dateien, http:// (HyperText transfer protocoll) für Daten im Netz oder ftp:// (file transfer protocoll) für Dateitransferverbindungen zu Servern.

Danach kommt die Zieladresse. Entweder bereits aufgelöst oder als Synonym. Das heißt, auch 123.45.67.89 wäre theoretisch eine gültige Adresse. Tatsächlich läuft jede Text-URL, wie "www.all-community.de" erst automatisch über einen so genannten DNS-Server, der daraus wie eine Auskunftsdame im Telefoncenter die echte Adresse (eine Nummer, wie die eben) ermittelt. Erst dann wird die Seite aufgerufen.

Die Zieladresse unterteilt sich noch einmal in "Hostname", "Port" und "Pfad".

Der Hostname ist der Name des Zielservers. Zum Beispiel "www.provider.com".

Anschließend an das Ziel kann eine Portnummer angegeben werden, über welche die Verbindung zum Server hergestellt werden soll.
z.Bsp: ":80" für Port 80 (Standard) oder ":1234" für Port 1234.
(wenn sie mehr über Ports, Protokolle und DNS wissen wollen verweise ich sie hiermit an die Literatur - dies alles zu erläutern würde den Rahmen dieses Tutorials sprengen).

Der Pfad ist der relative Zielpfad der Datei, also zum Beispiel "katalog/artikel1.html".

Danach kann eine Liste übergebener Parameter folgen. Diese Liste wird mit "?" eingeleitet.
z. Bsp.: "?warenkorb=1&gewaehlteKategorie=12&spieleHintergrundmusik=true"

Zuletzt kann noch ein Textanker stehen. Dieser gibt an, an welche Stelle des aufgerufenen Dokuments gesprungen werden soll. Ein Textanker wird mit "#" eingeleitet, gefolgt vom Namen des Ankers.
z. Bsp.: "#Artikelnummer1234"
Kleiner Hinweis am Rande: Textanker müssen im explizit im HTML-Dokument angelegt werden, damit ein Sprung zu dieser Stelle möglich ist. Der zu unserem Beispiel passende Textanker wäre also: <a name="Artikelnummer1234"></a>

Ein Beispiel:
http://www.irgendeine-adresse.com:1234/verzeichnis/datei.html?parameter1&paremeter2#Texstelle

Protokoll http://
Hostname www.irgendeine-adresse.com
Port 1234
Pfad verzeichnis/datei.html
übergebene Parameter parameter1&paremeter2
Textanker Textstelle

Hinweis: nicht alle diese Angaben müssen immer in einer URL enthalten sein.

Escapesequenzen

Weil Sonderzeichen in URLs nicht vorkommen dürfen, werden sie (allerdings nicht von allen Browsern automatisch) in so genannte "Escapesequenzen" umgewandelt. Das ist eine Kodierung, die jedem Sonderzeichen eine bestimmte Hexadezimalzahl zuordnet. So wird aus dem Leerzeichen zum Beispiel die "20". Escapesequenzen werden mit "%" eingeleitet. Alle Sonderzeichen in Dateinamen müssen für URLs später in dieser Form eingegeben werden. Jetzt wird sicherlich deutlich, warum Dateinamen im Netz keine Sonderzeichen enthalten sollten. *gg*

Testfeld:

Geben sie einen beliebigen Text ein um sich die zugehörige Escapesequenz berechnen zu lassen.

Eingabe
kodierter Text

Genug für den Anfang: bei konkreten Fragen erreichen sie mich per Mail unter der unten stehenden Adresse, oder posten sie ihre Frage direkt in unserem SOS-Forum unter "Forum.All-Community.de"