Vom Internet zum WWW (WorldWideWeb)

Der Physiker Tim Berners-Lee, der am europäischen Kernforschungszentrum CERN - Conseil EuropÈen pour la Recherche NuclÈaire - in Genf arbeitete, wollte es den Wissenschaftlern des CERN ermöglichen, die Ergebnisse ihrer Arbeit miteinander auszutauschen, unabhängig vom jeweils verwendeten Computersystem und losgelöst von vielen verschiedenen Programmen. An und für sich war das schon möglich, man konnte sich sehr wohl Dateien von anderen Servern via Internet auf seinen eigenen Computer herunterladen. Berners-Lee schwebte jedoch ein WWW vor, welches es ermöglichen sollte, dass alle diese Dokumente in der gleichen Programmiersprache geschrieben, einheitlich formatiert wären, so dass sie durch ein entsprechendes Programm, einen sogenannten Browser, dargestellt werden könnten. So wäre es egal, ob der eine Forscher beispielsweise Word benutzen würde und Dateien eines anderen Textverarbeitungsprogramms nicht öffnen könnte oder ihm durch das Öffnen mit einem anderen Programm Formatierungen verloren gehen würden. Somit waren das WWW und die HTML-Sprache geboren (Hypertext Markup Language), der Code, der eben die einheitliche Formatierung von Text ermöglichte und durch diese Standardisierung von den Browsern gelesen werden konnte, wie bereits erwähnt unabhängig von verschiedenen Computersystemen.
Schon vor der Geburt des WWW und HTML existierten Hypertextsysteme. 1987 erschien etwa Hypercard, das erste durchsetzungsfähige System, auch davor gab es schon mehrere Hypertextsysteme, auf die ich nicht eingehe.
1990 war der erste textorientierte Browser fertiggestellt, er war eben von Berners-Lee am CERN in Genf entwickelt worden. Gleichenjahrs wurde er auch der Öffentlichkeit vorgestellt. Ebenfalls hatte er HTML entwickelt, wobei die Entwicklung dieses ersten Browsers und von HTML untrennbar miteinander verbunden sind, da ja dieser Browser HTML interpretieren können musste, um den Inhalt einer HTML-Datei darstellen zu können.

Nun war HTML erst der vereinheitlichende Standard, der die problemlose und mehr oder weniger plattformunabhängige Formatierung von Text ermöglichte. Damit diese HTML-Dateien via Internet innerhalb des Dienstes WWW übertragen werden konnten und vor allem auch online angeschaut, brauchte es ein Protokoll, das die Übertragung der Dateien regelt. Dieses Protokoll ist das HTTP (Hypertext Transfer Protocol). Ebensolche Übertragungsprotokolle, die zusätzlich zu dem TCP/IP notwendig sind, gibt es auch für die anderen Internetdienste: FTP beispielsweise ist gerade selbst dieses Protokoll, bei EMAIL sind es Protokolle wie SMTP zum Verschicken der Mails oder POP und IMAP für das Empfangen von Mails.
Mit dem Protokollnamen beginnen alle Internetadressen, eine FTP-Adresse beginnt immer mit ftp://, eine WWW-Adresse grundsätzlich mit http:// (möglich auch https://). Das www, welches meist in einer WWW-Adresse erscheint, ist an und für sich unnötig, es zeigt nicht an, dass es sich bei dieser Adresse um eine Datei handelt, auf die über den Dienst WWW zugegriffen werden kann, was einzig und allein zählt, ist die Angabe des Protokolls, also HTTP.

Vielleicht die wichtigste Voraussetzung für die ab etwa 1993 einsetzende explosionsartige Ausweitung des WWW war die Freigabe der WWW-Technologie durch das CERN im April 1993: Jedermann konnte die Technologie benutzen, ohne irgendwelche Patentrechte erwerben oder Copyrightgebühren entrichten zu müssen. Das WWW war so vollständig der Öffentlichkeit zugänglich gemacht worden, der Boom des Web war nicht mehr zu bremsen: Während 1993 weltweit 50 HTTP-Server existierten, waren es Ende 1994 schon 100'000. Und 1995 war WWW der führende Dienst innerhalb des Internets: Der Umfang des Datentransfers des WWW hatte denjenigen von FTP überflügelt.

 Browser, Netscape und Microsoft

Was aber noch fehlte, war eine Möglichkeit, das WWW auf einfach Weise zu erforschen, die Benützung jedermann zu ermöglichen. Dieser erste Browser, der am CERN entwickelt wurde, hatte nicht viel Ähnlichkeit mit heutigen Browsern, wie gesagt, er war rein textorientiert, konnte ausschliesslich Text darstellen. Auch HTML war noch keinesfalls vergleichbar mit den heutigen damit verbundenen Möglichkeiten. Der wichtigste Unterschied: Es standen noch keine Hyperlinks zur Verfügung. Sie wurden erst ins Leben gerufen, als die amerikanischen Studenten Marc Andreesen und Eric Bina 1992 am NCSA - National Center for Supercomputing Applications der University of Illinois - den sogenannten NCSA X-Windows Mosaic-Browser entwickelten: Dieser Browser und die verwendete HTML-Sprache ermöglichten erst das eigentliche "surfen", das Anklicken von Links mithilfe der Maus (Point and Click) auf einer grafischen Oberfläche, einem GUI (Grafical User Interface).
X-Windows ist das GUI des Unix-Betriebssystems, der Mosaic-Browser war somit zuerst nur für UNIX erhältlich. Schnell folgten allerdings Versionen für Mac und PC. Aktuelle Versionen sind frei erhältlich, Mosaic kann aber beispielsweise keine Frames darstellen.
Da der gewaltige Erfolg dieses Browsers abzusehen war, gründeten Andreesen und Bina zusammen mit James H. Clark, seinerseits Gründer von Silicon Graphics, 1994 die Netscape Communications. Zunächst hiess die Firma allerdings noch Mosaic Communication Corp. 1995 dann ging Netscape mit riesigem Erfolg an die Börse.
Lange Zeit über war Netscape mit seinem Navigator mit ca. 90% Marktführer auf dem Browser-Markt, erst 1996 stiess dann Microsoft unter enormen finanziellen und personellen Anstrengungen nach mit seinem Internet Explorer: Bill Gates sah eine gute Position im Bereich Internet als zukunftsentscheidend für Microsoft an.
Im Kampf um die Marktanteile begann Netscape damit, seine Browser zu verschenken, Microsoft musste wohl oder übel nachziehen. Man findet die jeweils neuesten Versionen des Internet Explorers oder des Navigators resp. Communicators beispielsweise auf allen möglichen Heft-CDs, aber auch auf dem Internet können sie heruntergeladen werden:

Ältere Netscape Browser können zB. unter http://members.xoom.com/_XOOM/nick11/netscape/netscape.html heruntergeladen werden.

Zu einem grossen Schlag gegen Netscape holte Microsoft dann aus, als das neue Betriebssystem Windows 95 auf den Markt kam. Microsoft schloss mit den grossen Onlinediensten AOL und CompuServe eine strategische Partnerschaft: Die Onlinedienste verteilten an ihre Mitglieder kostenlos den Internet Explorer, die Gegenleistung Microsofts bestand darin, dass AOL und CompuServe in den Desktop von Windows 95 integriert wurden. Durch einfachen Mausklick konnten die Benutzer von Win95 Zugang zu den beiden Onlinediensten erhalten. Auch war in Win95 der einfache Zugang zum Microsoft Network (MSN) integriert, ebenfalls einem Onlinedienst. Daraufhin begann das amerikanische Justizministerium auf Veranlassung Netscapes, 1996 gegen Microsoft zu ermitteln:
Nütze Microsoft seine Monopolstellung auf dem Betriebssystemmarkt aus, um Browserkonkurrenten aus dem Markt zu drängen? Seither ist Microsoft Gegenstand umfangreicher Ermittlungen. Was durch diese Untersuchungen vor allem verhindert wurde, war die Verschmelzung des Internet Explorers mit Windows 98: Nutzern von Win98 ist es möglich, den Internet Explorer nicht zu verwenden, sondern standardmässig einen anderen Browser zu gebrauchen.
Heute ist der Markt in etwa gleich geteilt zwischen Microsoft und Netscape, daneben gibt es sehr wohl auch Browser anderer Firmen, die jedoch bei weitem nicht so verbreitet sind.

 
Hypertext Markup Language

Ein Problem stellt nun die HTML-Sprache dar. HTML sollte ein Standard sein, an den man sich hält, damit eben der Austausch von HTML-Dateien problemlos geschehen kann. Jemand muss also neue HTML-Standards bestimmen, neue Versionen der Sprache definieren. Dies macht W3C, das World Wide Web Consortium, welches 1994 durch Berners-Lee gegründet wurde. Das jedenfalls ist die De-Jure-Situation. De facto sieht das ein wenig anders aus, nämlich dass die grossen Browserhersteller Microsoft und Netscape sehr wohl die jeweils neuesten HTML-Versionen in ihre neuen Browser integrieren, daneben jedoch auch immer wieder eigene Erweiterungen der Sprache, die sie als sinnvoll erachten. Wird nun eine solche nicht standardisierte Neuerung von den WWW-Nutzern gebraucht, müssen andere Browser-Hersteller nachziehen und diese Erweiterungen "nachbauen" in ihren eigenen Browsern. Schliesslich werden dann solche bisher nicht standardisierten Änderungen in eine neue HTML-Version aufgenommen. Der neueste durch W3C bekanntgegebene HTML-Standard ist die Version 4.01, er wurde am 24. Dezember 1999 bekanntgegeben.
W3C bietet auch einen Dienst an, der HTML-Dokumente auf die korrekte Einhaltung der Standards hin überprüft.
Daneben beschäftigt sich W3C auch mit vielen anderen technischen Fragen, die das WWW betreffen, bisher wurden etwa 20 Standards durch das Consortium bekanntgegeben.


Die URL

Die URL - Uniform Resource Locator - ist nebst HTML und HTTP drittes wichtiges Glied des WWW, ebenso aber auch anderer Dienste auf dem Internet.
Eine URL ist grundsätzlich vergleichbar mit einer lokalen Pfadangabe auf einem PC, beispielsweise:

C:\WINDOWS\COMMAND\SCANDISK.EXE
Dieser Pfad gibt an, dass sich die Datei "scandisk.exe" auf dem lokalen Laufwerk c befindet, und zwar im letztgenannten Verzeichnis "command", welches ein Unterverzeichnis von "windows" ist.

Eine URL definiert eigentlich nichts anderes, nur bietet sie die Möglichkeit, nicht ausschliesslich auf lokale Dokumente zu verweisen, sondern eben auf Dateien, die sich irgendwo auf dem Internet befinden. Die Struktur einer URL ist genau definiert, ich gehe kurz auf die einzelnen Teile ein. Als Beispiel dient folgende WWW-Adresse:
url

Diese URL verweist auf das Vorlesungsverzeichnis der Universität Zürich für das Wintersemester 2000/2001. Nämlich auf die HTML-Datei "index.html" im Verzeichnis VVZV2 auf dem Server www.unizh.ch.
Wir beginnen diese URL von links her zu lesen: sie beginnt mit http. Demzufolge handelt es sich um ein Dokument auf dem Internet, auf welches ber des WWW zugegriffen wird, der Browser muss das Übertragungsprotokoll HTTP verwenden. Der Teil einer URL, der den Protokollnamen angibt, ist von den restlichen Teilen einer URL durch :// getrennt.
Der zweite Teil der URL gibt den Servernamen an, hier also www.unizh.ch. Dieser Teil wird von rechts nach links gelesen, beginnend mit der Top Level Domain, hier ch.

Lautet die Top Level Domain wie in diesem Fall ch, so bedeutet dies grundsätzlich nur, dass die unmittelbar links von ihr stehende Serverbezeichnung, hier also unizh, von SWITCH an die Universität Zürich vergeben wurde. ch bedeutet nicht zwingend, dass sich dieser Server auf Schweizer Hoheitsgebiet befindet, wie etwa das Beispiel www.pearsoft.ch zeigt: dieser gern besuchte Server befindet sich in Thailand.
SWITCH ist zuständig für die Vergabe und Registrierung der Second Level Domains unter den Top Level Domains ch und li (Liechtenstein).
Alles was nun links der Second Level Domain unizh steht, ist Sache der Uni Zürich, resp. im Falle eines anderen Namens des Inhabers der entsprechenden Second Level Domain. Zusätze benennen den entsprechenden Server genauer oder bestimmen mehrere Server unter derselben Second Level Domain.
In unserem Beispiel ist ein solcher Zusatz das vorangestellte www. Beispiel für einen weiteren Servernamen unter der Second Level Domain unizh ist etwa www.zi.unizh.ch. Es handelt sich um den Server des Rechenzentrums der Uni Zürich.

Während die Second Level Domains unter den Top Level Domains, welche Länderkürzel darstellen, meist von nationalen Organisationen vergeben werden, existieren daneben weitere Top Level Domains, com, net, org, edu, int und gov. Sie sind nicht national gebunden, sondern "frei" verfügbar. Second Level Domains unter diesen Top Level Domains können bei verschiedenen kommerziellen Anbietern registriert werden, darüber informiert etwa InterNic.
Als Besonderheit gibt es noch die Top Level Domain mil, die militärischen Einrichtungen der USA vorbehalten ist.

Die tatsächliche Adressierung eines Servers läuft nun nicht über eine URL in obenstehender Form, sondern über eine sogenannte IP-Address. url_ip Jeder Rechner, der Teil des Internet ist, hat eine solche IP-Adresse zugeteilt, der Server www.unizh.ch etwa hat die Nummer 130.60.68.45 (aktueller Stand Juli 2000!). Dies betrifft nicht nur Rechner, die konstant am Netzt hängen, auch wenn man sich via Telefon mit dem Internet verbindet, wird dem eigenen Rechner durch den Provider eine temporäre IP-Adresse zugeteilt. Ansonsten könnte zwischen einem Server und dem PC zuhause keine Kommunikation mithilfe von Programmen, die das TCP/IP verwenden, stattfinden. Ohne zugewiesene IP-Adresse ist man nicht Teil des Internet.
Einer solchen Nummer entspricht grundsätzlich ein oben beschriebener Domainname, dies muss aber nicht zwingend sein, wie ich unten zeigen werde. Eine URL in Buchstabenform erhöht einfach den Erinnerungswert.
Tippt man in die Location Bar des Browser nun eine URL in Buchstabenform, geht zuerst eine Anfrage an den DNS-Server des Providers, welche IP-Adresse der Buchstaben-URL entspricht. Kann der DNS die IP-Adresse nicht liefern, fragt er einen anderen DNS an. Erst wenn diese IP-Adresse bekannt ist, kann eine Verbindung mit dem gewünschten Rechner hergestellt werden. Ist einem die IP-Adresse des gewnschten Servers bekannt, so kann man in die Location Bar des Browser auch gleich diese Nummer eintippen und sich den Umweg ber den DNS sparen. Demonstriert an meinem Beispiel des Vorlesungsverzeichnisses WS 2000/2001: http://130.60.68.45/VVZV2.
Allerdings macht es keinen Sinn, sich IP-Adressen zu merken: Whrend ein Domainname unter Umstnden auf ewig gltig bleibt, kann eine IP-Adresse immer wieder wechseln, beispielsweise wenn die dem Domainnamen zugehrigen Daten auf einem anderen Server gehostet werden. Der Zugriff auf diesen neuen Server wre dann durch die alte IP-Adresse nicht mehr mglich, jedoch ist er einwandfrei garantiert durch das Sysstem der Domainnames und der Domain Name Server. Allerdings existiert keine Eins Zu Eins Übereinstimmung von IP-Adressen und Domainnames. Unter derselben IP-Adresse können (und meist ist dies auch so) mehrere Domainnames gehostet werden. Der Browser verlangt also vereinfacht gesagt nicht nur die IP-Adresse xy, sondern er przisiert die Anforderung mit dem Wunsch nach einem bestimmten Domainnamen. Als Beispiel hierfr nochmals die URL des Rechenzentrums der Uni Zrich: www.zi.unizh.ch.
Diesem Servernamen ist die IP-Adresse 130.60.68.45 zugeordnet. Und dies ist dieselbe IP-Adresse, die auch dem Server www.unizh.ch zugehörig ist. Würde man nun, anstatt die URL mit dem Domainnamen in die Location Bar einzutippen, nur die IP-Adresse angeben, würde der Browser nicht die Homepage des Rechenzentrums anzeigen, sondern diejenige der Uni Zürich. Sind nämlich einer IP-Adresse mehrere Domainnames zugeordnet, kann eine IP-Adresse alleine keine eindeutige Anfrage darstellen, sind unter derselben IP-Adresse mehrere Domainnamen gehostet, wird der Server an den Browser die Default-HTML-Datei schicken. Und im Falle der IP-Adresse 130.60.68.45 würde der Browser nicht etwa die Homepage des Rechenzentrums, sondern einleuchtenderweise die Hompage der Uni Zürich darstellen.

 

> Marketing im Internet - hier klicken