Wikipedia:Browser-FAQ

aus Freepedia, der freien Wissensdatenbank

In der Nacht zum Freitag, 30. Juli 2004, wurde die deutschsprachige Wikipedia auf UTF-8 umgestellt. Diese Seite enthält Erläuterungen zu den häufigsten Problemen, die in diesem Zusammenhang auftreten können. Für Probleme mit der Darstellung/Bearbeitung von Sonderzeichen, die hier nicht erwähnt werden, dient die Seite Wikipedia:UTF8-Probleme.

Inhaltsverzeichnis

Allgemein

Windows allgemein

Warum werden statt Sonderzeichen Rechtecke/Fragezeichen angezeigt?

Problem: Einige Sprachen können nicht dargestellt werden (z. B. Chinesisch, Arabisch). Stattdessen zeigt der Browser kleine Rechtecke oder Fragezeichen an, etwa □□ oder ?? statt 北京. Hier fehlen Schriftarten, die die entsprechende Sprache anzeigen können.

Lösung: Bei der Windows-Installation werden standardmäßig nicht alle verfügbaren Schriften (Fonts) installiert, um Speicherplatz zu sparen. Die meisten benötigten Schriften lassen sich aber nachträglich installieren. Allerdings fehlen Windows Schriften für einige Sprachen, etwa für Malayalam. Siehe z.B.: ml:Wikipedia:Welcome, newcomers.

Hilfreich ist es, die Schrift Arial Unicode MS zu installieren; diese ist etwa bei Microsoft Office 2000, Microsoft FrontPage 2000 und neueren Versionen enthalten. Der Name ist ARIALUNI.TTF, die Dateigröße 22 MB. Manchmal hilft auch eine Suchmaschine einen Zeichensatz zum Download im Web zu finden, wenn man den genauen Namen eingibt. Wer keines dieser Produkte besitzt, kann auch (teilweise kostenpflichtige) Schriftarten herunterladen:

Zwei recht komplette Unicode-Fonts sind Titus Cyberbit Basic und Code2000.

Weitere IPA-fähige Schriftarten im Web: http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm


Siehe auch: Wikipedia:Lautschrift


Hier die Anleitung, wie man in verschiedenen Versionen von Windows Schriften nachinstalliert:

  • Unter Windows 98:
  1. Am besten eine der obigen Schriftarten herunterladen und installieren, bzw. die TTF-Datei in den Ordner Fonts (in der Regel C:\Windows\Fonts) hineinkopieren.
  2. Unter "Start -> Einstellungen -> Systemsteuerung" findet man das Symbol "Software". Oben auf "Windows Setup" klicken und die "Sprachunterstützung" mit "Details..." erweitern.
  3. Office-CD einlegen und bei "Benutzerdefinierter Installation" nur die entsprechenden Schriftarten auswählen.
  4. Windows-Internetupdate starten und die Sprachunterstützungen und Schriften in der Rubrik nicht dringender Updates anwählen und installieren. (nur bei Verwendung des Internet Explorers)
  • Unter Windows 2000:
In der Systemsteuerung findet sich ein Symbol Ländereinstellungen. Im Feld Allgemein gibt es eine Liste Spracheinstellungen für das System. Hier müssen bei allen Sprachfamilien Häkchen gemacht werden, die angezeigt werden sollen.
  • Unter Windows XP:
In der Systemsteuerung findet sich ein Symbol Regions- und Spracheinstellungen. Im Feld Sprachen muss bei Dateien für ostasiatische Sprachen installieren und/oder bei Dateien für Sprachen mit komplexen Schriftzeichen und Zeichen mit Rechts-nach-Links-Schreibung installieren ein Häkchen gesetzt werden.

Was muss ich beachten, wenn ich die benötigten Zeichensätze nicht installiere?

Da von dem Darstellungsproblem ja nur exotische Sonderzeichen betroffen sind, die ich in der Regel doch nicht verstehe, habe ich mir bisher nicht die Mühe gemacht, zusätzliche Zeichen zu installieren. Mit welchen Komplikationen muss ich rechnen?

  • Beim Lesen in der Wikipedia ist nichts weiter zu beachten. Für nicht installierte Zeichen werden dann einfach die oben erwähnten Platzhalter (□, ¤ oder ?) angezeigt.
  • Beim Bearbeiten von Artikeln dürfen diese Platzhalter nicht verändert werden, damit die zugehörigen Sonderzeichen bei den anderen Benutzern weiterhin angezeigt werden können. Auch wenn der eigene Browser diese Zeichen nicht darstellen kann, so weiß er doch, welche Zeichen sich dahinter verbergen. (D.h. Auch wenn z.B. statt des Katagana-Zeichens WI (ヰ) ein Platzhalter wie □ oder ? erscheint, so behandelt der Browser doch wie das Katagana-Zeichen WI, und Benutzer, die japanische Zeichensätze installiert haben, bekommen es auch nach der Bearbeitung weiterhin korrekt angezeigt. Alternativ kannst du zumindest einen Fallback Font installieren, der das Vorhandensein Dir unbekannter Zeichen deutlich macht, so dass ihnen nicht so leicht Schaden zugefügt wird.
Hier müssen dann noch die erkannten Betriebssystem-Browser-Kombinationen behandelt werden, die beim Speichern von Texten mit nicht installierten Zeichen Probleme bereiten. Also die Erklärungen, die jetzt unter #Internet Explorer, #Lynx und #Linux allgemein folgen würden hier rein passen,

Warum zeigt mein Textbrowser statt Sonderzeichen Zeichensalat an?

Problem: Statt Sonderzeichen werden unlesbare Zeichenketten angezeigt, etwa ð£ð¥Ðüð║ð▓ð░ statt Москва oder ├ñ statt ä. Dabei handelt es sich um Unicode-Zeichen, die z.B. vom Browser oder im Textmodus unter DOS nicht als solche interpretiert werden, sondern als Windows Codepage 850 oder Codepage 437. Die Sonderzeichen werden zwar beim Speichern nicht zerstört, jedoch ist es schwierig, den Text zu lesen und zu bearbeiten.

Lösung: Keine. Beim Bearbeiten können Sonderzeichen notfalls als HTML-Entitäten geschrieben werden, etwa ä für ein ä, Ö für ein Ö oder ß für ein ß. Bitte auf keinen Fall den vorhandenen "Zeichensalat" ändern!

Linux allgemein

Muss ich irgendetwas installieren/konfigurieren?

Programme, die GTK+2.0 oder höher verwenden, verwenden intern UTF-8 und unterstützen somit UTF-8 sehr gut, sie müssen dazu in der Regel keine speziellen Einstellungen vornehmen, ebenso KDE2- und KDE3-Programme. Wenn Sie UTF-8 in einem Terminal-Fenster verwenden wollen (z.B. mit Lynx), müssen Sie ein passende Locale installieren. Sehen Sie sich auch die Browser-spezifischen Fragen an.

Wenn sie mehr über Linux und UTF-8 wissen wollen, interessiert Sie vielleicht die Step by step introduction to switching your debian installation to utf-8 encoding.

Warum werden manche Zeichen nicht angezeigt?

Wenn Zeichen nicht angezeigt werden, sondern stattdessen z.B. ? oder ? angezeigt wird, liegt es wahrscheinlich daran, dass der Browser keine passende Schrifttype für das Zeichen findet. Es gibt zahlreiche freie Font-Pakete, die zusammen viele Schriften umfassen.

Sehen Sie auch mal oben bei Windows allgemein nach. Vielleicht finden Sie dort Links die Ihnen helfen.

Allerdings müssen Sie die Fonts (Schriftarten) nur installieren, wenn sie die entsprechnden Schriften auch interessieren (dann meist einfach in den Ordner /usr/share/fonts kopieren). Sie können aber auch ohne die entsprechende Schriftart Artikel der Wikipedia bearbeiten.

Unter Debian GNU/Linux kann man das Paket "ttf-malayalam-fonts" für ml:Main_Page und "ttf-kochi-mincho" bzw. "ttf-sazanami-mincho" für ja:Main_Page benutzen. Die entsprechenden -gothic-Pakete sollten auch funktionieren. Für th:Main_Page eigent sich "xfonts-thai". "ttf-kacst" ermöglicht das korrekte Anzeigen von ar:Main_Page.

Warum zeigt mein Textbrowser statt Sonderzeichen Zeichensalat an?

Problem: Wenn das Terminal, in dem der Textbrowser (z.B. Lynx, w3m) läuft, eine andere Zeichenkodierung verwendet, werden statt Sonderzeichen unlesbare Zeichenketten angezeigt, etwa Ð?оÑ?ква statt Москва oder ä statt ä. Dabei handelt es sich um UTF-8-kodierte Zeichen, die von der Konsole nicht als solche interpretiert werden, sondern als Latin-1. Die Sonderzeichen werden zwar beim Speichern nicht zerstört, jedoch ist es schwierig, den Text zu lesen und zu bearbeiten.

Lösung:

  • Auf der Linux-Konsole: die Konsole enthalten das Skript unicode_start. Es schaltet die Konsole in den UTF-8-Modus. Damit lässt sich dann schon mit Lynx die Wikipedia bearbeiten, evtl. werden aber einige Zeichen nicht angezeigt, dazu kann man die entsprechenden Konsolen-Schriften installieren. (Evtl. bietet sich auch die Verwendung von dynafont an.)[1]
  • Im Terminal-Fenster: Manche Terminals (z.B. das gnome-terminal) lassen sich mit echo -e '\e%G' in den UTF-8-Modus schalten, wenn Sie eine UTF-8-Locale verwenden ist das i. A. nicht nötig. Xterm sollten sie mit dem Skript uxterm aufrufen.[2]

MacOS allgemein

Siehe Wikipedia am Mac.

Internet Explorer

Warum zerstört der IE unter Mac OS beim Abspeichern Sonderzeichen?

Problem: Beim Speichern von Artikeln werden einige Sonderzeichen, etwa japanische und griechische, durch Fragezeichen ersetzt und die Seite somit zerstört.

Lösung: Keine. Der Internet Explorer für Mac OS wird von Microsoft nicht weiterentwickelt. Mit dem Internet Explorer unter Mac OS kann die Wikipedia nicht bearbeitet werden, bitte erst gar nicht versuchen. Stattdessen sollte ein funktionierender Browser verwendet werden, etwa Safari, der Bestandteil von Mac OS X 10.3 ist und für Mac OS X 10.2.8 (aber nicht für ältere X-Versionen oder Mac OS 9.x bzw. früher) kostenlos von Apple heruntergeladen werden kann oder Mozilla Firefox, der hier für Mac OS X kostenlos heruntergeladen werden kann. (Eine Version für Mac OS 9 gibt es hier.)

Mein IE zeigt alle Sonderzeichen falsch an

Problem: Wenn Sie den Downloadmanager Reget Installiert haben, zerstört dessen Integration die automatische Erkennung des Zeichensatzes. Dadurch werden die UTF8 Seiten als latin1 angezeigt und das Ergebnis ist Buchstabensalat.

Lösung: Die einzige Möglichkeit, diesen Fehler zu beheben, ist die Integration von Reget zu deaktivieren. Der Fehler ist den Herstellern von Reget bekannt, die Ursache scheint aber beim IE zu liegen, nicht bei Reget - somit ist kein Fix zu erwarten.

Lynx

Warum werden Sonderzeichen transkribiert (in lateinische Buchstaben umgewandelt)?

Problem: Sonderzeichen werden automatisch in lateinische Umschrift gewandelt. So wird etwa aus dem kyrillischen Text Архангельск automatisch Arhangel'sk. Beim Abspeichern wird diese Umwandlung nicht rückgängig gemacht, so dass die kyrillischen Zeichen verloren gehen und die Seite damit zerstört wird.

Lösung: In den Optionen (über die Taste O erreichbar) findet sich eine Option Display character set. Hier muss UNICODE (UTF-8) eingestellt werden. Danach bleiben Sonderzeichen beim Speichern erhalten. Dies muss unbedingt gemacht werden, um die Wikipedia mit Lynx zu bearbeiten! Beim Ändern der Optionen ist darauf zu achten, dass die Checkbox Optionen permanent speichern (ganz oben auf der Optionen-Seite) aktiviert sein muss, damit die Einstellungen auch beim nächsten Programmstart erhalten bleiben.

Außerdem muss die Konsole in der Lage sein, Unicode-Zeichen anzuzeigen. Siehe hierzu Linux allgemein: Warum zeigt mein Textbrowser statt Sonderzeichen Zeichensalat an?

Netscape

Kann ich Netscape Navigator 4.x verwenden, um die Wikipedia zu bearbeiten?

Netscape Navigator in der Version 4.x darf auf keinen Fall verwendet werden, um Wikipedia-Seiten zu bearbeiten, da es Sonderzeichen zerstört. Aber auch zum Lesen ist der Navigator 4.x praktisch nicht brauchbar, da er viele in der Wikipedia verwendete Techniken wie CSS nicht ausreichend unterstützt.

Es wird dringend empfohlen, auf einen modernen Browser umzusteigen, zum Beispiel auf Netscape 7, welcher hier kostenlos heruntergeladen werden kann oder auf Mozilla Firefox, der hier kostenlos heruntergeladen werden kann.

Wieso werden mit Netscape 7 im "Wikipedia:"-Namensraum Umlaute korrekt dargestellt, im Artikelraum aber nicht?

Hierbei handelt es sich vermutlich um ein Caching-Problem (nicht browserspezifisch): einige Artikel werden vom Server zwischengespeichert, um schneller "ausgeliefert" werden zu können. Diese Versionen sind mitunter nicht in UTF-8 kodiert. Dem kann abgeholfen werden, indem man die alte Version mit folgendem Link aus dem Cache entfernt: http://de.wikipedia.org/w/wiki.phtml?title=Titel&action=purge (Titel ist dabei durch den Titel der Seite zu ersetzen).

Privoxy

Warum zerstört Privoxy beim Speichern Umlaute und andere Sonderzeichen?

Im Werbeblocker Privoxy gibt in der Version 3.0.2 einen Programmfehler im so genannten Demoronizer, durch den Umlaute und andere Nicht-ASCII-Zeichen beim Bearbeiten zerstört werden [3]. In der Version 3.0.3 wurde dieser korrigiert. Es dürfen auf keinen Fall Wikipedia-Seiten bearbeitet werden, bis der Demoronizer abgeschaltet oder Privoxy aktualisiert wurde!

w3m

Warum werden Sonderzeichen falsch angezeigt?

Problem: Einige Akzente werden falsch angezeigt, z.B. Espan~ol statt Español. Andere Sonderzeichen (z.B. chinesisch) werden durch Fragezeichen ersetzt. Beim Speichern werden diese Sonderzeichen komplett gelöscht und die Seite somit zerstört.

Lösung: In den Optionen (über die Taste o erreichbar) muss in der Kategorie Charset Settings die Option Display Charset auf Unicode (UTF-8) gestellt werden. Dies muss unbedingt gemacht werden, um die Wikipedia mit w3m zu bearbeiten!

Außerdem muss die Konsole in der Lage sein, Unicode-Zeichen anzuzeigen. Siehe hierzu Linux allgemein: Warum zeigt mein Textbrowser statt Sonderzeichen Zeichensalat an?

Siehe auch



Views
'Persönliche Werkzeuge
Werkzeuge
Ähnliche Links