WikiLib:特殊字母與符號
维库,知识与思想的自由文库
[编辑] 字符编码系统在MediaWiki 1.5中,所有的项目都使用了Unicode(UTF-8)字符编码。 到2005年6月底,当这个新的版本开始在维基媒体上使用时,英国、荷兰、丹麦和瑞典的维基百科已经使用了windows-1252编码(他们宣布他们使用的是ISO-8859-1编码,但实际上浏览器把二者识别为为一,而且Mediawiki并没有限制使用windows-1252的历史)。在数据库中准备升级的wiki文档将始终以windows-1252编码保存,并且在载入时被转换。此后编辑们的更新将作为UTF-8编码储存在数据库内。载入时转换的过程对于用户来说是不可见的。
注意到Special:Export输出时使用UTF-8,无论数据库使用的是哪种编码。 若想了解某维基使用的编码系统,打开浏览器的“察看源代码”,找到类似字符: <meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" /> 或 <meta http-equiv="Content-type" content="text/html; charset=utf-8" /> [编辑] 编辑许多不在标准ASCII表中的字符也许对维基十分重要。有四种方法输入非ASCII字符:
总的来说,西欧语言一般不出现问题。 为了搜索的成功,特殊字符最好不用字符实体引用,否则搜索会出现问题。比如“Odiliënberg”,服务器只会以“Odili”、“euml”或“nberg”进行搜索。这其实是个bug,应该被修正。参见:Help:搜索。 [编辑] 世界语
Mediawiki软件可以设置世界语使用UTF-8编码作为储存和显示编码。但在编辑时,这些文字被转换为容易以标准键盘编辑的格式。 有这种特性的字符有:Ĉ,Ĝ,Ĥ,Ĵ,Ŝ,Ŭ,ĉ,ĝ,ĥ,ĵ,ŝ,ŭ。你可以用特种键盘直接键入这些字符,不过保存后在编辑时你还是会看见Sx。这叫做“x-加帽拼写”(参见:en:Esperanto orthography#The x-system)。如果想输入在这些字符或它们的不发音形式(A,G,H,J,S,U,c,g,h,j,s,u)后的“x”,则应输入显示出来的“x”两倍的“x”。 比如,世界语维基链接到en:Luxury car的跨语言链接,源代码是[[:en:Luxxury car]]。这曾造成跨维基机器人工作的问题。 [编辑] 浏览器有些浏览器会对编辑框里的文字作一些手脚。最常见的行为就是将文字转换为本地的编码形式。用户将不得不手动转换回来。这也常造成特殊字符变成问号(在某些浏览器变成了音译文字!)。 [编辑] Mac的IE这种常见浏览器使用Mac OS Roman编码系统。它几乎把所有的Unicode字符变成问号,部分ISO-8859-1也不能幸免遇难(特别是¤ ¦ ¹ ² ³ ¼ ½ ¾ Ð × Ý Þ ð ý þ 和软连字符)。所以用它浏览维基百科会造成极大的不便。 [编辑] Netscape 4.x问题与上者类似。 [编辑] 工作区
在英文维基变为UTF-8之后,跨维基机器人就开始替换HTML实体为Unicode字符,但对于有些浏览器来说,不正常的Unicode字符越来越多。工作区就是为此设计,以保证那些浏览器能安全的进行编辑,当然仅当Mediawiki知道哪些浏览器是有问题的。 列在$wgBrowserBlackList(一组正则表达式,匹配User-Agent字符串)的浏览器被提供一个特别的编辑框。十六进制HTML实体有多余的前导0,非ASCII字符在编辑框显示为无前导0的十六进制HTML实体。 当前IE Mac和一些版本的Linux Netscape 4.x浏览器在黑名单之中,不过这能解决一些问题。 [编辑] 浏览各种浏览器对Unicode的支持程度参差不齐。其中一个问题便是,IE对字体的处理是:使用在注册表中的设置,却不对可能显示成问号的字符的字体进行搜索。这就造成IE有时必须使用特定字体。在英文维基有一组这种功能模板:en:template:unicode处理通用Unicode字符,en:polytonic处理多音希腊语,en:IPA处理國際音標。而在Windows象形文字列表中的字符能够不用特殊手段安全使用。 <font face="Arial Unicode MS">...</font>可能只在用户有这种字体时才正常显示。 [编辑] 古埃及象形文字比如<hiero>P2</hiero>得到
。参见m:Help:WikiHiero syntax(警告:大量图像)。 这与浏览器的编码系统无关,因为这是图像。 当然也可用Unicode来表示它们,不过几乎没有浏览器支持。 [编辑] 有特殊字符的链接当用户使用下划链接时,且链接有特殊字符时,结果可能有歧义。 链接 + − < > ⊂ ⊃ 得到 + − < > ⊂ ⊃,也许看起来像± = ≤ ≥ ⊆ ⊇。这样最好单独给出链接。
[编辑] 参见[编辑] 外部链接
|



