lazyload the images

最新精選 Featured post

異世界穿越作品整合

訂閱

訂閱 FB 專頁

每月雙數周日為固定發佈日

訂閱FB 專頁,有新發佈時將會立即看見。
Youtube 頻道經常會有電玩錄影

18/01/2023

Character Set and Encoding for chinese

文章分類: ,

 

承上一篇,有關中文encoding的延伸閱讀

接下來說一點懷舊事情,總共有三項


IE > Encoding

在古老的時代, Unicode 尚未盛行,各 開發工具也沒有跟貼那個新興的 Unicode 標準

古老的開發工具有

- Notepad

- Microsoft FrontPage

- Macromedia Dreamweaver 6.0(MX)~8.0

- Notepad++

- UltraEdit

- Eclipse PHP Development Tools (Eclipse PDT)

當時有不少只是一個文字編輯工具,開發者沒有留意時,很多時檔案(網頁.html, .html)的預設編碼都會是 OS 的預設編碼,

Big5/Chinese Guobiao (GB)/ASCII

當與瀏覽者的瀏覽器預設不同時,便會顯示亂碼


很難懂,海豚說顯淺一點,

當時UTF未是主流,開發時如開發者沒有註明用什麼編碼,開發工具一般都默應並按照系統的預設編碼,如使用英文windows的會是ASCII,使用繁體windows的會是Big5,使用簡體windows的會是GB。

假如瀏覽方的預設編碼與開發者的不相同,去瀏覽繁體網頁時,因為解碼錯誤,便會顯示亂碼。



瀏覽者需要在 IE 上 Encoding 切換成 作者使用的 encode

當然你不會知道開發者的HTML檔案是使用什麼 encode ,唯有估計和一個一個去試


解決方法

當然現在這個問題已經不存在,開發工具和瀏覽器預設都是UTF


沒有使用 Unicode 的應用程式

除了網頁/網站,有時可能 下載內地/日本的應用程式

當中使用了日文/簡體中文/韓文,可能由於程式設計是沒有向系統表明是用什麼編碼,或沒有使用 Unicode 或是指定成系統預設,當系統預設與開發者不同時便會顯示成亂碼(Mojibake)。

解決方法有幾種

- 使用與 日文應用/遊戲的開發者 相同的系統 執行/玩遊戲,即是安裝日文版的 Windows OS

- 透過 Microsoft AppLocale ,但是這個只支援 Win XP 還要塔配一系列常人會認為很複雜的設定

- Win 10 可使用 Locale Emulator

https://github.com/xupefei/Locale-Emulator


增補字符集

漢字文化圈 包括 中國、澳門、香港、臺灣、越南、南韓、北韓、日本

使用繁體中文的地區包括 中國、台灣、香港、澳門

雖然中國國內以 簡體字 為 規範,而以教學或研究 詩詞歌賦、書法等時,亦會使用 繁體字

(文字演變不在此詳述,簡要說明就是繁體字相比簡體字更接近古代用字,更有利於學習古代文學)

Big5 內沒有收錄香港常用廣東字、一些地名/人名

90年代,香港政府就補完這些常用字到 Big5 未使用的編碼,及後發佈碰登錄成

ISO/IEC 10646 又稱 香港增補字符集 Hong Kong Supplementary Character Set(HKSCS)


初代 Win XP 並沒有預裝 香港增補字符集(HKSCS),需要到香港政府網站/Microsoft 官網 下載自行安裝

後期的Win XP SP1/SP2/SP3 已預裝 了 香港增補字符集(HKSCS)

(SP是service pack的縮寫,寶寶可能聽不懂是什麼,它類似現代遊戲的DLC,是為一項大更新,大更新都不外乎是加入新功能和提升保安和修補錯誤)


安裝了 HKSCS 才能輸入/顯示 香港地區常用字,例如

位於 香港>九龍>深水埗


當中的埗字,就是 HKSCS 補充的5000多個字之中其中一個

其它例子有 哦 啲 喺 吓……

海豚怕你的電腦無法顯示,用圖片重貼

這些文字都是口語,不能用在作文上

常見於說話、香港各大討論區、文章雜誌、宣傳標語、文字通訊軟件和社交平台等


有興趣知道解釋的可看WIKI

https://zh.m.wiktionary.org/wiki/%E5%93%A6

https://zh.m.wiktionary.org/wiki/%E5%95%B2

https://zh.m.wiktionary.org/wiki/%E5%96%BA

https://zh.m.wiktionary.org/zh-hant/%E5%90%93


當然不少得很多 廣東話粗口(髒話)用字,海豚不在此述,

有興趣自行google 廣東話粗口


解決方法

當然現在這個問題已經不存在,新的系統都預設有安裝了


Reference

What is Encoding -> Unicode in Internet Explorer and Firefox?

https://superuser.com/questions/1194601/what-is-encoding-unicode-in-internet-explorer-and-firefox

Microsoft AppLocale

https://zh.wikipedia.org/zh-hk/Microsoft_AppLocale

政府資訊科技總監辦公室:香港增補字符集

https://www.ogcio.gov.hk/tc/our_work/business/tech_promotion/ccli/hkscs/

《香港增補字符集─2016》文件

https://1drv.ms/b/s!AuKYJxNRuye9g_9XY58Bw3rdzCfSNA

No comments:

Post a Comment