ASCII、Windows 1252(ANSI)、UTF-8與UTF-16

ASCII、Windows 1252(ANSI)與UTF-8

第一、ASCII[1]:

美國在1960年開始的編碼標準。

第二、Windows 1252[2][3]:

Windows System包含二個Code Page群組,分別是OEM Code Pages與ANSI Code Pages[4],OEM Code Pages主要運用在Win32 Console,而ANSI Code Pages是Microsoft早期的Windows GUI所使用的編碼標準,雖然並未成為ANSI標準,但是俗稱ANSI。ANSI Code Pages同時也是ASCII的超集合,而且,ANSI Code Pages包含Windows 1252。

第三、UTF-8[5]:

目前通用的編碼標準。同時也是Windows 1252的超集合。但是就backwards compatibility而言,仍然有所不足[6],所以部分的文字編輯器的預設值是ANSI,而非UTF-8。如Notepad的預設編碼就是ANSI,除非另行設定[7]。

第四、UTF-16[8]:

UTF-16在Microsoft Windows 2000/XP/2003/Vista/7/8/CE的OS API中是文字編碼的標準。

 

參考資料來源:

[1]ASCII
http://en.wikipedia.org/wiki/ASCII

[2]Code Page 1252 Windows Latin 1 (ANSI)
https://msdn.microsoft.com/en-us/library/cc195054.aspx

[3]Windows 1252
https://msdn.microsoft.com/en-us/goglobal/cc305145.aspx

[4]Windows code page
http://en.wikipedia.org/wiki/Windows_code_page

[5]UTF-8
http://en.wikipedia.org/wiki/UTF-8#General

[6]UTF-8 and Unicode FAQ for Unix/Linux
http://www.cl.cam.ac.uk/~mgk25/unicode.html

[7]Default UTF-8 encoding for new Notepad documents
http://answers.microsoft.com/en-us/windows/forum/windows_7-windows_programs/default-utf-8-encoding-for-new-notepad-documents/525f0ae7-121e-4eac-a6c2-cfe6b498712c

[8]UTF-16
http://en.wikipedia.org/wiki/UTF-16