關于N900的TXT文本的編碼注意事項
N900上TXT文本的編碼格式為UTF-8。此格式不用說,是目前兼容性相當好的一種編碼。但是比如PC上(特指中文系統的XP、win7等)建立的TXT文本默認是ANSI
所以當存儲有中文的ANSI編碼的TXT文本在N900上中文顯示成亂碼,更有可能無法打開(大量特殊符號)。提示系統內部錯誤,這是因為編碼不兼容所致。
當然如果是全E文就不會發上以上問題。
結論是,PC端生成的TXT文本最好另存為UTF-8編碼。然后在N900上使用。(N900生成的TXT文本直接是UTF-8編碼)
大量特殊符號:ANSI所包含的符號遠比UTF-8少,例如全角的·在ANSI編碼文本里會無法顯示,成為?號.
知識角
unicode和ansi都是字符代碼的一種表示形式。
為使計算機支持更多語言,通常使用 0x80~0xFF 范圍的 2 個字節來表示 1 個字符。比如:漢字'中'在中文操作系統中,使用 [0xD6,0xD0] 這兩個字節存儲。
不同的國家和地區制定了不同的標準,由此產生了 GB2312, BIG5, JIS 等各自的編碼標準。這些使用 2 個字節來代表一個字符的各種漢字延伸編碼方式,稱為 ANSI 編碼。在簡體中文系統下,ANSI 編碼代表 GB2312 編碼,在日文操作系統下,ANSI 編碼代表 JIS 編碼。
不同 ANSI 編碼之間互不兼容,當信息在國際間交流時,無法將屬于兩種語言的文字,存儲在同一段 ANSI 編碼的文本中。
全站熱搜