關于N900的TXT文本的編碼注意事項

來源: www.meegoq.com  發布時間: 2010-09-25 09:52  閱讀: 699 次  推薦: 0   原文鏈接   [收藏]  

  N900上TXT文本的編碼格式為UTF-8。此格式不用說,是目前兼容性相當好的一種編碼。但是比如PC上(特指中文系統的XP、win7等)建立的TXT文本默認是ANSI

  所以當存儲有中文的ANSI編碼的TXT文本在N900上中文顯示成亂碼,更有可能無法打開(大量特殊符號)。提示系統內部錯誤,這是因為編碼不兼容所致。
  當然如果是全E文就不會發上以上問題。

  結論是,PC端生成的TXT文本最好另存為UTF-8編碼。然后在N900上使用。(N900生成的TXT文本直接是UTF-8編碼)

大量特殊符號:ANSI所包含的符號遠比UTF-8少,例如全角的·在ANSI編碼文本里會無法顯示,成為?號.

  知識角

  unicode和ansi都是字符代碼的一種表示形式。
  為使計算機支持更多語言,通常使用 0x80~0xFF 范圍的 2 個字節來表示 1 個字符。比如:漢字'中'在中文操作系統中,使用 [0xD6,0xD0] 這兩個字節存儲。
  不同的國家和地區制定了不同的標準,由此產生了 GB2312, BIG5, JIS 等各自的編碼標準。這些使用 2 個字節來代表一個字符的各種漢字延伸編碼方式,稱為 ANSI 編碼。在簡體中文系統下,ANSI 編碼代表 GB2312 編碼,在日文操作系統下,ANSI 編碼代表 JIS 編碼。
  不同 ANSI 編碼之間互不兼容,當信息在國際間交流時,無法將屬于兩種語言的文字,存儲在同一段 ANSI 編碼的文本中。

0
0
 
標簽:MeeGo產品
 
 

文章列表

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()