读书随笔

  1. 在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码。

    • 用记事本编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里,编辑完成后,保存的时候再把Unicode转换为UTF-8保存到文件:
    • 浏览网页的时候,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器:
  2. ASC|| -> 1字节

    • Unicode -> 2字节 (因为全英文会大量浪费)

      • UTF-8 -> 1-6字节 (可变长的编码,汉字通常3个字节)