2022年 11月 7日

Python中字节串和字符串,不是一个概念没有区别之分

1.字节概念

           字节(Byte )是计算机信息技术用于计量存储容量的一种计量单位,作为一个单位来处理的一个二进制数字串,是构成信息的一个小单位。最常用的字节是八位的字节,即它包含八位的二进制数

          位(bit):是计算机 内部数据 储存的最小单位,11001100是一个八位二进制数。
          字节(byte):是计算机中 数据处理 的基本单位,习惯上用大写  B  来表示,1B(byte,字节)= 8bit(位)。

2.字符概念

          字符 是指计算机中使用的字母、数字、字和符号,包括:1、2、3、A、B、C、~!·#¥%……—*()——+等等。在UTF-8编码  中,一个英文字母字符存储需要1个字节,一个汉字字符储存需要3个字节。

          一个英文就用八位二进制数表示,一个汉字就用3个八位二进制表示。

3.字符串概念

           字符串是字符序列,它是一种抽象的概念,不能直接存储在硬盘。

4.字节串概念

           字节串是字节序列,它可以直接存储在硬盘。它们之间的映射被称为编码/解码

            在Python中,程序中的文本都用字符串表示。

5.python字节串和字符串代码介绍

  1. >>> s = '中文'
  2. >>> s.encode() # 编码,默认的是UTF-8
  3. b'\xe4\xb8\xad\xe6\x96\x87' # 字节串
  4. >>> type(s.encode())
  5. <class 'bytes'> # 字节串
  6. >>> b'\xe4\xb8\xad\xe6\x96\x87'.decode(encoding='UTF-8') # 解码
  7. '中文' # 字符串
  8. >>> type(b'\xe4\xb8\xad\xe6\x96\x87'.decode(encoding='UTF-8'))
  9. <class 'str'> # 字符串

        注:  encode()编码函数,decode()解码函数

 字节串是给计算机看的,给计算机传输或者保存的
 字符串是给人看的,用来操作的