大端字节序LSB、小端字节序MSB、网络字节序


作者:lingyun 来源:凌云物网智科实验室 时间:2014-07-20

 

关于字节序(大端法、小端法)的定义

《UNXI网络编程》定义:术语“小端”和“大端”表示多字节值的哪一端(小端或大端)存储在该值的起始地址。小端存在起始地址,即是小端字节序;大端存在起始地址,即是大端字节序。

也可以说:
1.小端法(Little-Endian)就是低位字节排放在内存的低地址端即该值的起始地址,高位字节排放在内存的高地址端。
2.大端法(Big-Endian)就是高位字节排放在内存的低地址端即该值的起始地址,低位字节排放在内存的高地址端。

举个简单的例子,对于整形0x12345678。它在大端法和小端法的系统内中,分别如图1所示的方式存放。

zijiexu_pic_1

网络字节序

我们知道网络上的数据流是字节流,对于一个多字节数值,在进行网络传输的时候,先传递哪个字节?也就是说,当接收端收到第一个字节的时候,它是将这个字节作为高位还是低位来处理呢?
网络字节序定义:收到的第一个字节被当作高位看待,这就要求发送端发送的第一个字节应当是高位。而在发送端发送数据时,发送的第一个字节是该数字在内存中起始地址对应的字节。可见多字节数值在发送前,在内存中数值应该以大端法存放。
网络字节序说是大端字节序。
比如我们经过网络发送0x12345678这个整形,在80X86平台中,它是以小端法存放的,在发送前需要使用系统提供的htonl将其转换成大端法存放,如图2所示。

zijiexu_pic_2

使用联合测试大小端字节序程序:

#include <stdio.h>

union
{
   char c;
   unsigned short s;
} A;

int main (int argc, char **argv)
{
   A.s = 0x1234;

   if( 0x12 == A.c )
      printf("This CPU is MSB\n");
   else
      printf("This CPU is LSB\n");

   return 0;
}

 

字节序测试程序

不同cpu平台上字节序通常也不一样,下面写个简单的C程序,它可以测试不同平台上的字节序。

1	#include <stdio.h>
2	#include <netinet/in.h>
3	int main()
4	{
5	    int i_num = 0x12345678;
6	    printf("[0]:0x%x\n", *((char *)&i_num + 0));
7	    printf("[1]:0x%x\n", *((char *)&i_num + 1));
8	    printf("[2]:0x%x\n", *((char *)&i_num + 2));
9	    printf("[3]:0x%x\n", *((char *)&i_num + 3));
10	 
11	    i_num = htonl(i_num);
12	    printf("[0]:0x%x\n", *((char *)&i_num + 0));
13	    printf("[1]:0x%x\n", *((char *)&i_num + 1));
14	    printf("[2]:0x%x\n", *((char *)&i_num + 2));
15	    printf("[3]:0x%x\n", *((char *)&i_num + 3));
16	 
17	    return 0;
18	}

 

在80X86CPU平台上,执行该程序得到如下结果:
[0]:0x78
[1]:0x56
[2]:0x34
[3]:0x12

[0]:0x12
[1]:0x34
[2]:0x56
[3]:0x78

分析结果,在80X86平台上,系统将多字节中的低位存储在变量起始地址,使用小端法。htonl将i_num转换成网络字节序,可见网络字节序是大端法。

总结点:我们常见的大部分处理器(如X86)都采用little-endian;少部分采用big-endian,如PowerPC;而MIPS和ARM处理器可通过配置采用不同的字节序,通常默认采用little-endian(ARM始终采用big-endian存储浮点数);网络字节序则使用大端字节序。

在线咨询
微信号
13554373241
联系方式
135-5437-3241
邮箱
guowenxue@aliyun.com
返回顶部