位运算

2,312 阅读9分钟

一、为什么进行位操作?

在计算机中所有数据都是以二进制的形式储存的。位运算其实就是直接对在内存中的二进制数据进行操作,因此处理数据的速度非常快。在正式介绍位运算之前我们先补充几个概念,如果已经熟悉的读者可以忽略。

符号位: 二进制数最高位表示符号位,0表示正数,1表示负数。
原码: 整数的二进制数。
反码: 符号位不变,其余部分取反。
补码: 原码取反+1,符号位不变。或者说反码+1,符号位不变。
负数的原码即为:正数的原码取反,再加1,即正数的补码就是负数的原码。

比如11和-11
11的原码:00000000 00000000 00000000 00001011
11的反码:01111111 11111111 11111111 11110100
11的补码:01111111 11111111 11111111 11110101

-11的原码:11111111 11111111 11111111 11110101

二、位运算的分类

1.按位操作符
2.移位操作符

按位操作符

按位操作符用来操作整数基本数据类型中的单个“比特(bit)”,即二进制。按位操作符会对两个参数中的位执行布尔代数运算,并最终生成一个结果。

1.按位“与”操作符(&)

解释:对两个整数的二进制形式逐位进行逻辑与运算

如果两个输入位都是1,那么按位“与”(&)操作就会生成一个输出位1,否则生成一个输出位0。

1&1=1; 1&0=0; 4&-5=0; 

4&-5分析:

4的二进制:00000000 00000000 00000000 00000100
-5的二进制:11111111 11111111 11111111 11111011
所以4&-5的二进制为 00000000 00000000 00000000 00000000
转换为10进制为0。
所以4&-5=0;

2.按位“或”操作符(|)

解释:对两个整数的二进制形式逐位进行逻辑或运算。

如果两个输入位都是1,那么按位“或”(|)操作符生成一个输出位1,只有两个输入位都是0的情况下,才会生成一个输出位0。

1|0=1;
0|0=0;
4|-5=-1;

同样以4|-5为例:

4|-5:
4的二进制:00000000 00000000 00000000 00000100,
-5的二进制:11111111 11111111 11111111 11111011,
逐位进行逻辑或运算:11111111 11111111 11111111 11111111,即得到-1.

3.按位“异或”操作符(^)
解释:对两个整数的二进制形式逐位进行逻辑异或运算。

如果输入位的某一个是1,但不全都是1,那么按位“异或”(^)操作,生成一个输出位1。

1^1=0; 1^0=1; 0^0=0; 4^-5=-1;

4^-5:

4的二进制:00000000 00000000 00000000 00000100,
-5的二进制:11111111 11111111 11111111 11111011,
逐位进行逻辑异或运算:11111111 11111111 11111111 11111111,即得到-1.

4.按位非(~)
解释:对两个整数的二进制形式逐位进行取反。

按位非(~)操作符,也称为取反操作符。它属于一元操作符,只对一个数进行操作(其他按位操作符是二元操作符),按位“非”生成与输入位相反的值,若输入0,则输出1;若输入1,则输出0。

~4=-5;

4的二进制形:00000000 00000000 00000000 00000100,逐位取反后得11111111 11111111 11111111 11111011,即为-5。

移位操作符

移位操作符操作的运算对象也是二进制的“位”。移位操作符只能用来处理整数类型。移位操作符分为:1.左移位操作符(<<),2.“有符号”右移位操作符(>>),3.“无符号”右移操作符(>>>)。

1.左移位操作符(<<)

例如:4<<2

4的二进制形式: 00000000 00000000 00000000 00000100,进行左位移2位,得到00000000 00000000 00000000 00010000,即为16.

10737418<<8

10737418二进制表示形式:00000000 10100011 11010111 00001010,进行左位移2位,得到10100011 11010111 00001010 00000000,即为:-1546188288.

2.有符号右位移操作符(>>)

m>>n的含义: 把整数m表示的二进制数右移n位,m为正数,高位全部补0;m为负数,高位全部补1。
例如 4>>2

4的二进制形式: 00000000 00000000 00000000 00000100,进行右位移2位,得到00000000 00000000 00000000 00000000,即为1.

-4>>2剖析:

-4二进制形式: 11111111111111111111111111111100,右移2位,得到11111111 11111111 11111111 11111111,即为-1.

PS: 每个整数表示的二进制都是32位的,如果右移32位和右移0位的效果是一样的。依次类推,右移32的倍数位都一样。相当于整体全移。与移0位相同。左移也是一样的。

3.无符号右移操作符(>>>)

m>>>n: 整数m表示的二进制右移n位,不论正负数,高位都补零。

例如: 4>>>2:

4二进制形式: 00000000 00000000 00000000 00000100,右移两位,得到00000000 00000000 00000000 00000001,即为1。

-4>>>2:

-4二进制形式: 11111111111111111111111111111100,右移两位,得到00111111 11111111 11111111 11111111,即为1073741823.

补充

对于移位操作符如果n为负数:这时JVM会先让n对32取模,变成一个绝对值小于32的负数,然后再加上32,直到 n 变成一个正数。
例如:
4<<-10
4的二进制形式:00000000 00000000 00000000 00000100,-10对32取模再加上32,不用说了,得到22,则4<<-10,即相当于4<<22。
此时按照再左移22位,得到00000001 00000000 00000000 00000000,得到的即为:16777216。

4.其他非整型数值位移处理

如果对char,byte或者short类型的数值进行位移处理,那么在移位之前会,它们会被转为int类型,并且得到的结果也是int类型的值。只有数值有段的低5位才有用。这样可以防止我们移位超过int型所具有的位数。(2的5次方等于32,int只有32位)。

“移位”可以与“等号”(<<=或>>=或>>>=组合使用)。此时,操作符左边的值会移动指定的位数,然后将结果复制给左边的变量。但在进行“无符号”右移位集合结合赋值操作时,会出现一个问题:如果对byte或short值进行这样的移位运算,得到的可能不是正确的结果。它们会先被转成int类型,然后进行右移操作,然后被截断,再赋值给原来的类型。
例如:

    public static void main(String [] args)
{
byte a;
byte b;
byte c;
a = 127;
b = 127;
c = 127;
a <<= 2;
System.out.println(a);
System.out.println(b <<= 2);
System.out.println(c << 2);
}

输出的结果为
-4
-4
508
这说明了在操作a <<= 2 执行过程是这样的:先将 byte型的数 127变成int型,左移2位得到 508,然后把508赋给byte型变量a时只是简单地”折断”(truncate)得到数-4。编译时编译器不会提示你可能损失精度(实际上在本例中确实是损失精度了)。