代码优化 ,一个很重要的课题。可能有些人觉得没用,一些细小的地方有什么好修改的,改与不改对于代码的运行效率有什么影响呢?这个问题我是这么考虑的,就像大海里面的鲸鱼一样,它吃一条小虾米有用吗?没用,但是,吃的小虾米一多之后,鲸鱼就被喂饱了。
代码优化也是一样,如果项目着眼于尽快无 BUG 上线,那么此时可以抓大放小,代码的细节可以不精打细磨;但是如果有足够的时间开发、维护代码,这时候就必须考虑每个可以优化的细节了,一个一个细小的优化点累积起来,对于代码的运行效率绝对是有提升的。
代码优化的目标是:
带有 final 修饰符的类是不可派生的。在 Java 核心 API 中,有许多应用 final 的例子,例如 java.lang.String,整个类都是 final 的。为类指定 final 修饰符可以让类不可以被继承,为方法指定 final 修饰符可以让方法不可以被重写。如果指定了一个类为 final,则该类所有的方法都是 final 的。Java 编译器会寻找机会内联所有的 final 方法,内联对于提升 Java 运行效率作用重大,具体参见 Java 运行期优化。 此举能够使性能平均提高50% 。
特别是 String 对象的使用,出现字符串连接时应该使用
StringBuilder/StringBuffer 代替。由于 Java 虚拟机不仅要花时间生成对象,以后可能还需要花时间对这些对象进行垃圾回收和处理,因此,生成过多的对象将会给程序的性能带来很大的影响。
调用方法时传递的参数以及在调用中创建的临时变量都保存在栈中速度较快,其他变量,如静态变量、实例变量等,都在堆中创建,速度较慢。另外,栈中创建的变量,随着方法的运行结束,这些内容就没了,不需要额外的垃圾回收。
Java 编程过程中,进行数据库连接、I/O 流操作时务必小心,在使用完毕后,及时关闭以释放资源。因为对这些大对象的操作会造成系统大的开销,稍有不慎,将会导致严重的后果。
明确一个概念,对方法的调用,即使方法中只有一句语句,也是有消耗的,包括创建栈帧、调用方法时保护现场、调用方法完毕时恢复现场等。所以例如下面的操作:
java
for (int i = 0; i < list.size(); i++) {
...
}
建议替换为:
java
for (int i = 0, int length = list.size(); i < length; i++) {
...
}
这样,在 list.size() 很大的时候,就减少了很多的消耗。
例如:
java
String str = "aaa";
if (i == 1) {
list.add(str);
}
建议替换为:
java
if (i == 1) {
String str = "aaa";
list.add(str);
}
异常对性能不利。抛出异常首先要创建一个新的对象,Throwable 接口的构造函数调用名为 fillInStackTrace() 的本地同步方法,fillInStackTrace() 方法检查堆栈,收集调用跟踪信息。只要有异常被抛出,Java 虚拟机就必须调整调用堆栈,因为在处理过程中创建了一个新的对象。异常只能用于错误处理,不应该用来控制程序流程。
除非不得已。如果毫无理由地这么写了,只要你的领导资深一点、有强迫症一点,八成就要骂你为什么写出这种垃圾代码来了。
比如 ArrayList、LinkedLlist、StringBuilder、StringBuffer、HashMap、HashSet等等,以 StringBuilder 为例:
可以通过类(这里指的不仅仅是上面的 StringBuilder)的来设定它的初始化容量,这样可以明显地提升性能。比如 StringBuilder吧,length 表示当前的 StringBuilder 能保持的字符数量。因为当 StringBuilder 达到最大容量的时候,它会将自身容量增加到当前的2倍再加2,无论何时只要 StringBuilder 达到它的最大容量,它就不得不创建一个新的字符数组然后将旧的字符数组内容拷贝到新字符数组中—-这是十分耗费性能的一个操作。试想,如果能预估到字符数组中大概要存放5000个字符而不指定长度,最接近5000的2次幂是4096,每次扩容加的2不管,那么:
这样,既浪费内存空间又降低代码运行效率。所以,给底层以数组实现的集合、工具类设置一个合理的初始化容量是错不了的,这会带来立竿见影的效果。但是,注意,像 HashMap 这种是以数组+链表实现的集合,别把初始大小和你估计的大小设置得一样,因为一个 table 上只连接一个对象的可能性几乎为0。初始大小建议设置为2的N次幂,如果能估计到有2000个元素,设置成 new HashMap(128)、new HashMap(256) 都可以。
例如:
java
for (val = 0; val < 100000; val += 5) {
a = val * 8;
b = val / 2;
}
用移位操作可以极大地提高性能,因为在计算机底层,对位的操作是最方便、最快的,因此建议修改为:
java
for (val = 0; val < 100000; val += 5) {
a = val << 3;
b = val >> 1;
}
移位操作虽然快,但是可能会使代码不太好理解,因此最好加上相应的注释。
例如:
java
for (int i = 1; i <= count; i++) {
Object obj = new Object();
}
这种做法会导致内存中有count份Object对象引用存在,count很大的话,就耗费内存了,建议为改为:
java
Object obj = null;
for (int i = 0; i <= count; i++) {
obj = new Object();
}
这样的话,内存中只有一份 Object 对象引用,每次 new Object() 的时候,Object 对象引用指向不同的 Object 罢了,但是内存中只有一份,这样就大大节省了内存空间了。
因为这毫无意义,这样只是定义了引用为 static final,数组的内容还是可以随意改变的,将数组声明为 public 更是一个安全漏洞,这意味着这个数组可以被外部类所改变。
使用单例可以减轻加载的负担、缩短加载的时间、提高加载的效率,但并不是所有地方都适用于单例,简单来说,单例主要适用于以下三个方面:
要知道,当某个对象被定义为 static 的变量所引用,那么 GC 通常是不会回收这个对象所占有的堆内存的,如:
java
public class A {
private static B b = new B();
}
此时静态变量 b 的生命周期与 A 类相同,如果 A 类不被卸载,那么引用 B 指向的 B 对象会常驻内存,直到程序终止。
为了清除不再活动的会话,许多应用服务器都有默认的会话超时时间,一般为30分钟。当应用服务器需要保存更多的会话时,如果内存不足,那么操作系统会把部分数据转移到磁盘,应用服务器也可能根据 MRU(最近最频繁使用)算法把部分不活跃的会话转储到磁盘,甚至可能抛出内存不足的异常。如果会话要被转储到磁盘,那么必须要先被序列化,在大规模集群中,对对象进行序列化的代价是很昂贵的。因此,当会话不再需要时,应当及时调用 HttpSession 的 invalidate() 方法清除会话。
这是 JDK 推荐给用户的。JDK API 对于 RandomAccess 接口的解释是:实现 RandomAccess 接口用来表明其支持快速随机访问,此接口的主要目的是允许一般的算法更改其行为,从而将其应用到随机或连续访问列表时能提供良好的性能。实际经验表明,实现 RandomAccess 接口的类实例,假如是随机访问的,使用普通 for 循环效率将高于使用 foreach 循环;反过来,如果是顺序访问的,则使用 Iterator 会效率更高。可以使用类似如下的代码作判断:
java
if (list instanceof RandomAccess) {
for (int i = 0; i < list.size(); i++) {
}
} else {
Iterator<#> iterator = list.iterable();
while (iterator.hasNext()) {
iterator.next();
}
}
循环的底层实现原理就是迭代器 Iterator,参见 Java 语法糖1:可变长度参数以及 foreach 循环原理。所以后半句“反过来,如果是顺序访问的,则使用 Iterator 会效率更高”的意思就是顺序访问的那些类实例,使用 foreach 循环去遍历。
这点在多线程模块中的 synchronized 锁方法块一文中已经讲得很清楚了,除非能确定一整个方法都是需要进行同步的,否则尽量使用同步代码块,避免对那些不需要进行同步的代码也进行了同步,影响了代码执行效率。
这样在编译期间就可以把这些内容放入常量池中,避免运行期间计算生成常量的值。另外,将常量的名字以大写命名也可以方便区分出常量与变量
这毫无意义,如果代码中出现“The value of the local variable i is not used”、“The import java.util is never used”,那么请删除这些无用的内容。
关于,请参见反射。反射是 Java 提供给用户一个很强大的功能,功能强大往往意味着效率不高。不建议在程序运行过程中使用尤其是频繁使用反射机制,特别是 Method 的 invoke() 方法,如果确实有必要,一种建议性的做法是将那些需要通过反射加载的类在项目启动的时候通过反射实例化出一个对象并放入内存—-用户只关心和对端交互的时候获取最快的响应速度,并不关心对端的项目启动花多久时间。
这两个池都是用于重用对象的,前者可以避免频繁地打开和关闭连接,后者可以避免频繁地创建和销毁线程。
带缓冲的输入输出流,即 BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStream,这可以极大地提升 IO 效率。
public 方法即对外提供的方法,如果给这些方法太多形参的话主要有两点坏处:
至于这个“太多”指的是多少个,3、4个吧。比如我们用 JDBC 写一个 insertStudentInfo() 方法,有10个学生信息字段要插如 Student 表中,可以把这10个参数封装在一个实体类中,作为 insert() 方法的形参。
这是一个比较常见的小技巧了,如果有以下代码:
java
String str = "123";
if (str.equals("123")) { ... }
建议修改为:
java
String str = "123";
if ("123".equals(str)) { ... }
这么做主要是可以避免空指针异常。
平时有人问,if (i == 1) 和 if (1== i) 有没有区别,这就要从 C/C++ 讲起。
在C/C++中,if (i == 1) 判断条件成立,是以0与非0为基准的,0表示 false,非0表示 true,如果有这么一段代码:
java
int i = 2;
if (i == 1) { ... } else { ... }
C/C++ 判断 i==1 不成立,所以以0表示,即 false。但是如果:
java
int i = 2;
if (i = 1) { ... } else { ... }
万一程序员一个不小心,把 if (i == 1) 写成 if (i = 1),这样就有问题了。在 if 之内将i赋值为1,if 判断里面的内容非0,返回的就是 true 了,但是明明 i 为2,比较的值是1,应该返回的 false。这种情况在 C/C++ 的开发中是很可能发生的并且会导致一些难以理解的错误产生,所以,为了避免开发者在if语句中不正确的赋值操作,建议将 if 语句写为:
java
int i = 2;
if (1 == i) { ... } else { ... }
这样,即使开发者不小心写成了 1 = i,C/C++ 编译器也可以第一时间检查出来,因为我们可以对一个变量赋值 i 为1,但是不能对一个常量赋值1为 i。
但是,在 Java 中,C/C++ 这种 if (i = 1) 的语法是不可能出现的,因为一旦写了这种语法,Java 就会编译报错 “Type mismatch: cannot convert from int to boolean”。但是,尽管 Java 的 if (i == 1) 和 if (1 == i) 在语义上没有任何区别,但是从阅读习惯上讲,建议使用前者会更好些。
看一下对数组使用toString()打印出来的是什么:
java
public static void main(String[] args) {
int[] is = new int[]{1, 2, 3};
System.out.println(is.toString());
}
结果是:
[I@18a992f
本意是想打印出数组内容,却有可能因为数组引用 is 为空而导致空指针异常。不过虽然对数组 toString() 没有意义,但是对集合 toString() 是可以打印出集合里面的内容的,因为集合的父类 AbstractCollections 重写了 Object 的 toString() 方法。
这绝不会得到想要的结果:
java
public static void main(String[] args) {
long l = 12345678901234L;
int i = (int) l;
System.out.println(i);
}
我们可能期望得到其中的某几位,但是结果却是:
1942892530
解释一下。Java 中 long 是8个字节64位的,所以 12345678901234 在计算机中的表示应该是:
0000 0000 0000 0000 0000 1011 0011 1010 0111 0011 1100 1110 0010 1111 1111 0010
一个 int 型数据是4个字节32位的,从低位取出上面这串二进制数据的前32位是:
0111 0011 1100 1110 0010 1111 1111 0010
这串二进制表示为十进制 1942892530,所以就是我们上面的控制台上输出的内容。从这个例子上还能顺便得到两个结论:
如果一个集合类是公用的(也就是说不是方法里面的属性),那么这个集合里面的元素是不会自动释放的,因为始终有引用指向它们。所以,如果公用集合里面的某些数据不使用而不去 remove 掉它们,那么将会造成这个公用集合不断增大,使得系统有内存泄露的隐患。
把一个基本数据类型转为一般有三种方式,我有一个 Integer 型数据i,可以使用 i.toString()、String.valueOf(i)、i+””三种方式,三种方式的效率如何,看一个测试:
java
public static void main(String[] args) {
int loopTime = 50000;
Integer i = 0;
long startTime = System.currentTimeMillis();
for (int j = 0; j < loopTime; j++) {
String str = String.valueOf(i);
}
System.out.println("String.valueOf():" + (System.currentTimeMillis() - startTime) + "ms");
startTime = System.currentTimeMillis();
for (int j = 0; j < loopTime; j++) {
String str = i.toString();
}
System.out.println("Integer.toString():" + (System.currentTimeMillis() - startTime) + "ms");
startTime = System.currentTimeMillis();
for (int j = 0; j < loopTime; j++) {
String str = i + ";
}
System.out.println("i + ":" + (System.currentTimeMillis() - startTime) + "ms");
}
运行结果为:
String.valueOf():11ms Integer.toString():5ms i + ":25ms
所以以后遇到把一个基本数据类型转为 String 的时候,优先考虑使用 toString() 方法。至于为什么,很简单:
三者对比下来,明显是2最快、1次之、3最慢
遍历 Map 的方式有很多,通常场景下我们需要的是遍历 Map 中的 Key 和 Value,那么推荐使用的、效率最高的方式是:
java
public static void main(String[] args) {
HashMap<String, String> map = new HashMap<String, String>();
map.put("111", "222");
Set<Map.Entry<String, String>> entrySet = map.entrySet();
Iterator<Map.Entry<String, String>> iter = entrySet.iterator();
while (iter.hasNext()) {
Map.Entry<String, String> entry = iter.next();
System.out.println(entry.getKey() + " " + entry.getValue());
}
}
如果你只是想遍历一下这个 Map的 key 值,那用 Set keySet = map.keySet(); 会比较合适一些
意思是,比如我有这么一段代码:
java
try {
XXX.close();
YYY.close();
} catch (Exception e) { ...}
建议修改为:
java
try {
XXX.close();
} catch (Exception e) { ...}
try {
YYY.close();
} catch (Exception e) { ...}
虽然有些麻烦,却能避免资源泄露。我想,如果没有修改过的代码,万一 XXX.close() 抛异常了,那么就进入了 catch 块中了,YYY.close() 不会执行,YYY 这块资源就不会回收了,一直占用着,这样的代码一多,是可能引起资源句柄泄露的。而改为上面的写法之后,就保证了无论如何 XXX 和 YYY 都会被 close 掉。