27_有哪些招惹麻烦的性能陷阱

26 | 有哪些招惹麻烦的性能陷阱？

前面，我们讨论了改善代码性能的最基本的办法。接下来，我们讨论一些最佳实践，让我们先从一些容易被忽略的性能陷阱开始。

使用性能测试工具

今天我们的讲解需要用到一个工具，它就是 JMH。JMH 是为 Java 语言或者其他基于 JVM 的编程语言设计的一个基准测试工具。这一节，我们会使用这个工具来分析一些性能的陷阱。这里我们简单地介绍下，这个工具该怎么使用。

第一步，使用 Maven 工具建立一个基准测试项目（需要使用 Maven 工具）：

1
2
3
4
5
6
7
8



$ mvn archetype:generate \
          -DinteractiveMode=false \
          -DarchetypeGroupId=org.openjdk.jmh \
          -DarchetypeArtifactId=jmh-java-benchmark-archetype \
          -DgroupId=com.example \
          -DartifactId=myJmh \
          -Dversion=1.0

这个命令行，会生成一个 myJmh 的工程目录，和一个基准测试模板文件（myJmh/src/main/java/com/example/MyBenchmark.java）。通过更改这个测试模板，就可以得到你想要的基准测试了。

比如，你可以使用后面我们用到的基准测试代码，替换掉模板中的基准测试方法（measureStringApend）。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16



package com.example;

import org.openjdk.jmh.annotations.Benchmark;

public class MyBenchmark {
    @Benchmark
    public String measureStringApend() {
        String targetString = "";
        for (int i = 0; i < 10000; i++) {
            targetString += "hello";
        }

        return targetString;
    }
}

第二步，编译基准测试：

1
2
3



$ cd myJmh
$ mvn clean install

第三步，运行你的基准测试：

1
2
3



$ cd myJmh
$ Java -jar target/benchmarks.jar

稍微等待，基准测试结果就出来了。我们需要关注的是"Score"这一栏，它表示的是每秒钟可以执行的基准测试方法的次数。

1
2
3



Benchmark                Mode  Cnt        Score          Error  Units
MyBenchmark.testMethod  thrpt   25        35.945 ▒       0.694  ops/s

这是 JMH 工具基本的使用流程，有关这个工具更多的选项和更详细的使用，需要你参考 JMH 的相关文档。

下面，我们通过字符串连接操作和哈希值的例子，来谈论一下这个工具要怎么使用，以及对应的性能问题。同时，我们再看看其他影响性能的一些小陷阱，比如内存的泄露、未关闭的资源和遗漏的 hashCode。

字符串的操作

在 Java 的核心类库里，有三个字符串操作的类，分别问 String、StringBuilder 和 StringBuffer。通过下面的基准测试，我们来了解下这三种不同的字符串操作的性能差异。为了方便，我把 JMH 测试的数据，标注在每个基准测试的方法注释里了。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11



    // JMH throughput benchmark: about 32 operations per second
    @Benchmark
    public String measureStringApend() {
        String targetString = "";
        for (int i = 0; i < 10000; i++) {
            targetString += "hello";
        }

        return targetString;
    }

// JMH throughput benchmark: about 5,600 operations per second @Benchmark public String measureStringBufferApend() { StringBuffer buffer = new StringBuffer(); for (int i = 0; i < 10000; i++) { buffer.append(“hello”); }

return buffer.toString(); }

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39



    // JMH throughput benchmark: about 21,000 operations per second
    @Benchmark
    public String measureStringBuilderApend() {
        StringBuilder builder = new StringBuilder();
        for (int i = 0; i < 10000; i++) {
            builder.append("hello");
        }

        return builder.toString();
    }

```

对于字符串连接的操作，这个基准测试结果显示，使用 StringBuffer 的字符串连接操作，比使用 String 的操作快了近 200 倍；使用 StringBuilder 的字符串连接操作，比使用 String 的操作快了近 700 倍。

String 的字符串连接操作为什么慢呢？ 这是因为每一个字符串连接的操作（targetString += “hello”），都需要创建一个新的 String 对象，然后再销毁，再创建。这种模式对 CPU 和内存消耗都比较大。

StringBuilder 和 StringBuffer 为什么快呢？因为 StringBuilder 和 StringBuffer 的内部实现，预先分配了一定的内存。字符串操作时，只有预分配内存不足，才会扩展内存，这就大幅度减少了内存分配、拷贝和释放的频率。

StringBuilder 为什么比 StringBuffer 还要快呢？StringBuffer 的字符串操作是多线程安全的，而 StringBuilder 的操作就不是。如果我们看这两个方法的实现代码，除了线程安全的同步以外，几乎没有差别。

```

public final class StringBuffer
    extends AbstractStringBuilder
    implements java.io.Serializable, Comparable<StringBuffer>, CharSequence {
    // snipped

    @Override
    @HotSpotIntrinsicCandidate
    public synchronized StringBuffer append(String str) {
        toStringCache = null;
        super.append(str);
        return this;
    }

    //  snipped
}

public final class StringBuilder extends AbstractStringBuilder implements java.io.Serializable, Comparable, CharSequence { // snipped

@Override @HotSpotIntrinsicCandidate public StringBuilder append(String str) { super.append(str); return this; }

// snipped }

1
2
3
4



JMH 的基准测试，并没有涉及到线程同步问题，难道使用 synchronized 关键字也会有性能损耗吗？

我们再来看看另外一个基准测试。这个基准测试，使用线程不安全的 StringBuilder 以及同步的字符串连接，部分模拟了线程安全的 StringBuffer.append() 方法的实现。为了方便你对比，我把没有使用同步的代码也拷贝在下面。

// JMH throughput benchmark: about 21,000 operations per second @Benchmark public String measureStringBuilderApend() { StringBuilder builder = new StringBuilder(); for (int i = 0; i < 10000; i++) { builder.append(“hello”); }

return builder.toString(); }

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39



    // JMH throughput benchmark: about 16,000 operations per second
    @Benchmark
    public String measureStringBuilderSynchronizedApend() {
        StringBuilder builder = new StringBuilder();
        for (int i = 0; i < 10000; i++) {
            synchronized (this) {
                builder.append("hello");
            }
        }

        return builder.toString();
    }

```

这个基准测试结果显示，虽然基准测试并没有使用多个线程，但是使用了线程同步的代码比不使用线程同步的代码慢。线程同步，就是 StringBuffer 比 StringBuilder 慢的原因之一。

通过上面的基准测试，我们可以得出这样的结论：

频繁的对象创建、销毁，有损代码的效率；

减少内存分配、拷贝、释放的频率，可以提高代码的效率；

即使是单线程环境，使用线程同步依然有损代码的效率。

从上面的基准测试结果，是不是可以得出结论，我们应该使用 StringBuilder 来进行字符串操作呢？我们再来看几个基准测试的例子。

下面的例子，测试的是常量字符串的连接操作。从测试结果，我们可以看出，使用 String 的连接操作，要比使用 StringBuilder 的字符串连接快 5 万倍，这是一个让人惊讶的性能差异。

```

    // JMH throughput benchmark: about 1,440,000,000 operations per second
    @Benchmark
    public void measureSimpleStringApend() {
        for (int i = 0; i < 10000; i++) {
            String targetString = "Hello, " + "world!";
        }
    }

// JMH throughput benchmark: about 26,000 operations per second @Benchmark public void measureSimpleStringBuilderApend() { for (int i = 0; i < 10000; i++) { StringBuilder builder = new StringBuilder(); builder.append(“hello, “); builder.append(“world!”); } }

1
2
3
4



这个巨大的差异，主要来自于 Java 编译器和 JVM 对字符串处理的优化。" Hello, " + " world! " 这样的表达式，并没有真正执行字符串连接。编译器会把它处理成一个连接好的常量字符串"Hello, world!"。这样，也就不存在反复的对象创建和销毁了，常量字符串的连接显示了超高的效率。

如果字符串的连接里，出现了变量，编译器和 JVM 就没有办法进行优化了。这时候，StringBuilder 的效率优势才能体现出来。下面的两个基准测试结果，就显示了变量对于字符长连接操作效率的影响。

// JMH throughput benchmark: about 9,000 operations per second @Benchmark public void measureVariableStringApend() { for (int i = 0; i < 10000; i++) { String targetString = “Hello, " + getAppendix(); } }

 1
 2
 3
 4
 5
 6
 7
 8
 9
10



    // JMH throughput benchmark: about 26,000 operations per second
    @Benchmark
    public void measureVariableStringBuilderApend() {
        for (int i = 0; i < 10000; i++) {
            StringBuilder builder = new StringBuilder();
            builder.append("hello, ");
            builder.append(getAppendix());
        }
    }

private String getAppendix() { return “World!”; }

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20



通过上面的基准测试，我们可以总结出下面的几条最佳实践：

Java 的编译器会优化常量字符串的连接，我们可以放心地把长的字符串换成多行；

带有变量的字符串连接，StringBuilder 效率更高。如果效率敏感的代码，建议使用 StringBuilder。String 的连接操作可读性更高，效率不敏感的代码可以使用，比如异常信息、调试日志、使用不频繁的代码；

如果涉及大量的字符串操作，使用 StringBuilder 效率更高；

除非有线程安全的需求，不推荐使用线程安全的 StringBuffer。

内存的泄露

内存泄漏是 C 语言的一个大问题。为了更好地管理内存，Java 提供了自动的内存管理和垃圾回收机制。但是，Java 依然会泄露内存。这种内存泄漏的主要表现是，如果一个对象不再有用处，而且它的引用还没有清零，垃圾回收器就意识不到这个对象需要及时回收，这时候就引发了内存泄露。

生命周期长的集合，是 Java 容易发生内存泄漏的地方。比如，可以扩张的静态的集合，或者存活时间长的缓存等。如果不能及时清理掉集合里没有用处的对象，就会造成内存的持续增加，引发内存泄漏问题。

比如下面这两个例子，就容易发生内存泄露。

静态的集合：

static final List

文章目录