본문 바로가기

Java

[Java] 가변 String

불변인  String 클래스의 단점

불변인 String 클래스에도 단점이 있습니다.

 

두 문자를 더하는 경우

"A" + "B"
String("A") + Sring("B") // 문자는 String 타입이다.
String("A").concat(String("B")) // 문자의 더하기는 concat을 사용한다.
new String("AB") // String은 불변이다. 따라서 새로운 객체가 생성된다.
  • 불변인 String의 내부 값은 변경할 수 없다.
  • 따라서 변경된 값을 기반으로 새로운 String 객체를 생성한다.

 

더 많은 문자를 더하는 경우

String str = "A" + "B" + "C" + "D";
String str = ("A") + String("B") + String("C") + String("D");
String str = new String("AB") + String("C") + String("D");
String str = new String("ABC") + String("D");
String str = new String("ABCD");
  • 이 경우 총 3개의 String 클래스가 추가로 생성된다.
  • 그런데 중간에 만들어진 new String("AB"), new String("ABC")는 사용되지 않는다.
  • 최종적으로 만들어진 new String("ABCD")만 사용된다.
  • 결과적으로 중간에 만들어진 String 객체는 사용되지도 않고, GC의 대상이 된다.

불변인 String 클래스의 단점은 문자를 더하거나 변경할 때 마다 새로운 객체를 생성해야 한다는 점 입니다.

문자를 자주 더하거나 변경해야 하는 상황이라면 더 많은 String 객체를 만들고, GC를 해야합니다.

결과적으로 컴퓨터의 CPU, 메모리 자원을 더 많이 사용하게 되고, 문자열을 더 자주 변경할수록 시스템의 자원을

더 많이 소모하게 됩니다.

 

StringBuilder

 

이 문제를 해결하는 방법은 단순합니다. 바로 불변이 아닌 가변 String이 존재하면 됩니다.

가변은 내부의 값을 바로 변경하면 되기 때문에 새로운 객체를 생성할 필요가 없습니다.

따라서 성능과 메모리 사용면에서 불변보다 더 효율적이다 라는 장점을 가지고 있습니다.

 

이런 문제를 해결하기 위해 자바는 StringBuilder 라는 가변 String을 제공하고 있습니다.

물론 가변의 경우 사이드 이펙트에 주의해서 사용해야 합니다.

public class StringBuilderMain1_1 {

    public static void main(String[] args) {
        StringBuilder sb = new StringBuilder();
        sb.append("A");
        sb.append("B");
        sb.append("C");
        sb.append("D");
        System.out.println("sb = " + sb);

        sb.insert(4, "Java");
        System.out.println("insert = " + sb);

        sb.delete(4, 8);
        System.out.println("delete = " + sb);

        sb.reverse();
        System.out.println("reverse = " + sb);

        // StringBuilder => String
        String string = sb.toString();
        System.out.println("string = " + string);
    }
}
sb = ABCD
insert = ABCDJava
delete = ABCD
reverse = DCBA
string = DCBA
  • StringBuilder 객체를 생성한다.
  • append( ) 메서드를 사용해 여러 문자열을 추가한다.
  • insert( ) 메서드로 특정 위치에 문자열을 삽입한다.
  • delete( ) 메서드로 특정 범위의 문자열을 삭제한다.
  • reverse( ) 메서드로 문자열을 뒤집는다.
  • 마지막으로 toString( ) 메서드를 사용해 StringBuilder 결과를 기반으로 String을 생성해서 반환한다.

 

가변 vs 불변

  • String은 불변하다. 즉, 한 번 생성되면 그 내용을 변경할 수 없다. 따라서 문자열에 변화를 주려고 할 때마다 새로운 String 객체가 생성되고, 기존 객체는 버려진다. 이 과정에서 메모리와 처리 시간을 더 많이 소모한다.
  • 반면에 StringBuilder는 가변적이다. 하나의 StringBuilder 객체 안에서 문자열을 추가, 삭제, 수정할 수 있으며, 이 때마다 새로운 객체를 생성하지 않는다. 이로 인해 메모리 사용을 줄이고 성능을 향상시킬 수 있다. 단 사이드 이펙트를 주의해야 한다.
  • StringBuilder는 보통 문자열을 변경하는 동안만 사용하다가 문자열 변경이 끝나면 안전한(불변) String 으로 변환하는 것이 좋다.

 

String 최적화

자바 컴파일러는 다음과 같이 문자열 리터럴을 더하는 부분을 자동으로 합쳐줍니다.

 

문자열 리터럴 최적화

 

컴파일 전

String helloWorld = "Hello, " + "World!";

 

컴파일 후

String helloWorld = "Hello, World!";

 

따라서 런타임에 별도의 문자열 결합 연산을 수행하지 않기 때문에 성능이 향상됩니다.

 

 

String 변수 최적화

 

문자열 변수의 경우 그 안에 어떤 값이 들어있는지 컴파일 시점에는 알 수 없기 때문에 단순하게 합칠 수 있습니다.

String result = str1 + str2;

 

이런 경우 예를 들면 다음과 같이 최적화를 수행합니다. ( 최적화 방식은 자바 버전에 따라 달라진다)

String result = new StringBuilder().append(str1).append(str2).toString()

 

참고: 자바 9 부터는 StringConcatFactory를 사용해서 최적화를 수행한다.

 

이렇듯 자바가 최적화를 처리해주기 때문에 지금처럼 간단한 경우에는 StringBuilder를 사용하지 않고, 문자열 더하기 연산(+)을 사용하면 충분합니다.

 

 

String 최적화가 어려운 경우

 

다음과 같이 문자열을 루프 안에서 문자열을 더하는 경우에는 최적화가 이루어지지 않습니다.

public class LoopStringMain {

    public static void main(String[] args) {
        long startTime = System.currentTimeMillis();
        String result = "";
        for (int i = 0; i < 100000; i++) {
            result += "Hello Java ";
        }
        long endTime = System.currentTimeMillis();
        System.out.println("result = " + result);
        System.out.println("time = " + (endTime - startTime) + "ms");
    }
}
...
time = 6807ms

 

대략적으로 다음과 같이 최적화가 됩니다. (최적화 방식은 자바 버전에 따라 다르다)

String result = "";
        for (int i = 0; i < 100000; i++) {
            result = new StringBuilder().append(result).append("Hello Java ").toString();
        }

 

  • 반복문의 루프 내부에서는 최적화가 되는 것 처럼 보이지만, 반복 횟수만큼 객체를 생성해야 한다.
  • 반복문 내에서의 문자열 연결은, 런타임에 연결할 문자열의 개수와 내용이 결정된다.
  • 이런 경우, 컴파일러는 얼마나 많은 반복이 일어날지, 각 반복에서 문자열이 어떻게 변할지 예측할 수 없다.
  • 따라서, 이런 상황에서는 최적화가 어렵다.

 

StringBuilder는 물론이고, 아마도 대략 반복 횟수인 100,000번의  String 객체를 생성했을 것입니다.

이럴 때는 직접 StringBuilder를 사용하면 됩니다.

public class LoopStringBuilderMain {

    public static void main(String[] args) {
        long startTime = System.currentTimeMillis();
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < 100000; i++) {
            sb.append("Hello Java ");
        }
        String result = sb.toString();
        long endTime = System.currentTimeMillis();
        System.out.println("result = " + result);
        System.out.println("time = " + (endTime - startTime) + "ms");
    }
}
...
time = 6ms

 

 

StringBuilder를 직접 사용하는 것이 더 좋은 경우

  • 반복문에서 반복해서 문자를 연결할 때
  • 조건문을 통해 동적으로 문자열을 조합할 때
  • 복잡한 문자열의 특정 부분을 변경해야 할 때
  • 매우 긴 대용량 문자열을 다룰 때
참고: StringBuilder vs StringBuffer
StringBuilder 와 똑같은 기능을 수행하는 StringBuffer 클래스도 있다.
StringBuffer 는 내부에 동기화가 되어 있어서, 멀티 스레드 상황에 안전하지만 동기화 오버헤드로 인해 성능
이 느리다.
StringBuilder 는 멀티 쓰레드에 상황에 안전하지 않지만 동기화 오버헤드가 없으므로 속도가 빠르다.

 

 

 

메서드 체인닝(Method Chaining)

 

public class ValueAdder {

    private int value;

    public ValueAdder add(int addValue) {
        value += addValue;
        return this;
    }
    public int getValue() {
        return value;
    }
}
  • 단순히 값을 누적해서 더하는 기능을 제공하는 클래스이다.
  • add( ) 메서드를 호출할 때 마다 내부의 value 값을 누적한다.
  • add( ) 메서드를 보면 자기 자신(this)의 참조값을 반환한다.
public class MethodChainingMain1 {

    public static void main(String[] args) {
        ValueAdder adder = new ValueAdder();
        adder.add(1);
        adder.add(2);
        adder.add(3);

        int result = adder.getValue();
        System.out.println("result = " + result);
    }
}
  • add( ) 메서드를 여러번 호출해서 값을 누적해서 더하고 출력한다.
  • 여기서는 add( ) 메서드의 반환값은 사용하지 않았다.
public class MethodChainingMain2 {

    public static void main(String[] args) {
        ValueAdder adder = new ValueAdder();
        ValueAdder adder1 = adder.add(1);
        ValueAdder adder2 = adder.add(2);
        ValueAdder adder3 = adder.add(3);


        int result = adder3.getValue();
        System.out.println("result = " + result);

        System.out.println("result = " + adder);
        System.out.println("result = " + adder1);
        System.out.println("result = " + adder2);
        System.out.println("result = " + adder3);
    }
}

 

  1.  adder.add(1) 을 호출한다.
  2.  add( ) 메서드는 결과를 누적하고 자기 자신의 참조값인 this(x001)를 반환한다.
  3.  adder1 변수는 adder와 같은 x001를 참조한다.

  • add( ) 메서드는 자기 자신(this)의 참조값을 반환한다. 이 반환값을 adder1, adder2, adder3 에 보관했다.
  • 따라서 adder, adder1, adder2, adder3은 모두 같은 참조값을 사용한다. 왜냐하면 add( ) 메서드가 자기 자신(this) 의 참조값을 반환했기 떄문이다.

그런데 이 방식은 처음 방식보다 더 불편하고, 코드도 잘 읽히지 않습니다.

왜 이런 방식을 사용하는 걸까요?

public class MethodChainingMain3 {

    public static void main(String[] args) {
        ValueAdder adder = new ValueAdder();

        int result = adder.add(1).add(2).add(3).getValue();
        // int result = adder.x001(1).x001(2).add(3).getValue();
        System.out.println("result = " + result);
    }
}
  • add( ) 메서드를 호출하면 ValueAdder 인스턴스 자신의 참조값(x001)이 반환된다.
  • 이 반환된 참조값을 변수에 담아두지 않아도 된다.
  • 대신에 반환된 참조값을 즉시 사용해서 바로 메서드를 호출할 수 있다.

실행 순서

chainValue.add(1).add(2).add(3).getValue(); // value=0
x001.add(1).add(2).add(3).getValue(); // value=0, x001.add(1)을 호출하면 그 결과로 x001 반환
x001.add(2).add(3).getValue(); // value=1, x001.add(2)을 호출하면 그 결과로 x001 반환
x001.add(3).getValue(); // value=3, x001.add(3)을 호출하면 그 결과로 x001 반환
x001.getValue(); // value=6
6
  • 메서드 호출의 결과로 자기 자신의 참조값을 반환하면, 반환된 참조값을 사용해서 메서드 호출을 계속 이어갈 수 있다.
  • 메서드가 체인으로 연결된 것 처럼 보이는 이러한 기법은 메서드 체이닝이라고 한다.
  • 기존에는 메서드를 호출할 때 마다 계속 변수명에 . 찍어야 했다. 예) adder.add(1), adder.add(2)
  • 메서드 체이닝 방식은 메서드가 끝나는 시점에 바로 .을 찍어서 변수명을 생략할 수 있다.
  • 메서드 체이닝이 가능한 이유는 자기 자신의 참조값을 반환하기 때문이다.
  • 이 참조값에 .을 찍어서 바로 자신의 메서드를 호출할 수 있다.

 

StringBuilder와 메서드 체인

 

StringBuilder는 메서드 체이닝 기법을 제공합니다.

 

StringBuilder의 append( ) 메서드를 보면 자기 자신의 참조값을 반환합니다.

public StringBuilder append(String str) {
    super.append(str)
    return this;
}
  • StringBuilder에서 문자열을 변경하는 대부분의 메서드도 메서드 체이닝 기법을 제공하기 위해 자기 자신을 반환한다.

앞서 StringBuilder를 사용한 코드는 다음과 같이 개선할 수 있습니다.

public class StringBuilderMain1_2 {

    public static void main(String[] args) {
        StringBuilder sb = new StringBuilder();
        String string = sb.append("A").append("B").append("C").append("D")
                .insert(4, "Java")
                .delete(4, 8)
                .reverse()
                .toString();

        System.out.println("string = " + string);
    }
}
  • 자바의 라이브러리와 오픈 소스들은 메서드 방식을 종종 사용한다.