정렬된 상태를 파고드는 기술

크리스는 서버에서 받아온 '로그 데이터'를 시간순으로 정렬하는 작업을 하고 있다.

그런데 이 데이터는 특이하다. 이미 99%는 시간순으로 정렬되어 있고, 아주 가끔 늦게 도착한 로그 몇 개만 순서가 뒤섞여 있다.

"이미 거의 다 정렬되어 있는데, 버블 정렬이나 선택 정렬을 쓰면 처음부터 끝까지 다시 비교하느라 시간 낭비잖아?"

"중간에 낀 녀석만 쏙 뽑아서 제 자리에 끼워 넣으면(Insert) 끝나는 거 아닐까?"

그렇다. 우리가 카드 게임을 할 때 카드를 정리하는 방식, 그리고 데이터가 거의 정렬되어 있을 때 빛을 발하는 알고리즘. 바로 삽입 정렬(Insertion Sort)이다.

1. 카드 게임의 지혜

삽입 정렬의 로직은 아주 직관적이다.

우리가 손에 쥔 카드를 왼쪽부터 순서대로 정리한다고 상상해 보자.

두 번째 카드를 집는다. 첫 번째 카드와 비교한다. 더 작으면 왼쪽에, 크면 오른쪽에 둔다.

세 번째 카드를 집는다. 앞의 두 카드와 비교해서 들어갈 자리를 찾아 끼워 넣는다.

네 번째 카드를 집는다. 앞의 세 카드 사이의 적절한 위치에 끼워 넣는다.

핵심은 "앞부분은 이미 정렬되어 있다고 가정하고, 새로운 카드를 적절한 위치에 삽입한다"는 것이다.

2. 자바스크립트로 구현하기

구현의 핵심은 "뒤에서 앞으로(Backwards)" 비교한다는 점이다. 나보다 큰 녀석들은 한 칸씩 뒤로 밀어내고(Shift), 내가 들어갈 빈자리가 생기면 그곳에 안착한다.

javascript

function insertionSort(arr) {
  // 1. 두 번째 요소(i=1)부터 시작한다. (첫 번째는 이미 정렬됐다고 침)
  for (let i = 1; i < arr.length; i++) {
    let currentVal = arr[i]; // 현재 정리할 카드
    let j;

    // 2. 내 앞(j)의 카드들과 비교하며 뒤로 거슬러 올라간다.
    // 조건: j가 0보다 크거나 같고, 앞의 카드가 나(currentVal)보다 크면?
    for (j = i - 1; j >= 0 && arr[j] > currentVal; j--) {
      arr[j + 1] = arr[j]; // 앞의 카드를 한 칸 뒤로 밀어낸다. (Copy)
    }

    // 3. 반복문이 끝난 곳(나보다 작은 카드를 만난 곳) 바로 뒤에 앉는다.
    arr[j + 1] = currentVal;
    
    console.log(`Step {i}:`, arr); // 과정을 확인해보자
  }
  return arr;
}

insertionSort([2, 1, 9, 76, 4]);

3. 왜 '삽입 정렬'이 특별한가?

코드만 보면 이중 반복문이라 버블, 선택 정렬과 비슷해 보인다. 하지만 결정적인 차이가 있다.

스마트한 중단 (Smart Break)

버블 정렬과 선택 정렬은 조건에 상관없이 무조건 끝까지 비교한다.

하지만 삽입 정렬은 내부 루프(j)를 돌다가 나보다 작은 값을 만나면 그 즉시 멈춘다. 내 앞은 이미 정렬되어 있으니 더 볼 필요가 없기 때문이다.

최고의 시나리오: O(N)

만약 데이터가 이미 정렬되어 있다면?

삽입 정렬은 각 요소를 한 번씩만 확인하고 "어? 내 앞이 나보다 작네? 그럼 난 여기 있으면 되겠다"하고 바로 넘어간다.

이때의 시간 복잡도는 O(N)이다. 버블, 선택 정렬(O(N^2))과는 비교도 안 되게 빠르다.

실시간 데이터 처리 (Online Algorithm)

데이터가 한 번에 주어지는 게 아니라, 실시간으로 하나씩 들어오는 상황(라이브 스트리밍 채팅 등)에서도 유용하다. 데이터가 들어올 때마다 제자리를 찾아 꽂아주면 되기 때문이다.

4. 단점은 없을까?

물론 만능은 아니다.

데이터가 역순(Reverse)으로 정렬되어 있다면 최악이다.

[5, 4, 3, 2, 1]을 정렬하려면 모든 요소를 매번 맨 앞까지 이동시켜야 하므로 O(N^2)의 시간이 걸린다. 데이터가 무작위로 섞여 있을 때도 평균적으로 O(N^2)이다.

핵심 정리

원리: 정렬된 앞부분 영역에 새로운 데이터를 적절한 위치에 '삽입'한다.

시간 복잡도:

특징: 데이터가 거의 정렬되어 있을 때 현존하는 알고리즘 중 가장 빠르다. 안정 정렬(Stable Sort)이다.

지금까지 배운 세 가지 정렬(버블, 선택, 삽입)은 구현이 쉽지만, 데이터가 10만 개만 넘어가도 느려서 못 쓴다.

이제부터는 차원이 다른 속도를 보여주는 O(N log N)의 세계로 진입한다.

"데이터를 쪼개면 빨라진다"는 분할 정복(Divide and Conquer)의 마법.

그 첫 번째 주자, 합병 정렬(Merge Sort)을 만나보자.

🔗 참고 링크

VisuAlgo - Insertion Sort

Insertion Sort - GeeksforGeeks

정렬된 상태를 파고드는 기술

1. 카드 게임의 지혜

2. 자바스크립트로 구현하기

3. 왜 '삽입 정렬'이 특별한가?

스마트한 중단 (Smart Break)

최고의 시나리오: O(N)

실시간 데이터 처리 (Online Algorithm)

4. 단점은 없을까?

핵심 정리

🔗 참고 링크

댓글 (0)

Javascript Algorithm의 다른 글

기억력 좋은 알고리즘의 비밀

가성비 최고의 네트워크 구축하기

너비 우선 탐색은 가까운 곳부터 챙기기

막다른 길까지 파고드는 깊이 우선 탐색

이진 탐색은 업다운 게임의 필승 전략

선형 탐색은 맨땅에 헤딩하기

sort함수의 비밀과 주의점

비교하지 않는 정렬의 마법

우선순위 큐의 비밀

빠르지만 까칠한 천재

쪼개고 합치면 빨라진다

최솟값을 찾는 끈기

가장 기초적이나 비효율적인 정렬

정렬 알고리즘은 단순히 줄 세우기가 아니다

실전 코드를 빅오 표현법으로 표현하기

속도만큼 중요한 메모리 공간

알고리즘의 성능 성적표

자바스크립트의 편리함 뒤에 숨겨진 비용

개발자가 코딩 테스트 너머를 봐야 하는 이유