CS/알고리즘_[교재]이것이 취업을 위한 코딩테스트다

[PART2] CH.05_DFS/BFS

Jedy_Kim 2021. 6. 13. 23:53
728x90

1. 꼭 필요한 자료구조 기초

 탐색이란 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정을 의미한다. 프로그래밍에서는 그래프, 트리 등의 자료구조 안에서 탐색을 하는 문제를 자주 다룬다. 대표적인 탐색 알고리즘으로 DFS와 BFS를 꼽을 수 있다. 그런데 DFS와 BFS를 이해하기 위해서는 스택과 큐에 대한 이해가 전제되어야 하므로 사전 학습으로 스택과 큐, 재귀 함수를 먼저 알아보자.

 

자료구조란 '데이터를 표현하고 관리하고 처리하기 위한 구조'를 의미한다. 그중 스택과 큐는 자료구조의 기초 개념으로 다음의 두 핵심적인 함수로 구성된다.

  • 삽입(push) : 데이터를 삽입한다.
  • 삭제(pop)  :데이터를 삭제한다.

- 스택 : 후입선출(Last In Last Out : LIFO)

1
2
3
4
5
6
7
8
9
10
11
12
13
stack = []
 
stack.append(5#삽입
stack.append(2)
stack.append(3)
stack.append(7)
stack.pop() # 삭제
stack.append(1)
stack.append(4)
 
print(stack)
print(stack[::-1]) # 역으로 출력
 
cs

- 큐 : 선입선출(First In First Out : FIFO)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
from collections import deque
 
deq = deque()
 
deq.append(5)
deq.append(2)
deq.append(3)
deq.append(7)
deq.popleft()
deq.append(1)
deq.append(4)
 
print(deq)
deq.reverse()
print(deq)
cs

- 재귀함수 : 자기 자신을 다시 호출하는 함수. if문을 이용하여 꼭 종료 조건을 구현해주어야 한다.

1
2
3
4
5
6
7
8
9
10
11
 
def recursive_function(x):
  print('hi')
  if x == 100return
 
  print(x, '번째 재귀 함수에서', x+1'번째 재귀 함수를 호출합니다.')
  recursive_function(x+1)
  print(x, '번째 재귀 함수를 종료합니다.')
 
recursive_function(1)
 
cs

 

2. DFS(Depth-First Search, 깊이 우선 탐색)

그래프의 깊은 부분을 우선적으로 탐색하는 알고리즘이다. DFS를 설명하기 전에 머저 그래프의 기본 구조를 알아야 한다.

그래프는 노드(node)와 간선(edge)으로 표현되면 이때 노드를 정점(vertex)이라고도 말한다.

 

       [노드]

        /      \   (<-간선)

      /          \

 [노드]    [노드]

 

그래프의 탐새이란 하나의 노드를 시작으로 다수의 노를 방문하는 것을 말한다. 또한 두 노드가 간선으로 연결되어 있다면 '두 노드는 인접하다(Adjacent)'라고 표현한다.

 

                 [0]

                /     \                      0     1     2

              7      5              0    0     7     5

             /          \                 7     0    무한

          [1]         [2]          2    5   무한  0

 

  • 인접행렬(Adjacency Matrix) :  2차원 배열로 그래프의 연결 관계를 표현하는 방식
  • 인접리스트(Adjacency List): 리스트로 그래프의 연결 관계를 표현하는 방식

먼저 인접  행렬 방식은 2차원 배열에 각 노드가 연결된 형태를 기록하는 방식이다. 연결이 되어 있지 않은 노드끼리는 무한의 비용이라고 작성한다.

#인접 행렬 방식 예제

1
2
3
4
5
6
7
8
9
INF = 1e9 # 무한의 비용 선언
 
graph = [
  [075],
  [70, INF],
  [5, INF, 0]
]
 
print(graph)
cs

 

인접리스트 방식에서는 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장한다. 또 '연결리스트'라는 자료구조를 통해 구현한다.

0 -> 1[7], 2[5]

1 -> 0[7]

2 -> 0[5]

#인접 리스트 방식

1
2
3
4
5
6
7
8
9
10
11
12
# 행(row)이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]
 
# 노드 0에 연결된 노드 정보 저장(노드, 거리)
graph[0].append((17))
graph[0].append((25))
# 노드 1에 연결된 노드 정보 저장(노드, 거리)
graph[1].append((07))
# 노드 2에 연결된 노드 정보 저장(노드, 거리)
graph[2].append((05))
 
print(graph)
cs

 

두 방식의 차이를 메모리와 속도 측면에서 살펴보자. 에모리 측면에서 보자면 인접 행렬 방식은 모든 관계를 저장하므로 노드 개수가 많을수록 메모리가 불필요하게 낭비된다. 반면에 인접 리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다. 하지만 이와 같은 속성 때문에 인접 리스트 방식은 인접 행렬 방식에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느리다. 인접 리스트 방식에서는 연결된 데이터를 하나씩 확인해야 하기 때문이다.

 

또 다른 예시로 한 그래프에서 노드 1과 7이 연결되어 있는 상황을 생각해보자. 인접 행렬 방식에서는 graph[1][7]만 확인하면 된다. 반면에 인접 리스트 방식에서는 노드 1에 대한 인접 리스트를 앞에서부터 차례대로 확인해야 한다. 그러므로 특정한 노드와 연결된 모든 인접 노드를 순회해야 하는 경우, 인접 리스트 방식이 인접 행렬 방식에 비해 메모리 공간의 낭비가 적다.

 

DFS는 스택 자료구조를 이용하며 구체적인 동작 과정은 다음과 같다.

  1. 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다.
  2. 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
  3.  1번과 2번의 과정을 더 이상 반복할 수 없을 때까지 반복한다

결과적으로 노드의 탐색 순서(스택에 들어간 순서)는 다음과 같다.

1 -> 2 -> 7 -> 6 -> 8 -> 3 -> 4 -> 5

깊이 우선 탐색은 스택 자료구조에 기초한다는 점에서 구현이 간단하다. 시간복잡도는 O(N)이다.

 

# DFS예제

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
 
def DFS(graph, v, visited):
  visited[v] = True
  print(v, end=' ')
 
  for i in graph[v]:
    if not visited[i]:
      DFS(graph, i, visited)
 
if __name__ == "__main__":
  # 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원)
  graph =[
    [],
    [238],
    [17],
    [145],
    [35],
    [34],
    [7],
    [268],
    [17]
  ]
  # 각 노드가 방문된 정보를 리스트 자료형으로 표현
  visited = [False]*9
  # 정의된 DFS함수 호출
  DFS(graph, 1, visited)
cs

 

3. BFS(Breadth-First Search, 너비 우선 탐색)

너비 우선 탐색 알고리즘은 가까운 노드부터 탐색하는 알고리즘이다. BFS 구현에서는 선입선출 방식인 큐 자료구조를 이용하는 것이 정석이다. 인접한 노드를 반복적으로 큐에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어온 것이 먼저 나가게 되어, 가까운 노드부터 탐색을 진행하게 된다. 

알고리즘의 정확한 동작 방식은 다음과 같다.

  1. 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.
  2. 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리를 한다.
  3. 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.

결과적으로 노드의 탐색 순서(큐에 들어간 순서)는 다음과 같다.

1 -> 2 -> 3 -> 8 -> 7 -> 4 -> 5 -> 6

너비 우선 탐색 알고리즘 BFS는 큐 자료구조에 기초 한다는 점에서 구현이 간단하다. 시간복잡도는 O(N)이다.

#구현

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
from collections import deque
 
def BFS(graph, start, visited):
 
  deq = deque([start])
  visited[start] = True
  while deq:
    v = deq.popleft()
    print(v, end=' ')
    for i in graph[v]:
      if not visited[i]:
        deq.append(i)
        visited[i] = True
 
 
if __name__ == "__main__":
  # 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원)
  graph =[
    [],
    [238],
    [17],
    [145],
    [35],
    [34],
    [7],
    [268],
    [17]
  ]
  # 각 노드가 방문된 정보를 리스트 자료형으로 표현
  visited = [False]*9
  # 정의된 DFS함수 호출
  BFS(graph, 1, visited)
cs

 

 

 

 

실전문제

 

  • 음료수 얼려먹기

#코드

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
import sys
 
def dfs(row, col):
  global visited, arr, n, m 
  
  if row <= -1 or row >= n or col <= -1 or col >= m:
    return False
  if visited[row][col] == False and arr[row][col] == 0:
    visited[row][col] = True
 
    dy = [-1100]
    dx = [00-11]
    for i in range(4):
      nRow = row + dy[i]
      nCol = col + dx[i]
      dfs(nRow, nCol)
    return True
  else:
    return False   
  
 
 
if __name__ == "__main__":
  input = sys.stdin.readline
  n, m    = map(int, input().split())
  arr     = [list(map(int, input().split())) for _ in range(n)] 
  visited = [[False]*for _ in range(n)]
 
  result = 0
  for i in range(n):
    for j in range(m): 
      if dfs(i, j):
        result += 1
  print(result)
cs

 

 

실전문제

 

  • 미로 탈출

#코드

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
import sys
from collections import deque
 
  
def bfs():
  global arr, matrix, visited
  deq = deque()
  deq.append((0,0))
  visited[0][0= True
 
  while deq:
    row, col = deq.popleft()
    print(row, col)
    dy = [-1100]
    dx = [00-11]
    for i in range(4):
      nRow = row + dy[i]
      nCol = col + dx[i]
      if nRow >= 0 and nRow < n and nCol >= 0 and nCol < m and visited[nRow][nCol] == False and arr[nRow][nCol] == 1:
     
        visited[nRow][nCol] = True
        deq.append((nRow, nCol))
        matrix[nRow][nCol] = matrix[row][col] + 1 
 
if __name__ == "__main__":
  input = sys.stdin.readline
  n, m    = map(int, input().split())
  arr     = [list(map(int, input().split())) for _ in range(n)] 
  matrix  = [[1]*for _ in range(n)]
  visited = [[False]*for _ in range(n)]
 
  bfs() 
  print(matrix[n-1][m-1])
cs
반응형