DanielLab

  • 홈
  • 태그
  • 방명록

2026/01/11 1

[spark] driver

Spark 에서의 driver 가 무엇이고 어떤 역할을 하는지 간단하게 정리해 보려 한다. Spark 는 기본적으로 분산 처리 프레임워크다. 하지만 분산되지 않는것도 있는데, 그중 하나가 Driver 이다. Spark 애플리케이션에는 반드시 하나의 driver 프로세스가 존재한다. spark-submit 이나 spark-shell 을 실행하면 가장 먼저 driver JVM 이 올라간다. 이 프로세스가 엔지니어가 작성한 main 한수가 실행되는 공간이다. 즉, 엔지니어가 작성한 Spark 코드 자체는 driver 에서 실행된다. driver 의 가장 중요한 역할 중 하나는 작업 계획을 세우는 것이다. RDD나 DataFrame 에 대해 map, filter 같은 연산을 호출하면 즉시 실행되는 것이 아니라..

tech/spark 2026.01.11
이전
1
다음
더보기
프로필사진

DanielLab

평범한 소프트웨어 엔지니어

  • 분류 전체보기 (50)
    • tech (29)
      • k8s (2)
      • 생각 (2)
      • database (12)
      • network (2)
      • 보안&인증 (3)
      • architecture (4)
      • 이슈처리기록 (1)
      • Linux (1)
      • spark (1)
      • programming language (1)
    • AI (0)

Tag

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/01   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바