하둡은 노드 간에 정보를 주고 받거나,
클라이언트가 Hadoop Cluster(HDFS)와 통신하기 위해 RPC 를 사용함.
클라이언트가 Hadoop 클러스터와 상호 작용하는 가장 일반적인 방법은 RPC를 사용하는 것임.
클라이언트는 RPC 프로토콜을 통해 NameNode에 연결하여 파일을 읽거나 씀 (출처)
RPC 란, Remote Procedure Call 의 약자로, 한글로는 원격 프로시저 호출이라고 함.
(Hadoop 과 상관 없이) 일반적으로 RPC (원격 프로시저 호출)는 프로세스 간 통신 기술이다.
별도의 원격 제어를 위한 코딩 없이,
다른 주소 공간에서 함수나 프로시저를 실행할 수 있게하는 프로세스 간 통신 기술임!
Hadoop 에서 이 RPC 통신 기술을 채용하여
클라이언트와 Hadoop 클러스터 간 통신(메시지 데이터를 전달하기 위한 통신)에 사용하고 있는 것.
https://www.guru99.com/remote-procedure-call-rpc.html
상호 미리 정의된 규격을 준수하여
원격에서 동작하고 있는 프로세스에 포함된 함수를 호출 가능하게 하는 프로세스 간 통신기술
일반적으로 프로세스는 자신의 주소공간안에 존재하는 함수를 호출하여 실행가능하지만,
RPC를 이용하면 다른 주소공간에서 동작하는 프로세스의 함수를 실행할 수 있게 됨
쉽게 말해, 다른 노드(서버)에서 동작중인 프로세스의 함수를 실행하고 그 결과를 받아올 수 있다.
여기에, 다른 노드(서버)의 함수를 RPC 를 이용하여 호출하는 예제가 있다.
분산 컴퓨팅 환경에서 프로세스 간 상호 통신 및 컴퓨팅 자원의 효율적인 사용을 위하여 발전된 기술
https://leejonggun.tistory.com/9
프로시저란 ?
프로그래밍에서, 프로시저는 루틴이나, 서브루틴 및 함수와 같은 뜻이다. 하나의 프로시저는 특정 작업을 수행하기 위한 프로그램의 일부이다.
일반적인 의미의 프로시저란, 어떤 행동을 수행하기 위한 일련의 작업 순서를 말한다.
http://www.terms.co.kr/procedure.htm
https://nesoy.github.io/articles/2019-07/RPC
https://cwiki.apache.org/confluence/display/HADOOP2/HadoopRpc
'Hadoop' 카테고리의 다른 글
[Hadoop] Balancer vs Diskbalancer 차이를 이제 알겠다 (2) | 2020.08.17 |
---|---|
[Hadoop] 하둡 스트리밍에 대한 설명 링크 (0) | 2020.07.31 |
[Hadoop] 하둡 완벽 가이드 필기 - HDFS (0) | 2020.07.29 |
[Hadoop] Block Size 와 Split Size (0) | 2020.07.29 |
[Hadoop] 하둡 완벽 가이드 필기 - YARN (0) | 2020.07.29 |