목록분산 (2)
On the journey of

Graph X 그래프를 조작하고 ex) SNS 친구 관계 그래프, 경로 등 그래프 병렬 연산을 수행하기 위한 라이브러리 분석, 연결 탐색 등 표준 그래프 알고리즘을 제공 커뮤니티 사용자들이 기여한 PageRank, 삼각 집계 등의 알고리즘도 포함 아파치 스파크의 분산 실행 스파크는 분산 데이터 처리 엔진이며, 각 컴포넌트들이 클러스터의 머신들 위에서 협업해 동작한다 아파치 스파크 컴포넌트와 아키텍처 [이미지 출처 blog.knoldus.com] 하나의 스파크 애플리케이션은 스파크 클러스터의 병렬 작업들을 조율하는 하나의 드라이버 프로그램으로 이루어진다. 드라이버는 SparkSession 객체를 통해 클러스터의 분산 컴포넌트(executor)에 접근한다. ✨아파치 스파크 컴포넌트 1. 스파크 드라이버 Sp..

3.1 Motivation for Multiple Regression 두 개의 독립 변수가 있는 모형 일반적으로 우리는 두 개의 독립적인 변수를 가진 모델을 다음과 같이 쓸 수 있다. B0 : 절편 B1 : 다른 요인을 고정한 상태에서 독립변수 x1 에 대한 y의 변화를 측정 B2 : 다른 요인을 고정한 상태에서 독립변수 x2 에 대한 y의 변화를 측정 u : 오차 K개의 독립 변수가 있는 모형 B0 : 절편 B1~Bk: 독립변수 xn 와 연관된 매개변수(기울기라고 언급하기도 함) * 다중 회귀분석을 위한 용어 Y : 종속변수, 설명변수, 반응변수, 예측 변수 X : 독립변수, 설명변수, 제어변수, 예측 변수 - 다중회귀분석은 복수의 요인이 상호 연관되어 있는 경우에도 인과 관계를 추론할수있고 변수 간의..