On the journey of

[Quantitive Trading] Market anomalies in the korean stock market 본문

Experiences & Study/Quant & Finance

[Quantitive Trading] Market anomalies in the korean stock market

dlrpskdi 2023. 11. 1. 16:29

Original Paper ) https://www.emerald.com/insight/content/doi/10.1108/JDQS-03-2020-0004/full/html

 

Market anomalies in the Korean stock market | Emerald Insight

Abstract This paper aims to replicate 148 anomalies and to examine whether the performance of the Korean market anomalies is statistically and economically significant. First, the authors observe that only 37.8% anomalies in the universe of the KOSPI and t

www.emerald.com

* 본 논문은 FIND-A Quantitive Trading Session 준비를 위해 작성한 글입니다 ....


영문으로 작성되어 있지만, 한국의 대학원생 분들께서 작성하신 논문이다. 대부분의 논문이 그렇듯, 레퍼런스 및 인덱스가 굉장히 길고(거의 절반이다) 특이하게도 표가 차지하는 분량이 꽤나 길다. 때문에 이를 제외한 부분을 간단히 리뷰해 보고자 한다. 


 

Abstract

우선 148개의 이상 수익률을 재현하여 한국 시장 이상수익률의 성과가 통계/경제적으로 유의미한지 검정하는 것이 목표이자, 이 논문의 핵심이라고 볼 수 있다. 이에, 저자들은 코스피와 코스닥 및 가치가중 포트폴리오 상에서의 전체 이상치를 검정하였는데, 이 중 37.8%만이 유의한 t통계량을 가지고 있음을 밝혔다. threshold, 즉 기준값을 높이게 되면(t통계량 절댓값 기준 2.78) 148개로 줄어든다. 

또한, 저자들은 표본에 코스닥 종목을 포함했는지 여부, 동일한 가중치를 사용했는지 여부 등에 따라 결과가 크게 달라진다는 사실을 기반으로, 데이터마이닝이 이상 수익률(비정상적 수익률)의 결정계수를 높임을 유추하였다. 즉, 데이터 마이닝 부분이 설명하는 영역이 넓다는 것. 실제로 키워드에 데이터마이닝이 있다!

소개(Introduction)

현재 자산운용시장은 대형 기관투자자를 중심으로 자산기반 투자에서 팩터 기반으로 전환되는 트렌드이다. 이런 트렌드 속, '스마트 베타(Beta) 전략'은 시장의 여러 변수를 기반으로 포트폴리오를 구성하는 전략으로, 펀드 투자에서 자주 사용되는 전략으로 자리매김하였다. 실제로 2017년 말 기준 미국에는 약 1000개의 스마트 베타 ETF가 있으며 시가총액은 9990억 달러를 넘긴 바 있다. 한국도 다르지 않다 : 2019년 3월 기준 1조 2000억 원을 넘어섰고, 비중이 차츰 높아지고 있는 추세이다. 이런 추세이기에, 시장의 '이변'에 기반한 요소 및 전략이 제공하는 프리미엄, 유의함을 알아내는 본 논문이 의의가 있다고 할 수 있다. 

본론

대한민국뿐 아니라 다른 나라에서도 금융 시장에서의 이상 징후 연구는 활발해지고 있지만, 이상값을 '종합적으로' 분석하는 연구는 미흡하며, 국내 시장에서의 이상 징후 조사는 실시되지 않았다. 이에, 본 연구자들은 선행연구에서 추출한 한국 시장의 148개 이상 징후를 재현하여 검정을 진행하고자 하였다. Microcap에 따라 결과가 어떻게 달라지는지 또한 여기서 연구하는데, 이를 위해 코스피'만'을 포함한 표본의 결과와 코스피, 코스닥을 '모두 포함'한 전체 표본의 결과를 비교한다. 

또한, 앞서 말한 '가중치'를 위해 가치가중법(VW)과 동일가중법(EW)의 영향도 검증 대상이 된다. 

- 마이크로캡의 주가는 주식 시장 전체 기업 수에서는 비중이 크지만, 시가총액 상 비중이 현저히 낮다. 또한 이런 기업들은 대개 유동성이 작고 거래비용이 높아 '마이크로캡 효과(작은 기업들이 주식 시장에서 단기적으로 초과 수익을 얻을 가능성이 있다는 효과)'로 오해받을 수 있기에, 포트폴리오 구성 및 테스트 때 VW방법을 사용하려는 것.

 

연구 결과

요약하자면, 폭스바겐 포트폴리오를 기준으로 한 실험을 보자. 

- 코스피, 코스닥을 모두 포함하는 전체 표본에서 단일검정 기준치(1.96)을 초과하는 이상치는 37.8% (57/148) . Harvey가 제시한 Cutoff T통계량 2.78을 적용하면 27.7% (41/148)만이 복제된다. 

- 표본을 코스피'만'으로 한정할 경우 VW 방법 및 threshold 1.96 하에서 29.7% (44/148), t통계량 2.78 하에서는 15/148(10.1%)이 복제된다.

- VW, EW 방법을 비교했을 때 이상현상 기반 EW 포트폴리오의 수익률이 더 좋았고, T통계량 또한 더 높았다. 

 이를 종합했을 때, 가치/모멘텀과 관련된 이상 징후는 상대적으로 잘 복제되고 있으나, 투자/수익성/무형자산 등 변칙 기반 수익률은 유의하지 않고, 복제도 잘 되고 있지 않다고 할 수 있다. 

또한, 마이크로캡(시가총액이 작은 기업들)은 수익률 테스트 시 결과를 왜곡할 가능성이 있다. 당장 위 실험에서, 코스피에 상장된 기업들로만 구성된 표본의 경우와 아닌 경우의 결과는 크게 달랐기 때문. 

 

보완점

앞서 전 세계젹으로도 아직 이상치(이상 징후)에 대한 연구가 부족한 실정이라고 적었다. 그러나 그 중에서, 우리나라는 건수 자체가 부족할 뿐 아니라 기존 연구들은 Value, Trading Frictions, Momentum 등에 크게 편향(biased)되기까지 하기에 연구가 더 필요하다. 특히 무형자산에 기반한 이상치 trading(매매)를 다룬 연구는 2건뿐이기에, 해외에서는 '비교적' 어느 정도 연구된 분야인 만큼 따라잡을 필요가 있다. 


논문이 이렇게 간단하게 끝날 리가 없지. 그러나 4.2.1~4는 유의한 통계량에 대한 얘기가 대부분이다. 여튼, 이상값들에 대해 좀더 자세히 알아보는 섹션(본론2). 

4.2.1 가치와 관련된 이상값

가치와 관련된 이상 현상 중 대부분(9/13)이 t통계 절댓값인 1.96을 초과한다 (= 통계적으로 유의미하다). 기본적으로 연구 건수가 많기 때문에 이러한 해석도 가능한 것으로 보이며, 가장 높은 이상치는 월 평균 2.067%의 수익률을 보였다. 그 외 시장(Bmj ; 장부가 대비 6월말 시장, Bm ; 장부가 대비 시장, Am ; 자산 대비 시장)에서도 t통계량이 4.00을 초과하면서 유의함을 입증하였다. 

4.2.2 수익성 및 투자 관련 이상값

수익성 관련 이상치 중 지연자산(장기적으로 현금화되는 자산) 대비 영업이익(Ola)만 유의하다. 그 외 투자 관련 이사이 중에서는 Pta(총발생액 비율), Cei(복합주식발행액), Oa(영업발생액), Pda(재량발생액), dBe(장부가액) 등의 통계량이 유의한 것으로 나타났는데 이중 특히 Cei는 월평균 약 1.657%의 수익률을 보였다. 그 뒤는 Pta(1.208%). 

4.2.3 무형자산 관련 이상치

여기서는 Adm(시장 대비 광고비) ,Rdm(시장 대비 R&D 비용), Age List(기업연령), dSa(매출 변동률-미수금 변동률) 이 유의미한 것으로 밝혀졌다. 이 중 수익률은 Rdm이 가장 높았고, 가장 낮은 건 dSa였다. 

4.2.4 모멘텀 관련 이상치

모멘텀과 관련된 이상치 15개가 있으면, 이중 10개가 통계적으로 유의한 것으로 밝혀졌다. 이 10개를 어떻게 표기했냐 하면 R^6 6(6개월 모멘텀, 6개월 보유) / 52w12 (52주 고가 모멘텀, 12개월 보유), e^6 6(6개월 잔여 모멘텀, 6개월 보유), 이런 식으로 표기하였다. 이중 52주 고가 모멘텀을 12개월간 보유한 52w12의 수익률이 가장 높았다.


그렇다면 마이크로캡 얘기로 넘어가보자. 

4.3 마이크로캡이 이상치 추정에 미치는 영향 : EW(동일 가중 포트폴리오) 와 코스피 종목만 포함된 case

이 경우 마이크로캡이 이상수익률 예측에 미치는 영향을 살펴보는데, 

아래 표는 코스피 종목만 포함된 표본의 '이상수익률'을 정리한 표이다. 결과적으로 보았을 때, 코스피 표본의 이상수익률이 전반적으로 전체 표본보다는 낮게 추정(ex.trading friction 관련 이상치인 Tur1 또한 감소하였음)되며, FF(Fama French) 모형의 절편 또한 감소한다. 그리고 t통계량의 절댓값 기준을 1.96에서 2.78로 높이면 이를 초과하는 이상 징후는 없다. 


표의 늪을 지나 마이크로캡으로 다시 돌아왔을 때, 우리는 마이크로캡에 상대적으로 더 높은 가중치를 부여하면 이상치가 더 많이 발생할 것이라고 생각할 수 있다. 이와 더불어, 통계적으로 유의미한 이상치의 수 자체도 증가한다. 특히 투자 관련 이상징후의 경우 표본을 코스피 종목으로만 정했을 때 1.96 기준값 기준 7/29개가 유의미하엿지만, 전체 표본에서는 20/29개가 유의미했다. 즉, 코스피+코스닥을 포함하는지 그 여부에 따라 발생하는 차의에도 유의해야 한다는 것.

 

* 추가적으로, 본 논문의 마지막 부분은 PCA를 진행한 결과로, t통계량이 1.96을 초과하는 58개 이상치를 대상으로 주성분 분석을 진행한 결과이다. PC1이 설명하는 분산 비중은 약 37.18%로 가장 높지만, 동시에 무형자산/투자 관련 이상치도 가장 낮은 결과를 냈다. 


 마이크로캡이 이상치를 추정하는 데 미치는 영향에 대한 연구 또한 진행될 필요가 있다. EW와 VW 간의 차이(수익률과 t통계량은 EW가 더 높았고), 전체 표본과 코스피만 포함하는 표본의 차이가 본 논문의 핵심 차이였기에 이 차이에 대해 집중할 필요가 있다는 결론이다.