교토대학의 우메노 켄 교수와 신타니 켄 석사과정 학생들은 전세계의 다양한 빅데이터에 나타나는 '해야 할 법칙'의 보편성을 설명하는 새로운 통계법칙을 발견했다.이 통계법칙은 「초일반화 중심극한정리」라고 부를 수 있는 것으로, 데이터상에 보편적으로 나타난다고 한다.이에 따라 세계의 다양한 현상의 통계 모델 구축이 기대된다.
종래, 통계학에서 이용되는 데이터 해석에서는 기본적인 통계칙으로서 중심극 한정리나 일반화 중심극 한정리가 이용되어 왔다.그러나 금융시장의 주가변동이나 환율변동과 같은 가격변동분포, 지진이 일어나는 간격 등의 확률통계분포, 그리고 인터넷 트래픽 등의 빅데이터에서는 개별적으로 다른 법칙분포의 합에 있어서도 어떤 기본형이어야 한다. 규칙 (레위의 안정 분포)이된다는 현상이 보인다.이것은 종래의 극한정리로는 파악할 수 없고, 그러한 현상이 나타나는 이유는 불명했다.
이번 연구에서는 현실의 데이터를 반영한 종래의 통계 법칙인 극한한 이론으로는 파악할 수 없는 서로 다른 분포를 개별적으로 가지는 독립적인 확률 변수의 합이라는 통계 모델을 정식화했다.그 후, 데이터의 수 N을 무한하게하는 극한에서 레비의 안정 분포에 수렴하는 극한 제한 이를 도출했다.
이 극한한이리는 통계학의 기본법칙인 중심극한정이를 법칙으로 일반화한 일반화 중심극한정리를 더욱 다른 법칙의 합의 극한으로 확장한 것으로, 라고 부를 수 있다.보다 일반화된 상황에서도 성립하는 극한정리로서의 통계학적 의의가 있음과 동시에, 현실세계의 도처에 나타나야 할 법칙의 보편성을 나타내는 빅데이터의 특징을 정확하게 기술하는 기본통계법으로서의 의의도 가진다고 생각된다.