◆ 데이터 레이크는 펜타호(Pentaho)의 최고기술책임자(CTO) 제임스 딕슨이 처음 언급한 용어로 각 데이터를 가공 없이 모아놓고 이를 적절하게 활용하도록 미리 준비해둔 상태를 총칭한다.

최근에는 기업마다 빅데이터에 대한 활용도가 높아지며 각종 빅데이터를 확장하고 관리, 통제하는 데에 가장 필요한 시스템으로 데이터 레이크가 주목받고 있다.

즉 빅데이터를 분석하기 이전에 최대한 데이터를 모아두고 적절하게 활용되도록 하는 창고 역할을 하는 것이 바로 데이터 레이크라 할 수 있다.

또한 이 시스템은 정보의 저장에 그치지 않고 통계적 모델을 사용해 유의미한 상관관계와 패턴을 추출하는 데도 활용돼 빅데이터를 구축하는데 가장 효율적인 방안으로 떠오르고 있다.

세계 25개 항공사가 GE와 피보탈의 데이터 레이크 시스템을 통해 데이터를 관리하고 항공기 운용과 유지 관리 효율성을 향상하고 있다.

넷플릭스 역시 시청자가 원하는 적절한 콘텐츠를 추천하는 '시네 매치' 알고리즘 구현에 데이터 레이크를 활용하고 있다.

최근 롯데그룹이 거대 ICT 기업 네이버와 카카오에 대항하기 위해 계열사별로 관리하던 소비 데이터를 그룹 차원에서 한데 묶어 분석하고 맞춤형 서비스를 선보이겠다고 선언하며 데이터 레이크 구축을 전면에 내세웠다.

향후 다른 유통 대기업들도 계열사별로 흩어져 있는 유의미한 정보들을 데이터 레이크 형태로 한데 모아 시너지 효과를 내는데 집중할 것으로 전망된다.(자산운용부 변명섭 기자)

msbyun@yna.co.kr

(끝)

본 기사는 인포맥스 금융정보 단말기에서 07시 30분에 서비스된 기사입니다.
저작권자 © 연합인포맥스 무단전재 및 재배포 금지