IEEL – 이탈리아 은행 운용 환경

16년도에, 다목적용도의 파일시스템으로 IEEL을 도입하여 사용하고 있는 사례에 관련하여 간략하게 설명 하고자 합니다. 12년도부터 꾸준히 Lustre를 사용하면서, 계속 확장을 해나가고 있는데요, 초기 도입목적으로 HPC환경을 위한 파일 시스템으로 도입을 했고, 이후엔 big data/hadoop 까지 업무를 확장 후에는 Windows 환경까지 연동해서 사용하고 있습니다.

The democratization of high performance computing (HPC) and the converged datacenter have been topics of late in the IT community. This is where HPC, high performance data analytics (big data/Hadoop workloads), and enterprise office applications all run on a common clustered compute architecture with a single file system and network. And, while the IT community is talking about convergence, Banca d’Italia (Bank of Italy) has already moved in that direction with new compute and storage clusters based on Intel Xeon processors and Intel Enterprise Edition for Lustre software.

아래는 지금까지 구성된 상세 다이어그램으로, 각 WAN 구간의 외부 사이트는 10Gbps로 연동 되어 있고, MDS 2대, OSS 6대 , IML 1대 , CIFS GW 2대 이렇게 IEEL 구성이 되어 있으며, Linux Client 의 환경에서는 Native Lustre Client를 사용하고, Windows 환경에서는 CIFS GW CTDB Cluster를 통해서 IEEL 볼륨을 Access 할수 있도록 하고 있다.

아래는 위의 HW 구성에서, WAN 구간을 고려하여, Lustre 버젼에 따른 성능을 정리한 테이블인데요, Far Site 를 보면, Write는 300~400MB/s 정도 이고, Read는 900~1000MB/sec 정도(10Gbps NIC의 성능을 거의 다 사용하고 있는거죠) 를 보이고 있습니다. IOzone의 읽기는 10Gbps WAN 구간에서 말도 안되는 3607MB/sec으로 보이는데, 이것은 IO Cache 부문의 메모리를 활용한 성능이기 때문에, (Direct IO 가 아닌거죠) Network 구간의 실성능을 넘어서고 있는거죠. 그러나 Iozone의 Write 성능은 10Gbps NIC의 성능을 최대한 사용하고 있는것으로 보여주고 있습니다.

HPC  및 Enterprise Office 환경의 다목적 인프라 통합으로, SAN기반의 20TB 볼륨의 확장도 안되는 스토리지를 사용하다가, 100TB 단위의 확장 가능한 볼륨으로 변경하면서, 600명의 사용자가 HPC 작업과 업무용 Application 을 사용하는 기반 환경의 공유볼륨으로 IEEL을 사용하고 있습니다.

“We needed to replace our old computing system used essentially for our scientific calculations with a new one designed to support all the users’ needs,” said Giuseppe Bruno, in the DG-ESR. “We had more users to support in my Directorate General, from about 400 to 600 people. We needed more performance for our applications because of the growing data. But, we also wanted to increase our file sharing capability for Directorate-wide collaboration; so we needed more real memory and storage capacity. Our SAN couldn’t be upgraded beyond its 20 terabytes, and we were looking at requiring as much as 100 terabytes of capacity for all our users.”

평균적으로 4K 단위의 작은 파일들을 사용하고 있다네요, IEEL의 경우 작은 파일이 많을경우, OpenZFS기반으로 구성을 할수 있을것입니다.

“The Lustre storage system accommodates the very large data sets sometimes needed for simulations, but it is mainly a repository for lots of small files, whose size is 4K bytes on average.”

IBM DB2 및 Oracle DB로 부터 ETL 목적으로 사용하면서, (R Stata Matlab)을 돌리기 위한 Back end File System을 IEEL로 사용하면서, 분석하기 위한 필요 시간을 단축 했다고 합니다.

Bank of Italy extracts data from IBM DB2 and Oracle databases. It uses R, Stata, and Matlab to do the extraction, which can take a half-hour or more before they can run their processing. According to Mr. Paciucci, by adopting Intel Enterprise Edition for Lustre software, it makes it easy for Bank of Italy to engage big data analytics with Hadoop on their existing system.

아래는 기본 기사의 원문 및 추가의 PDF문서를 참고 하면 상세한 내용을 볼수 있을것입니다.

Reference Link

답글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다