현업에서 머신러닝 시스템을 구축한다고 하면 대용량 데이터를 빠르게 학습하고 처리하는 분산 시스템의 구성이 필수적일 것입니다. 단순히 머신러닝 알고리즘을 학습하고 튜닝하는 정도의 연구 목적에서 벗어나 실제 대규모 머신러닝 시스템을 구성할 때 어떻게 설계되어야 하는지 데이터 수집-모델 학습-모델 서빙단계 등 워크플로 별로, 혹은 통합된 형태로 디자인 패턴을 익힐 수 있는 책은 거의 없었던 것 같습니다.

 

이 책은 그런 점에서 가치 있는 책인 것 같습니다. 분산 머신러닝 시스템을 구축해야 하는 경우, 제한된 메모리로 무거운 연산을 처리하는 방법과 고려사항, 제한된 자원으로 인한 실패 상황에 대한 대응 패턴, 효율적인 학습을 위해서 데이터를 재활용하는 방법, 다양한 분산 학습 패턴 등을 체계적으로 설명하고 있습니다.

 

또한 책의 내용을 챕터가 끝날 때마다 '요약'이라는 형태로 챕터 내용들을 이해하기 쉽게 정리해놓았고, 그림과 예제(혹은 개념을 이해할 수 있는 질문)들이 풍부하게 수록되어 있어 이해에 정말 도움이 많이 되었습니다.

 

실제 당면할 수 있는 대규모 AI 시스템 구축간의 문제점에 대한 인사이트를 제공하고, 클라우드 기반의 분산 AI 시스템 구축을 간단한 실습을 통해서 익힐 수 있도록 단계적으로 실습도 수록하여 따라하다보면 어느새 대규모 머신러닝 시스템 디자인 패턴과 분산 AI 시스템을 직접 구축해볼 수 있겠다는 자신감이 생기는 것 같습니다.

 

"한빛미디어 <나는리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."