본문 바로가기
Engineering WIKI/Book

기초부터 다지는 엘라스틱서치 운영 (10장) / 색인 성능 최적화

by wonos 2024. 4. 17.

엘라스틱 서치 운영

 

핵심 개념

  • 동적 매핑을 사용하면 불필요한 매핑 정보가 생성될 수 있으며, 이런 불필요한 매핑 정보는 불필요한 색인 작업을 유발하게 되어 색인 성능을 저하시킴
  • keyword 타입은 ignore_above라는 속성()이 하나 더 붙는데 문자열 중 해당 길이 이상인 값은 색인에 포함하지 않는다는 뜻이다.
  • 정적 매핑을 통한 성능 향상은 문자열 형태의 필드에서 효과가 가장크며, 문자열 필드가 많으면 많을수록 분석이 불필요한 필드를 keyword 타입으로 변경해서 성능 향상 효과를 볼 수 있다.
  • bulk API는 한 번에 다량의 문서를 색인, 삭제, 수정할 때 사용할 수 있는 API이다.
  • 레플리카 샤드 개수를 0으로 설정하여 색인 성능 확보
  • 레플리카 샤드가 없다면 전체적인 색인 성능이 향상된다.
  • 레플리카 샤드는 ElasticSearch 클러스터의 안정성을 위해 꼭 필요한 요소이지만 최초 원본 문서를 한 번 더 저장하는 것이므로 성능의 측면에서 보면 색인 성능 낭비라고도 볼 수 있다
  • 문서 id 지정이 필요하지 않다면 POST 메서드를 이용해 색인하는 것이 PUT 메서드를 이용해 색인하는 것보다 성능 향상에 도움이 된다.

 

 

 

Reference URL