엘라스틱 서치 운영
핵심 개념
- 동적 매핑을 사용하면 불필요한 매핑 정보가 생성될 수 있으며, 이런 불필요한 매핑 정보는 불필요한 색인 작업을 유발하게 되어 색인 성능을 저하시킴
- keyword 타입은 ignore_above라는 속성()이 하나 더 붙는데 문자열 중 해당 길이 이상인 값은 색인에 포함하지 않는다는 뜻이다.
- 정적 매핑을 통한 성능 향상은 문자열 형태의 필드에서 효과가 가장크며, 문자열 필드가 많으면 많을수록 분석이 불필요한 필드를 keyword 타입으로 변경해서 성능 향상 효과를 볼 수 있다.
- bulk API는 한 번에 다량의 문서를 색인, 삭제, 수정할 때 사용할 수 있는 API이다.
- 레플리카 샤드 개수를 0으로 설정하여 색인 성능 확보
- 레플리카 샤드가 없다면 전체적인 색인 성능이 향상된다.
- 레플리카 샤드는 ElasticSearch 클러스터의 안정성을 위해 꼭 필요한 요소이지만 최초 원본 문서를 한 번 더 저장하는 것이므로 성능의 측면에서 보면 색인 성능 낭비라고도 볼 수 있다
- 문서 id 지정이 필요하지 않다면 POST 메서드를 이용해 색인하는 것이 PUT 메서드를 이용해 색인하는 것보다 성능 향상에 도움이 된다.
Reference URL
'Engineering WIKI > Book' 카테고리의 다른 글
기초부터 다지는 엘라스틱서치 운영 (12장) / ElasticSearch 클러스터 구축 시나리오 (46) | 2024.04.19 |
---|---|
기초부터 다지는 엘라스틱서치 운영 (11장) / 검색 성능 최적화 (38) | 2024.04.18 |
기초부터 다지는 엘라스틱서치 운영 (9장) / 검색 엔진으로 활용하기 (67) | 2024.04.16 |
기초부터 다지는 엘라스틱서치 운영 (8장) / 분석 엔진으로 활용하기 (70) | 2024.04.15 |
기초부터 다지는 엘라스틱서치 운영 (7장) / 클러스터 성능 모니터링과 최적화 (54) | 2024.04.14 |
기초부터 다지는 엘라스틱서치 운영 (6장) / ElasticSearch 클러스터 운영하기 (33) | 2024.04.06 |
기초부터 다지는 엘라스틱서치 운영 (5장) / ElasticSearch 클러스터 구축 (36) | 2024.03.28 |
기초부터 다지는 엘라스틱서치 운영 (3 ~ 4장) / 모니터링 및 기본개념 (112) | 2023.09.29 |