Elastic 비용혁신과 통합 로깅 전략
엘라스틱 Enterprise 라이선스가 제공하는 비용혁신과 통합 로깅 전략 세미나
- 일시: 2025년 11월 12일(수) 09:00 ~ 12:30
- 장소: 롯데월드호텔 Emerald Room (3F)
세미나 대상
- 엘라스틱/오픈서치 인프라 비용 절감 방안을 찾고 계신 분
- LogsDB, 고압축 인덱스 등 최신 비용 최적화 기술에 관심 있으신 분
- GenAI 기반 엔터프라이즈 검색 도입을 고려 중이신 분
- 로그 데이터 관리 전략을 혁신하고 싶으신 분
요약
LogsDB, 고압축 인덱스 기술을 활용한 TCO 혁신 전략을 소개
소감
- 70%, 90% 등의 숫자는 Frozen tier 기준이므로, LogsDB 도입으로 인한 효과는 현실적으로 50% 내외 스토리지 절감으로 봐야할듯
압축으로 인한 절감이므로 처리속도가 진짜 더 개선됐는지, 속도 저하는 없는지 궁금함
- 후반부 세션은 벡터 검색에 대한 최신 기법 설명이 많아 좋았다. HNSW가 오래된 기술이 된 느낌이었다.

* 인사말
- Elasticsearch는 결국 대부분은 로깅으로 사용
- 어떻게 오픈소스 사용자를 상용으로 유입시킬 것인가?
최근 몇년은 Machine Learning 을 통해 유입많았으며 비용절감과 Vector DB를 통한 유입
* Agenda
1. 비용 절감
1) ES 소개: Cognitive Search, Analytics Platform, Security 등으로 소개
Security - EDR 라이선스에 포함
8.19 이후로는 9 버전으로 변경 예정
2) 상용제품으로의 ES 특장점
- Data Tiering
- LogsDB를 통한 디스크 사용 절감(8.17부터 도입)
- Machine Learning: 실시간 이슈 분석으로 초기 경고 신호 포착
- AIOps: 자동 해결
3) LogsDB를 통한 비용 절감
- 스토리지 사용 16% 절감
- indexing throughput 19% 증가
- 고객사 사례(금융):
- 보안 로그: Firewall, IPS 로그를 LogsDB로 사용해서 document 용량이 약 30% 감소
- 운영 로그: API, Enboy, Service 로그 용량 40~60% 감소
-> Storage 감소로 VM, N/W, Disk 등의 인프라도 함께 감소해 전체적으로 50~60% 이상 비용 절감
4) Searchable Snapshot
- Hot / Warm / Cold / Frozen
: Enterprise 라이선스에서만 제공하는 기능

벤치마크 자료들은 https://www.elastic.co/search-labs 참고

5) Machine Learning
- 이상징후 탐지: 단순 트래픽이 아니라 anomalous log 들도 분석 및 탐지 가능
--> mutable text 제외, 유사한 메시지 클러스터링
OpenSearch도 도입하려는 것으로 보임 (3.3부터)
https://docs.opensearch.org/latest/ml-commons-plugin/agents-tools/tools/log-pattern-analysis-tool/
- 금융사의 경우 FDS에 활용하기도 함
6) Elastic Observability
- AI Assistant 를 통해 바로 분석 가능: RAG 기반이기 때문에 더 정확한 답을 찾을 수 있다고 함
(인터넷 통한 호출이고 모델 변경을 통해 폐쇄망 가능한 듯)
2. Vector DB
1) Vector DB로써의 ES
- 8.12 이후 SIMD 명령어 기반 벡터 연산 개선으로 코사인 유사도 성능 개선
- 임베딩
- 고려사항: 라이선스, 언어, max token, dimension(일반적으로 1,024 권장), 품질(도메인 지원, mteb 참고), 파라미터 수
- 모델 추천(25.11.12 기준): 한국어 텍스트의 경우 bge-m3 추천

멀티모달의 경우 siglip2 추천하지만 바로 임포트는 안 됨. Clip은 바로 import 되지만 2021년 모델
구축사례 참고: https://github.com/elastic/elasticsearch-labs
- 검색
- knn검색 핵심 파라미터: k, num_candidates (num_candidates = k * 1.5 권장)
- 하이브리드 검색: 한국어 임베딩 품질이 낮으므로 필요
- 가중 RRF 추가 (평점 0.5, 키워드 0.3, 시멘틱 0.2 등으로 가중치 넣어서 한 번에 검색)
- HNSW:

-> 벡터를 모두 메모리에 올려야하므로 컴퓨팅 자원이 많이 소모
-> 양자화가 필수적
- BBQ(Better Binary Quantization): 9.x 버전 핵심 기술
Float32 -> 1bit 양자화+ 14 Byte 보정 데이터
비대칭 양자화 (문서 1bit, 쿼리 int4), 비트 와이즈 내적을 수행해 초고속 검색 지원. OverSampling으로 극복
num_candidates 기본 3. 기존 int8 기본에서 9 버전부터 BBQ로 변경
2) Agentic AI 시대의 Elasticsearch
- MCP 도구 기반 Agentic RAG 구축 가능
- Standard RAG vs Agentic RAG
Standard RAG: 낮은 latency, 예산제약, 프로토타입/MVP
Agentic RAG: 정확도, 복잡한 소스, 여러 앱 재사용, 동적 도구 선택
-> 하이브리드 구성도 고려
- MCP 서버 구현 방법 2가지 (Kibana Agent Builder(베타), 직접 구현-SDK권장)
3) Elasticsearch의 미래 (9.1버전, 이후)
- DiskBBQ
| HNSW | DiskBBQ |
| 모든 벡터가 RAM에 존재 | 메모리 사용량 대폭 감소 (디스크 활용) |
| 메모리 부족시 성능하락 | 관련 클러스터만 검색해 성능 유지 |
| 인덱싱시 HNSW 그래프 탐색 | 대규모 벡터 처리 가능 |

https://www.elastic.co/search-labs/blog/diskbbq-elasticsearch-introduction