///
Search
🛬

운영의 관점에서 살펴본 Vector DB 메트릭 비교와 데이터 샤딩, 그리고 인덱스 전략에 따른 메트릭 (박진형, 송명하)

Indexing

데이터는 인덱싱을 통해 VDB에 저장되고 검색해야 할 spaces를 좁혀서 벡터를 신속하게 찾을 수 있도록 도와준다.
Search Quality와 Speed Tradeoffs는 서로 상반되는 개념이다.
VDB가 인덱스 전략을 어떻게 가져가는 지 확인이 필요하다!!

Helicopter View

Cost-Accuracy - CA

k8s 기반 HNSW 벡터 검색엔진

Cost-Processability - CP

Distributed PostgreSQL Vector Extension

Accessibility-Processibility - AP

Vector Similarity Engine with Dynamic Batch on GPU

Challenges

벡터 검색 ≠ 벡터 데이터베이스
벡터 검색 자체는 비교적 쉬운 문제인데 반하여, VDB가 해결해야할 문제가 많다.
벡터의 점진적 색인화(Incremental Indexing) 문제