Indexing
•
데이터는 인덱싱을 통해 VDB에 저장되고 검색해야 할 spaces를 좁혀서 벡터를 신속하게 찾을 수 있도록 도와준다.
•
Search Quality와 Speed Tradeoffs는 서로 상반되는 개념이다.
•
VDB가 인덱스 전략을 어떻게 가져가는 지 확인이 필요하다!!
Helicopter View
Cost-Accuracy - CA
•
k8s 기반 HNSW 벡터 검색엔진
Cost-Processability - CP
•
Distributed PostgreSQL Vector Extension
Accessibility-Processibility - AP
•
Vector Similarity Engine with Dynamic Batch on GPU
Challenges
•
벡터 검색 ≠ 벡터 데이터베이스
•
벡터 검색 자체는 비교적 쉬운 문제인데 반하여, VDB가 해결해야할 문제가 많다.
•
벡터의 점진적 색인화(Incremental Indexing) 문제