Open Source/VectorDB
-
2편: 유사도 검색과 벡터 인덱싱Open Source/VectorDB 2025. 6. 5. 16:03
벡터 데이터베이스의 핵심 기능 – 유사도 검색벡터 DB의 가장 중요한 기능은 비슷한 데이터를 빠르게 찾는 것입니다. 이를 유사도 검색(similarity search) 혹은 근접 이웃 검색(nearest neighbor search)라고 합니다.예를 들어, 문장 “벡터 DB 배우고 싶어요”의 벡터를 기준으로, 비슷한 의미의 다른 문서나 문장을 찾아 주는 것 입니다.유사도 계산 방식유사도를 계산할 때는 보통 아래 세 가지 방식이 많이 쓰입니다.코사인 유사도 (cosine similarity)두 벡터의 방향(각도)을 기준으로 유사도를 계산합니다.$\cos(\theta) = \frac{{\mathbf{v}_1 \cdot \mathbf{v}_2}}{{|\mathbf{v}_1| |\mathbf{v}_2|}}$유클..
-
1편: 벡터 데이터베이스의 개념과 필요성Open Source/VectorDB 2025. 6. 3. 12:00
벡터 데이터베이스, 뭘까?요즘 벡터 데이터베이스 를 적용해보려는 업무를 하는데 사실 저도 정확히 뭘 하는 건지 잘 몰라서 정리를 해보려고 합니다.이 글에서는 벡터 데이터베이스의 개념과 필요성만 간단히 정리해두고, 다음 글부터는 조금 더 기술적인 내용으로 들어가 볼 예정입니다.벡터란 무엇인가?물리학에서의 벡터물리학에서는 벡터를 크기(길이)와 방향을 가진 물리량으로 봅니다.예: 속도 벡터(방향 + 크기), 힘 벡터(방향 + 크기)보통은 화살표로 나타내며, 위치 이동(변위)도 벡터로 표현됩니다.수학적 표현:2D: $\mathbf{v} = (x, y)$3D: $\mathbf{v} = (x, y, z)$수학에서의 벡터수학에서는 벡터를 성분의 나열로 생각합니다.예: $\mathbf{v} = (v_1, v_2, \d..