BORSUK
Blob-Oriented Retrieval with Segmental Unified KNN
Wysoce zoptymalizowany silnik similarity search napisany natywnie w Rust. Drastycznie obniża zużycie pamięci dzięki strumieniowemu czytaniu wektorów prosto z plików Parquet (z dysku lokalnego lub magazynów S3: AWS S3, MinIO, SeaweedFS) bez potrzeby ładowania całych zbiorów do RAM-u. Projekt dostarcza natywne API dla Pythona (PyO3) oraz TypeScriptu (N-API) i obsługuje szeroki wachlarz metryk dla wektorów gęstych, histogramów, zbiorów oraz tekstu.
TECH STACK Rust Python TypeScript Parquet S3
Zobacz projekt na GitHubie