Weaviate
Weaviate to open source'owa, AI-native, wektorowa baza danych, która pomaga deweloperom tworzyć intuicyjne i niezawodne aplikacje oparte na sztucznej inteligencji.
Weaviate jest wyposażony w niestandardowy vectorizer, zasilany modelem intfloat/multilingual-e5-large
.
Więcej informacji o modelu można znaleźć na oficjalnym repozytorium huggingface.
Vectorizer musi być uruchomiony oddzielnie jako zasób obliczeniowy.
Uruchamianie
Jeśli chcesz uruchomić podstawową bazę danych, wystarczy utworzyć nową bazę danych za pomocą cgc.
$ cgc db create --name weaviate01 -c 4 -m 8 -v weaviate_volume weaviate
Jeśli chcesz użyć zewnętrznego vectorizer'a, najpierw musisz go uruchomić
cgc compute create --name vectorizer -c 4 -m 24 -g 1 -gt A5000 t2v-transformers
Aby uzyskać więcej informacji na temat vectorizer'a, proszę odwołać się do strony dokumentacji
a następnie przekazać dodatkowe parametry do polecenia uruchamiającego
$ cgc db create --name weaviate01 -c 4 -m 8 -v weaviate_volume weaviate -d weaviate_enable_modules=text2vec-transformers -d weaviate_transformers_inference_api=http://<VECTORIZER_RESOURCE_NAME>:8080
Jak się połączyć
Pracujemy nad włączeniem klienta weaviate do CGC SDK, ale na razie prosimy użyć oficjalnego klienta zainstalowanego za pomocą pip
.
W środowisku notebooka możesz połączyć się z bazą danych w ten sposób.
Najpierw zainstaluj klienta weaviate
!pip install weaviate-client
Następnie uzyskaj swój token weaviate z
cgc db list -d
Następnie zaimportuj klienta i wykonaj połączenie
import weaviate
WEAVIATE_URL = "http://weaviate:8080"
auth_client_secret = weaviate.AuthApiKey(api_key="<WEAVIATE_TOKEN>")
client = weaviate.Client(
url=WEAVIATE_URL,
auth_client_secret=auth_client_secret,
)