跳到主要内容

Vearch

https://github.com/vearch/vearch

Maven 依赖

备注

1.0.0-alpha1 起,langchain4j-vearch 已迁移到 langchain4j-community 并重命名为 langchain4j-community-vearch

0.36.2 及之前:

<dependency>
<groupId>dev.langchain4j</groupId>
<artifactId>langchain4j-vearch</artifactId>
<version>1.0.0-beta3</version>
</dependency>

1.0.0-alpha1 及之后:

<dependency>
<groupId>dev.langchain4j</groupId>
<artifactId>langchain4j-community-vearch</artifactId>
<version>1.0.0-beta3</version>
</dependency>

或者,您可以使用 BOM 来一致地管理依赖项:

<dependencyManagement>
<dependency>
<groupId>dev.langchain4j</groupId>
<artifactId>langchain4j-community-bom</artifactId>
<version>1.0.0-beta3</version>
<typ>pom</typ>
<scope>import</scope>
</dependency>
</dependencyManagement>

API

1.0.0-alpha1 及之前

备注
  • 1.0.0-alpha1 及之前的 langchain4j-vearch 使用 Vearch 旧 API,该 API 在 vearch 3.4.x 版本中已弃用。
  • 1.0.0-alpha1 及之后的 langchain4j-community-vearch 使用 Vearch 最新 API,支持 3.5.x 和 3.4.x 版本。

我们建议使用支持最新版本 Vearchlangchain4j-community-vearch

要使用 VearchEmbeddingStore,您需要实例化一个 VearchConfig

String embeddingFieldName = "text_embedding";
String textFieldName = "text";
Map<String, Object> metadata = createMetadata().toMap();

// 初始化属性
Map<String, SpacePropertyParam> properties = new HashMap<>(4);
properties.put(embeddingFieldName, SpacePropertyParam.VectorParam.builder()
.index(true)
.storeType(SpaceStoreType.MEMORY_ONLY)
.dimension(384)
.build());
properties.put(textFieldName, SpacePropertyParam.StringParam.builder().build());
// put metadata... e.g. properties.put("name", SpacePropertyParam.StringParam.builder().build());

VearchConfig vearchConfig = VearchConfig.builder()
.spaceEngine(SpaceEngine.builder()
.name("gamma")
.indexSize(1L)
.retrievalType(RetrievalType.FLAT)
.retrievalParam(RetrievalParam.FLAT.builder()
.build())
.build())
.properties(properties)
.embeddingFieldName(embeddingFieldName)
.textFieldName(textFieldName)
.databaseName(databaseName)
.spaceName(spaceName)
.modelParams(singletonList(ModelParam.builder()
.modelId("vgg16")
.fields(singletonList("string"))
.out("feature")
.build()))
.build();

然后,您可以创建一个 VearchEmbeddingStore

VearchEmbeddingStore embeddingStore = VearchEmbeddingStore.builder()
.vearchConfig(vearchConfig)
.baseUrl(baseUrl)
.build();

1.0.0-alpha1 及之后

要使用 VearchEmbeddingStore,您需要实例化一个 VearchConfig

String embeddingFieldName = "text_embedding";
String textFieldName = "text";
String spaceName = "embedding_space_" + ThreadLocalRandom.current().nextInt(0, Integer.MAX_VALUE);

// 初始化字段
List<Field> fields = new ArrayList<>(4);
List<String> metadataFieldNames = new ArrayList<>();
fields.add(VectorField.builder()
.name(embeddingFieldName)
.dimension(embeddingModel.dimension())
.index(Index.builder()
.name("gamma")
.type(IndexType.HNSW)
.params(HNSWParam.builder()
.metricType(MetricType.INNER_PRODUCT)
.efConstruction(100)
.nLinks(32)
.efSearch(64)
.build())
.build())
.build()
);
fields.add(StringField.builder().name(textFieldName).fieldType(FieldType.STRING).build());
// 添加元数据... 例如 fields.add(StringField.builder().name("name").fieldType(FieldType.STRING).build());

VearchConfig vearchConfig = VearchConfig.builder()
.databaseName(databaseName)
.spaceName(spaceName)
.textFieldName(textFieldName)
.embeddingFieldName(embeddingFieldName)
.fields(fields)
.metadataFieldNames(metadataFieldNames)
.searchIndexParam(HNSWSearchParam.builder()
// 目前仅支持 INNER_PRODUCT
.metricType(MetricType.INNER_PRODUCT)
.efSearch(64)
.build())
.build();

然后,您可以创建一个 VearchEmbeddingStore

VearchEmbeddingStore embeddingStore = VearchEmbeddingStore.builder()
.vearchConfig(vearchConfig)
.baseUrl(baseUrl)
.logRequests(true)
.logResponses(true)
.build();

示例