Vector Similarity

Overview

Computes the similarity between two given numeric vectors. Unlike other similarity algorithms that operate on graph structure or node properties, this algorithm works directly on user-provided vectors.

Four metrics are supported:

Cosine: Cosine of the angle between two vectors. See Cosine Similarity for details.
Pearson: Linear correlation between two vectors. See Pearson Correlation Coefficient for details.
Euclidean: Normalized Euclidean distance between two vectors. See Euclidean Distance for details.
Jaccard: Ratio of positions where both vectors are non-zero to positions where at least one is non-zero. See Jaccard Similarity for details.

Parameters

Name	Type	Default	Description
`vector1`	`LIST`	/	Required. First numeric vector.
`vector2`	`LIST`	/	Required. Second numeric vector.
`metric`	`STRING`	`cosine`	Similarity metric: `cosine`, `pearson`, `euclidean`, or `jaccard`.

Run Mode

Returns:

Column	Type	Description
`similarity`	`FLOAT`	Computed similarity score

Cosine similarity:

GQL
CALL algo.similarityvec({
  vector1: [1.0, 2.0, 3.0],
  vector2: [4.0, 5.0, 6.0]
}) YIELD similarity

Result:

similarity
0.9746318461970762

Pearson correlation:

GQL
CALL algo.similarityvec({
  vector1: [1.0, 2.0, 3.0],
  vector2: [4.0, 5.0, 6.0],
  metric: "pearson"
}) YIELD similarity

Result:

similarity
1

Euclidean distance:

GQL
CALL algo.similarityvec({
  vector1: [1.0, 2.0],
  vector2: [4.0, 6.0],
  metric: "euclidean"
}) YIELD similarity

Result:

similarity
0.16666666666666666

Jaccard similarity:

GQL
CALL algo.similarityvec({
  vector1: [1.0, 2.0, 3.0],
  vector2: [2.0, 3.0, 4.0],
  metric: "jaccard"
}) YIELD similarity

Result:

similarity
1

Stream Mode

Returns the same columns as run mode, streamed for memory efficiency.

GQL
CALL algo.similarityvec.stream({
  vector1: [1.0, 2.0, 3.0],
  vector2: [4.0, 5.0, 6.0]
}) YIELD similarity
RETURN similarity

Result:

similarity
0.9746318461970762

Stats Mode

Returns:

Column	Type	Description
`similarity`	`FLOAT`	Computed similarity score

GQL
CALL algo.similarityvec.stats({
  vector1: [1.0, 2.0, 3.0],
  vector2: [4.0, 5.0, 6.0]
}) YIELD similarity

Result:

similarity
0.9746318461970762