embeddings

Get Embeddings

Get all embedding data for 500k (or otherwise requested) data points.

This will take a random sample of the dataset. It exports the result as a csv in order to reduce request size and response latency (as results can be large) This will return:

id
gold (index)
prediction (index)
data quality
text_sample
x coordinate
y coordinate ** any metadata columns explicitly requested

Set data_view=true to return data embeddings instead of model embeddings. If data embeddings are not available, an exception will be thrown

Set use_seed=false for random batches of embeddings on every response. This is useful for batching, but should remain true if you are requesting a single set of embeddings. If you are returning all embeddings, this parameter is useless

POST

projects

{project_id}

runs

{run_id}

split

{split}

embeddings

object

task

string

filter_params

object

ids

array

similar_to

array

num_similar_to

integer

text_pat

string

regex

boolean

data_error_potential_high

number

data_error_potential_low

number

misclassified_only

boolean

gold_filter

array

pred_filter

array

meta_filter

array

drift_score_threshold

number

is_drifted

boolean

span_sample_ids

array

span_text

string

span_regex

boolean

exclude_ids

array

lasso

object

array

class_filter

array

likely_mislabeled

boolean

likely_mislabeled_dep_percentile

integer

cbo_clusters

array

data_embs

boolean

confidence_high

number

confidence_low

number

is_otb

boolean

image_ids

array

cluster_ids

array

correctly_classified

boolean

is_edited

boolean

compare_to

enum<string>

map_threshold

number

meta_cols

array

num_samples

integer

text_sample_length

integer

include_text_sample

boolean

file_type

enum<string>

only_meta_cols

boolean

use_seed

boolean

Authorizations

Galileo-API-Key

string

headerrequired

Path Parameters

project_id

string

required

run_id

string

required

split

enum<string>

required

Available options:

training,

validation,

test,

inference

Query Parameters

inference_name

string

default:

data_view

boolean

default: false

scope

string | null

default:

Body

application/json

task

string | null

filter_params

object

compare_to

enum<string> | null

Available options:

training,

validation,

test,

inference

map_threshold

number

default: 0.5

meta_cols

string[] | null

num_samples

integer | null

text_sample_length

integer | null

default: 500

include_text_sample

boolean

default: false

file_type

enum<string>

Available options:

csv,

json,

parquet,

arrow,

zip

only_meta_cols

boolean

default: false

use_seed

boolean

default: true

Was this page helpful?

Has Embeddings Get Point Embeddings

auth

health

projects

users

api_keys

edits

embeddings

evaluate-alerts

data

export

features

feedback

groups

insights

integrations

jobs

llm_integrations

meta

observe

project_settings

prompts

protect

scorer

runs

slices

models

Get Embeddings

Authorizations

Path Parameters

Query Parameters

Body