Text Embedding 3 Large - OpenAI | Veni AI

What is Text Embedding 3 Large?

Text Embedding 3 Large from OpenAI encodes text into dense vectors for retrieval and analytics. Use it for RAG pipelines, semantic search, recommendations, and topic detection across languages. Optimized for quality and latency so it scales to large corpora.

Technical Specifications

Context Window

8,191 tokens

Max Output

3072-dimensional vector

Training Cutoff

2024

Active

Capabilities

High-quality text embeddings for search and clustering

Handles multi-language inputs

Optimized for semantic retrieval latency

Benchmark Scores

MTEB AveragePerformance benchmark

64.6%

DimensionPerformance benchmark

3072

Max InputPerformance benchmark

8191

Accuracy vs Ada-002Performance benchmark

+30%

LanguagesPerformance benchmark

100+

Cost EfficiencyPerformance benchmark

95%

Pros & Cons

Pros

Strong retrieval quality
Fast inference and small vectors
Works across languages

Cons

Not a generative model
Needs good chunking to avoid drift
Quality depends on downstream index settings

Features

Semantic search

Encode queries and documents into the same vector space.

Multi-task

Use one embedding for search, recommendations, and clustering.

Scalable

Low latency and small vectors for large corpora.

Use Cases

RAG indexing

Embed knowledge bases for accurate retrieval-augmented generation.

Recommendations

Cluster similar items and surface relevant content.

Analytics

Detect topics, intent, and anomalies across text streams.

FAQ

Related Models

Cohere

Cohere Embed v3

OpenAI

GPT-5

Anthropic

Claude Sonnet 4.5

OpenAI Text Embedding 3 Large