向量嵌入

文本向量嵌入 API,用于语义搜索和相似度计算

向量嵌入 API

向量嵌入(Embeddings)API 可以将文本转换为高维向量表示,用于语义搜索、文本相似度计算、聚类分析等场景。

应用场景

语义搜索

理解用户搜索意图,返回语义相关的结果。

相似度计算

计算文本之间的语义相似度。

聚类分析

将相似的文本自动分组。

RAG 应用

构建检索增强生成(RAG)应用。

创建向量嵌入

请求示例

curl -X POST https://api.atdak.com/v1/embeddings \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-v3",
    "input": ["艾塔达克提供强大的 AI 服务", "人工智能改变世界"]
  }'

请求参数

参数类型必填说明
modelstring模型名称
inputstring/array输入文本,可以是字符串或字符串数组
encoding_formatstring输出格式,floatbase64
dimensionsinteger向量维度,部分模型支持

响应示例

{
  "object": "list",
  "model": "text-embedding-v3",
  "data": [
    {
      "index": 0,
      "object": "embedding",
      "embedding": [0.0023064255, -0.009327292, ...]
    },
    {
      "index": 1,
      "object": "embedding", 
      "embedding": [-0.0028842222, 0.0073928394, ...]
    }
  ],
  "usage": {
    "prompt_tokens": 18,
    "total_tokens": 18
  }
}

可用模型

模型维度最大 Token说明
text-embedding-v315368192最新一代通用嵌入模型
text-embedding-v215368192稳定版本,兼容性好
text-embedding-v3-small5128192轻量版,速度更快
text-embedding-v3-large30728192高精度版本

使用示例

Python 示例

from atdak import Atdak

client = Atdak(api_key="YOUR_API_KEY")

# 创建嵌入向量
response = client.embeddings.create(
    model="text-embedding-v3",
    input=["你好,世界", "Hello, World"]
)

# 获取向量
embedding1 = response.data[0].embedding
embedding2 = response.data[1].embedding

# 计算余弦相似度
import numpy as np
similarity = np.dot(embedding1, embedding2) / (
    np.linalg.norm(embedding1) * np.linalg.norm(embedding2)
)
print(f"相似度: {similarity:.4f}")

Node.js 示例

import { Atdak } from 'atdak';

const client = new Atdak({ apiKey: 'YOUR_API_KEY' });

const response = await client.embeddings.create({
  model: 'text-embedding-v3',
  input: ['你好,世界', 'Hello, World']
});

console.log(response.data[0].embedding);

最佳实践

  1. 批量处理:尽量将多个文本放在一次请求中,减少 API 调用次数
  2. 文本预处理:清理无关字符,保留核心语义内容
  3. 选择合适的模型:根据精度和速度需求选择模型
  4. 缓存向量:对于不变的文本,缓存计算好的向量

定价

模型价格
text-embedding-v3¥0.0001/千 Token
text-embedding-v3-small¥0.00005/千 Token
text-embedding-v3-large¥0.0002/千 Token

相关链接