此版本仍在开发中,尚未被视为稳定版。如需最新的快照版本,请使用 Spring AI 1.1.3spring-doc.cadn.net.cn

可观测性

Spring AI 基于 Spring 生态系统中的可观测性功能,为 AI 相关操作提供洞察。spring-doc.cadn.net.cn

spring-boot-actuator 模块是启用可观测性所必需的。 将 Spring Boot Actuator 依赖项添加到您项目的 Maven pom.xml 构建文件中:spring-doc.cadn.net.cn

<dependency>
 <groupId>org.springframework.boot</groupId>
 <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>

请将以下内容添加到您的Gradle build.gradle 构建文件中。spring-doc.cadn.net.cn

dependencies {
    implementation 'org.springframework.boot:spring-boot-starter-actuator'
}

Spring AI 为其核心组件提供指标和追踪功能:ChatClient(包括 Advisor), ChatModelEmbeddingModelImageModelVectorStorespring-doc.cadn.net.cn

低基数键将被添加到指标和追踪中,而高基数键仅会被添加到追踪中。

1.0.0-RC1 破坏性变更spring-doc.cadn.net.cn

以下配置属性已被重命名,以更好地反映其用途:spring-doc.cadn.net.cn

  • spring.ai.chat.client.observations.include-promptspring.ai.chat.client.observations.log-promptspring-doc.cadn.net.cn

  • spring.ai.chat.observations.include-promptspring.ai.chat.observations.log-promptspring-doc.cadn.net.cn

  • spring.ai.chat.observations.include-completionspring.ai.chat.observations.log-completionspring-doc.cadn.net.cn

  • spring.ai.image.observations.include-promptspring.ai.image.observations.log-promptspring-doc.cadn.net.cn

  • spring.ai.vectorstore.observations.include-query-responsespring.ai.vectorstore.observations.log-query-responsespring-doc.cadn.net.cn

ChatClient

当调用 ChatClient 的 spring.ai.chat.clientcall() 操作时,会记录 stream() 次观察。 它们测量执行调用所花费的时间,并传播相关的跟踪信息。spring-doc.cadn.net.cn

表1. 低基数键
姓名 <description> </description>

gen_ai.operation.namespring-doc.cadn.net.cn

始终为 framework.spring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

始终为 spring_ai.spring-doc.cadn.net.cn

spring.ai.chat.client.streamspring-doc.cadn.net.cn

聊天模型响应是否为流 - true or falsespring-doc.cadn.net.cn

spring.ai.kindspring-doc.cadn.net.cn

Spring AI 中的框架 API 类型:chat_clientspring-doc.cadn.net.cn

表2. 高基数键
姓名 <description> </description>

gen_ai.promptspring-doc.cadn.net.cn

通过聊天客户端发送的提示内容。可选。spring-doc.cadn.net.cn

spring.ai.chat.client.advisor.params (已弃用)spring-doc.cadn.net.cn

顾问参数映射。对话ID现在包含在 spring.ai.chat.client.conversation.id 中。spring-doc.cadn.net.cn

spring.ai.chat.client.advisorsspring-doc.cadn.net.cn

已配置的聊天客户端顾问列表。spring-doc.cadn.net.cn

spring.ai.chat.client.conversation.idspring-doc.cadn.net.cn

使用聊天记忆时的对话标识符。spring-doc.cadn.net.cn

spring.ai.chat.client.system.params (已弃用)spring-doc.cadn.net.cn

聊天客户端系统参数。可选。被 gen_ai.prompt 取代。spring-doc.cadn.net.cn

spring.ai.chat.client.system.text (已弃用)spring-doc.cadn.net.cn

聊天客户端系统文本。可选。已被 gen_ai.prompt 取代。spring-doc.cadn.net.cn

spring.ai.chat.client.tool.function.names (已弃用)spring-doc.cadn.net.cn

已启用的工具函数名称。已被 spring.ai.chat.client.tool.names 取代。spring-doc.cadn.net.cn

spring.ai.chat.client.tool.function.callbacks (已弃用)spring-doc.cadn.net.cn

已配置的聊天客户端函数回调列表。已被 spring.ai.chat.client.tool.names 取代。spring-doc.cadn.net.cn

spring.ai.chat.client.tool.namesspring-doc.cadn.net.cn

传递给聊天客户端的工具名称。spring-doc.cadn.net.cn

spring.ai.chat.client.user.params (已弃用)spring-doc.cadn.net.cn

聊天客户端用户参数。可选。被 gen_ai.prompt 取代。spring-doc.cadn.net.cn

spring.ai.chat.client.user.text (已弃用)spring-doc.cadn.net.cn

聊天客户端用户文本。可选。已被 gen_ai.prompt 取代。spring-doc.cadn.net.cn

提示和完成数据

ChatClient 提示和完成数据通常很大,并且可能包含敏感信息。 由于这些原因,默认情况下不会导出这些数据。spring-doc.cadn.net.cn

Spring AI 支持记录提示和完成数据,以帮助进行调试和故障排除。spring-doc.cadn.net.cn

<property> </property> <description> </description> 默认

spring.ai.chat.client.observations.log-promptspring-doc.cadn.net.cn

是否记录聊天客户端提示内容。spring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

spring.ai.chat.client.observations.log-completionspring-doc.cadn.net.cn

是否记录聊天客户端完成内容。spring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您启用聊天客户端提示和完成数据的日志记录,可能会泄露敏感或私密信息。请务必小心!

输入数据(已弃用)

spring.ai.chat.client.observations.include-input 属性已弃用,已被 spring.ai.chat.client.observations.log-prompt 取代。参见 提示内容

ChatClient 输入数据通常很大,且可能包含敏感信息。 由于这些原因,默认情况下不导出。spring-doc.cadn.net.cn

Spring AI 支持记录输入数据以帮助进行调试和故障排除。spring-doc.cadn.net.cn

<property> </property> <description> </description> 默认

spring.ai.chat.client.observations.include-inputspring-doc.cadn.net.cn

是否在观察结果中包含输入内容。spring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您启用在观察结果中包含输入内容,则存在泄露敏感或私有信息的风险。请务必小心!

聊天客户端顾问

当执行通知(advisor)时,会记录 spring.ai.advisor 个观察点。 它们测量在通知中花费的时间(包括在内部通知上花费的时间)并传播相关的跟踪信息。spring-doc.cadn.net.cn

表3. 低基数键
姓名 <description> </description>

gen_ai.operation.namespring-doc.cadn.net.cn

始终为 framework.spring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

始终为 spring_ai.spring-doc.cadn.net.cn

spring.ai.advisor.type (已弃用)spring-doc.cadn.net.cn

顾问在请求处理中应用其逻辑的位置,可以是 BEFOREAFTERAROUND 之一。由于所有顾问始终属于同一类型,这种区别已不再适用。spring-doc.cadn.net.cn

spring.ai.kindspring-doc.cadn.net.cn

Spring AI 中的框架 API 类型:advisorspring-doc.cadn.net.cn

表4. 高基数键
姓名 <description> </description>

spring.ai.advisor.namespring-doc.cadn.net.cn

顾问的名称。spring-doc.cadn.net.cn

spring.ai.advisor.orderspring-doc.cadn.net.cn

顾问链中的顾问顺序。spring-doc.cadn.net.cn

ChatModel

目前仅支持来自以下 AI 模型提供商的 ChatModel 实现的可观测性功能:Anthropic、Azure OpenAI、Mistral AI、Ollama、OpenAI、Vertex AI、MiniMax、Moonshot、QianFan、Zhipu AI。 未来的版本将支持更多 AI 模型提供商。

在调用 ChatModel 的 callstream 方法时记录了 gen_ai.client.operation 个观察数据。 它们测量方法完成所花费的时间,并传播相关的追踪信息。spring-doc.cadn.net.cn

gen_ai.client.token.usage 指标衡量单个模型调用所使用的输入和输出Tokens的数量。
表5. 低基数键
姓名 <description> </description>

gen_ai.operation.namespring-doc.cadn.net.cn

正在执行的操作的名称。spring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

由客户端检测识别的模型提供者。spring-doc.cadn.net.cn

gen_ai.request.modelspring-doc.cadn.net.cn

请求所针对的模型的名称。spring-doc.cadn.net.cn

gen_ai.response.modelspring-doc.cadn.net.cn

生成响应的模型的名称。spring-doc.cadn.net.cn

表6. 高基数键
姓名 <description> </description>

gen_ai.request.frequency_penaltyspring-doc.cadn.net.cn

The frequency penalty setting for the model request.spring-doc.cadn.net.cn

gen_ai.request.max_tokensspring-doc.cadn.net.cn

模型为请求生成的最大Tokens数。spring-doc.cadn.net.cn

gen_ai.request.presence_penaltyspring-doc.cadn.net.cn

模型请求的存在惩罚设置。spring-doc.cadn.net.cn

gen_ai.request.stop_sequencesspring-doc.cadn.net.cn

模型将用来停止生成更多标记的序列列表。spring-doc.cadn.net.cn

gen_ai.request.temperaturespring-doc.cadn.net.cn

模型请求的温度设置。spring-doc.cadn.net.cn

gen_ai.request.top_kspring-doc.cadn.net.cn

模型请求的 top_k 采样设置。spring-doc.cadn.net.cn

gen_ai.request.top_pspring-doc.cadn.net.cn

模型请求的 top_p 采样设置。spring-doc.cadn.net.cn

gen_ai.response.finish_reasonsspring-doc.cadn.net.cn

模型停止生成Tokens的原因,对应于每次接收到的生成。spring-doc.cadn.net.cn

gen_ai.response.idspring-doc.cadn.net.cn

AI 响应的唯一标识符。spring-doc.cadn.net.cn

gen_ai.usage.input_tokensspring-doc.cadn.net.cn

模型输入(提示词)中使用的Tokens数量。spring-doc.cadn.net.cn

gen_ai.usage.output_tokensspring-doc.cadn.net.cn

模型输出(补全)中使用的Tokens数量。spring-doc.cadn.net.cn

gen_ai.usage.total_tokensspring-doc.cadn.net.cn

模型交换中使用的Tokens总数。spring-doc.cadn.net.cn

gen_ai.promptspring-doc.cadn.net.cn

发送给模型的完整提示词。可选。spring-doc.cadn.net.cn

gen_ai.completionspring-doc.cadn.net.cn

从模型接收到的完整响应。可选。spring-doc.cadn.net.cn

spring.ai.model.request.tool.namesspring-doc.cadn.net.cn

请求中提供给模型的工具定义列表。spring-doc.cadn.net.cn

对于测量用户Tokens,上表列出了观测跟踪中存在的值。 使用由 ChatModel 提供的指标名称 gen_ai.client.token.usage

聊天提示和完成数据

聊天提示和完成数据通常很大,并且可能包含敏感信息。 出于这些原因,默认情况下不会导出它们。spring-doc.cadn.net.cn

Spring AI 支持记录聊天提示和完成数据,这对于故障排除场景非常有用。当跟踪可用时,日志将包含跟踪信息以便更好地关联。spring-doc.cadn.net.cn

<property> </property> <description> </description> 默认

spring.ai.chat.observations.log-promptspring-doc.cadn.net.cn

记录提示内容。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

spring.ai.chat.observations.log-completionspring-doc.cadn.net.cn

记录完成的内容。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

spring.ai.chat.observations.include-error-loggingspring-doc.cadn.net.cn

在观察中包含错误日志。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您启用了聊天提示和完成数据的日志记录,则存在泄露敏感或私人信息的风险。请务必小心!

工具调用

在聊天模型交互的上下文中执行工具调用时,会记录 spring.ai.tool 个观测点。它们测量工具调用完成所花费的时间,并传播相关的追踪信息。spring-doc.cadn.net.cn

表7. 低基数键
姓名 <description> </description>

gen_ai.operation.namespring-doc.cadn.net.cn

正在执行的操作的名称。它总是 frameworkspring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

负责操作的提供者。它总是 spring_aispring-doc.cadn.net.cn

spring.ai.kindspring-doc.cadn.net.cn

Spring AI 执行的操作类型。它始终是 tool_callspring-doc.cadn.net.cn

spring.ai.tool.definition.namespring-doc.cadn.net.cn

工具的名称。spring-doc.cadn.net.cn

表8. 高基数键

<description> </description>spring-doc.cadn.net.cn

spring.ai.tool.definition.descriptionspring-doc.cadn.net.cn

工具描述。spring-doc.cadn.net.cn

spring.ai.tool.definition.schemaspring-doc.cadn.net.cn

用于调用工具的参数架构。spring-doc.cadn.net.cn

spring.ai.tool.call.argumentsspring-doc.cadn.net.cn

工具调用的输入参数。(仅在启用时)spring-doc.cadn.net.cn

spring.ai.tool.call.resultspring-doc.cadn.net.cn

用于调用工具的参数架构。(仅在启用时)spring-doc.cadn.net.cn

工具调用参数和结果数据

工具调用的输入参数和结果默认不会导出,因为它们可能包含敏感信息。spring-doc.cadn.net.cn

Spring AI 支持将工具调用参数和结果数据导出为 span 属性。spring-doc.cadn.net.cn

<property> </property> <description> </description> 默认

spring.ai.tools.observations.include-contentspring-doc.cadn.net.cn

在观察中包含工具调用内容。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您启用了在观察中包含工具调用参数和结果的功能,可能会存在泄露敏感或私人信息的风险。请务必谨慎操作!

嵌入模型

可观测性功能目前仅支持来自以下 AI 模型提供商的 EmbeddingModel 实现:Azure OpenAI、Mistral AI、Ollama 和 OpenAI。 未来的版本将支持更多的 AI 模型提供商。

gen_ai.client.operation 次观测记录在嵌入模型方法调用上。 它们测量方法完成所花费的时间,并传播相关的跟踪信息。spring-doc.cadn.net.cn

gen_ai.client.token.usage 指标衡量单个模型调用所使用的输入和输出Tokens的数量。
表9. 低基数键
姓名 <description> </description>

gen_ai.operation.namespring-doc.cadn.net.cn

正在执行的操作的名称。spring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

由客户端检测识别的模型提供者。spring-doc.cadn.net.cn

gen_ai.request.modelspring-doc.cadn.net.cn

请求所针对的模型的名称。spring-doc.cadn.net.cn

gen_ai.response.modelspring-doc.cadn.net.cn

生成响应的模型的名称。spring-doc.cadn.net.cn

表10. 高基数键
姓名 <description> </description>

gen_ai.request.embedding.dimensionsspring-doc.cadn.net.cn

结果输出嵌入的维度数量。spring-doc.cadn.net.cn

gen_ai.usage.input_tokensspring-doc.cadn.net.cn

模型输入中使用的Tokens数量。spring-doc.cadn.net.cn

gen_ai.usage.total_tokensspring-doc.cadn.net.cn

模型交换中使用的Tokens总数。spring-doc.cadn.net.cn

对于测量用户Tokens,上表列出了观测跟踪中存在的值。 使用由 EmbeddingModel 提供的指标名称 gen_ai.client.token.usage

图像模型

可观测性功能目前仅支持来自以下 AI 模型提供商的 ImageModel 实现:OpenAI。 未来的版本将支持更多的 AI 模型提供商。

gen_ai.client.operation 次观察记录在图像模型方法调用上。 它们测量方法完成所花费的时间,并传播相关的跟踪信息。spring-doc.cadn.net.cn

gen_ai.client.token.usage 指标衡量单个模型调用所使用的输入和输出Tokens的数量。
表11. 低基数键
姓名 <description> </description>

gen_ai.operation.namespring-doc.cadn.net.cn

正在执行的操作的名称。spring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

由客户端检测识别的模型提供者。spring-doc.cadn.net.cn

gen_ai.request.modelspring-doc.cadn.net.cn

请求所针对的模型的名称。spring-doc.cadn.net.cn

表12. 高基数键
姓名 <description> </description>

gen_ai.request.image.response_formatspring-doc.cadn.net.cn

生成的图像返回的格式。spring-doc.cadn.net.cn

gen_ai.request.image.sizespring-doc.cadn.net.cn

要生成的图像的大小。spring-doc.cadn.net.cn

gen_ai.request.image.stylespring-doc.cadn.net.cn

要生成的图像的风格。spring-doc.cadn.net.cn

gen_ai.response.idspring-doc.cadn.net.cn

AI 响应的唯一标识符。spring-doc.cadn.net.cn

gen_ai.response.modelspring-doc.cadn.net.cn

生成响应的模型的名称。spring-doc.cadn.net.cn

gen_ai.usage.input_tokensspring-doc.cadn.net.cn

模型输入(提示词)中使用的Tokens数量。spring-doc.cadn.net.cn

gen_ai.usage.output_tokensspring-doc.cadn.net.cn

模型输出(生成)中使用的Tokens数量。spring-doc.cadn.net.cn

gen_ai.usage.total_tokensspring-doc.cadn.net.cn

模型交换中使用的Tokens总数。spring-doc.cadn.net.cn

gen_ai.promptspring-doc.cadn.net.cn

发送给模型的完整提示词。可选。spring-doc.cadn.net.cn

对于测量用户Tokens,上表列出了观测跟踪中存在的值。 使用由 ImageModel 提供的指标名称 gen_ai.client.token.usage

图像提示数据

图像提示数据通常较大,且可能包含敏感信息。 由于这些原因,默认情况下不导出这些数据。spring-doc.cadn.net.cn

Spring AI 支持记录图像提示数据,这对于故障排除场景非常有用。当跟踪功能可用时,日志将包含跟踪信息以便更好地关联。spring-doc.cadn.net.cn

<property> </property> <description> </description> 默认

spring.ai.image.observations.log-promptspring-doc.cadn.net.cn

记录图像提示内容。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您启用图像提示数据的日志记录,可能会暴露敏感或私人信息。请务必小心!

向量存储

Spring AI 中的所有向量存储实现都通过 Micrometer 提供了指标和分布式追踪数据的监控功能。spring-doc.cadn.net.cn

在与向量存储交互时,会记录db.vector.client.operation个观察结果。 它们测量在queryaddremove操作上花费的时间,并传播相关的跟踪信息。spring-doc.cadn.net.cn

表13. 低基数键
姓名 <description> </description>

db.operation.namespring-doc.cadn.net.cn

正在执行的操作或命令的名称。可以是 adddeletequery 中的一个。spring-doc.cadn.net.cn

由客户端工具识别的数据库管理系统(DBMS)产品。可以是 pg_vectorazurecassandrachromaelasticsearchmilvusneo4jopensearchqdrantredistypesenseweaviatepineconeoraclemongodbgemfirehanasimple 中的一个。spring-doc.cadn.net.cn

spring.ai.kindspring-doc.cadn.net.cn

Spring AI 中的框架 API 类型:vector_storespring-doc.cadn.net.cn

表14. 高基数键
姓名 <description> </description>

db.collection.namespring-doc.cadn.net.cn

数据库中集合(表、容器)的名称。spring-doc.cadn.net.cn

数据库的名称,在服务器地址和端口中完全限定。spring-doc.cadn.net.cn

如果存在,则为记录标识符。spring-doc.cadn.net.cn

db.search.similarity_metricspring-doc.cadn.net.cn

相似性搜索中使用的度量标准。spring-doc.cadn.net.cn

db.vector.dimension_countspring-doc.cadn.net.cn

向量的维度。spring-doc.cadn.net.cn

db.vector.field_namespring-doc.cadn.net.cn

The name field as of the vector (e.g. a field name).spring-doc.cadn.net.cn

db.vector.query.contentspring-doc.cadn.net.cn

正在执行的搜索查询的内容。spring-doc.cadn.net.cn

db.vector.query.filterspring-doc.cadn.net.cn

搜索查询中使用的元数据过滤器。spring-doc.cadn.net.cn

db.vector.query.response.documentsspring-doc.cadn.net.cn

相似性搜索查询返回的文档。可选。spring-doc.cadn.net.cn

db.vector.query.similarity_thresholdspring-doc.cadn.net.cn

接受所有搜索分数的相似度阈值。阈值为 0.0 表示接受任何相似度或禁用相似度阈值过滤。阈值为 1.0 表示需要精确匹配。spring-doc.cadn.net.cn

db.vector.query.top_kspring-doc.cadn.net.cn

查询返回的前 k 个最相似的向量。spring-doc.cadn.net.cn

响应数据

向量搜索响应数据通常很大,并且可能包含敏感信息。 由于这些原因,默认情况下不会导出该数据。spring-doc.cadn.net.cn

Spring AI 支持记录向量搜索响应数据,这对于故障排除场景非常有用。当可用跟踪时,日志将包含跟踪信息以便更好地关联。spring-doc.cadn.net.cn

<property> </property> <description> </description> 默认

spring.ai.vectorstore.observations.log-query-responsespring-doc.cadn.net.cn

记录向量存储查询响应内容。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您启用了向量搜索响应数据的日志记录,则存在泄露敏感或私人信息的风险。请务必小心!

更多指标参考

本节记录了 Spring AI 组件在 Prometheus 中显示的指标。spring-doc.cadn.net.cn

指标命名规范

Spring AI 使用 Micrometer。基础指标名称使用点(例如,gen_ai.client.operation),Prometheus 会将其导出时使用下划线和标准后缀:spring-doc.cadn.net.cn

以下展示了基本指标名称如何扩展为 Prometheus 时间序列。spring-doc.cadn.net.cn

基础指标名称 导出的时间序列

gen_ai.client.operationspring-doc.cadn.net.cn

gen_ai_client_operation_seconds_count
gen_ai_client_operation_seconds_sum
gen_ai_client_operation_seconds_max
gen_ai_client_operation_active_countspring-doc.cadn.net.cn

db.vector.client.operationspring-doc.cadn.net.cn

db_vector_client_operation_seconds_count
db_vector_client_operation_seconds_sum
db_vector_client_operation_seconds_max
db_vector_client_operation_active_countspring-doc.cadn.net.cn

聊天客户端指标

指标名称 类型 单元 <description> </description>

gen_ai_chat_client_operation_seconds_sumspring-doc.cadn.net.cn

计时器spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

在 ChatClient 操作(调用/流)中花费的总时间spring-doc.cadn.net.cn

gen_ai_chat_client_operation_seconds_countspring-doc.cadn.net.cn

计数器spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

已完成的 ChatClient 操作数量spring-doc.cadn.net.cn

gen_ai_chat_client_operation_seconds_maxspring-doc.cadn.net.cn

仪表spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

ChatClient 操作的最大观察持续时间spring-doc.cadn.net.cn

gen_ai_chat_client_operation_active_countspring-doc.cadn.net.cn

仪表spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

当前正在进行的 ChatClient 操作数量spring-doc.cadn.net.cn

进行中 vs 已完成: active_count 显示正在进行的调用; _seconds 系列仅反映已完成的调用。spring-doc.cadn.net.cn

聊天模型指标(模型提供方执行)

指标名称 类型 单元 <description> </description>

gen_ai_client_operation_seconds_sumspring-doc.cadn.net.cn

计时器spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

执行聊天模型操作的总时间spring-doc.cadn.net.cn

gen_ai_client_operation_seconds_countspring-doc.cadn.net.cn

计数器spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

已完成的聊天模型操作数量spring-doc.cadn.net.cn

gen_ai_client_operation_seconds_maxspring-doc.cadn.net.cn

仪表spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

聊天模型操作的最大观察持续时间spring-doc.cadn.net.cn

gen_ai_client_operation_active_countspring-doc.cadn.net.cn

仪表spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

当前正在进行的聊天模型操作数量spring-doc.cadn.net.cn

Tokens使用

指标名称 类型 单元 <description> </description>

gen_ai_client_token_usage_totalspring-doc.cadn.net.cn

计数器spring-doc.cadn.net.cn

标记spring-doc.cadn.net.cn

按Tokens类型分类的总Tokens消耗量spring-doc.cadn.net.cn

标签

标签 含义

gen_ai_token_type=inputspring-doc.cadn.net.cn

发送到模型的提示词Tokensspring-doc.cadn.net.cn

gen_ai_token_type=outputspring-doc.cadn.net.cn

模型返回的完成Tokensspring-doc.cadn.net.cn

gen_ai_token_type=totalspring-doc.cadn.net.cn

输入 + 输出spring-doc.cadn.net.cn

向量存储指标

指标名称 类型 单元 <description> </description>

db_vector_client_operation_seconds_sumspring-doc.cadn.net.cn

计时器spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

在向量存储操作(添加/删除/查询)中花费的总时间spring-doc.cadn.net.cn

db_vector_client_operation_seconds_countspring-doc.cadn.net.cn

计数器spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

已完成的向量存储操作数量spring-doc.cadn.net.cn

db_vector_client_operation_seconds_maxspring-doc.cadn.net.cn

仪表spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

向量存储操作的最大观测持续时间spring-doc.cadn.net.cn

db_vector_client_operation_active_countspring-doc.cadn.net.cn

仪表spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

当前正在进行的向量存储操作数量spring-doc.cadn.net.cn

标签

标签 含义

db_operation_namespring-doc.cadn.net.cn

操作类型 (add, delete, query)spring-doc.cadn.net.cn

db_systemspring-doc.cadn.net.cn

Vector DB/提供者 (redis, chroma, pgvector, …)spring-doc.cadn.net.cn

spring_ai_kindspring-doc.cadn.net.cn

vector_storespring-doc.cadn.net.cn

了解活动与已完成的区别