fix

Zhang Haotong · Zhang Haotong · commit 3eccbe78ca52 · 2025-08-12T12:10:26.000+08:00
Signed-off-by: Zhang Haotong &lt;zhanghaotong.zht@alibaba-inc.com&gt;
diff --git a/tensorrt_llm/executor/result.py b/tensorrt_llm/executor/result.py
@@ -1,5 +1,6 @@
 import asyncio
 import json
+import time
 import weakref
 from dataclasses import dataclass, field
 from queue import Empty, Queue
@@ -10,9 +11,9 @@
 import torch
 import torch.nn.functional as F
 
-from tensorrt_llm.llmapi.otel_tracing import (SpanAttributes, SpanKind,
-                                              extract_trace_context,
-                                              global_otlp_tracer)
+from tensorrt_llm.llmapi.otel_tracing import (
+    SpanAttributes, SpanKind, extract_trace_context, global_otlp_tracer,
+    insufficient_request_metrics_warning)
 
 from .._utils import nvtx_range_debug
 from ..bindings import executor as tllm
@@ -399,23 +400,25 @@ def do_tracing(
         output: CompletionOutput,
         req_perf_metrics_dict: Optional[dict[str, float]] = None,
     ):
-        if not global_otlp_tracer() or not req_perf_metrics_dict:
+        if not global_otlp_tracer():
             return
 
         metrics_dict = self.metrics_dict
-        if not metrics_dict:
+        if not metrics_dict or not req_perf_metrics_dict:
             # Insufficient request metrics available; trace generation aborted.
+            insufficient_request_metrics_warning()
             return
 
         trace_context = extract_trace_context(self.trace_headers)
         sampling_params = self.sampling_params
+
+        # TODO: Add request arrival time
+        arrival_time = time.time() - metrics_dict.get(MetricNames.E2E, -1)
         with global_otlp_tracer().start_as_current_span(
                 "llm_request",
                 kind=SpanKind.SERVER,
                 context=trace_context,
-                start_time=int(
-                    req_perf_metrics_dict.get(RequestEventTiming.ARRIVAL_TIME,
-                                              0)),
+                start_time=int(arrival_time * 1e9),
         ) as span:
 
             def safe_set_attr(span, attr, value):
@@ -437,6 +440,7 @@ def safe_set_attr(span, attr, value):
             )
             safe_set_attr(span, SpanAttributes.GEN_AI_REQUEST_N,
                           sampling_params.n)
+            # TODO: Add prompt info in result base
             safe_set_attr(
                 span,
                 SpanAttributes.GEN_AI_USAGE_PROMPT_TOKENS,
diff --git a/tensorrt_llm/llmapi/otel_tracing.py b/tensorrt_llm/llmapi/otel_tracing.py
@@ -129,3 +129,9 @@ def contains_trace_headers(headers: Mapping[str, str]) -> bool:
 def log_tracing_disabled_warning() -> None:
     logger.warning(
         "Received a request with trace context but tracing is disabled")
+
+
+@run_once
+def insufficient_request_metrics_warning() -> None:
+    logger.warning(
+        "Insufficient request metrics available; trace generation aborted.")