grafana
diff --git a/‎docs/sources/shared/configuration.md‎
Lines changed: 9 additions & 0 deletions b/‎docs/sources/shared/configuration.md‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎pkg/engine/engine.go‎
Lines changed: 22 additions & 5 deletions b/‎pkg/engine/engine.go‎
Lines changed: 22 additions & 5 deletions
diff --git a/‎pkg/loki/modules.go‎
Lines changed: 1 addition & 0 deletions b/‎pkg/loki/modules.go‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎pkg/querier/http.go‎
Lines changed: 2 additions & 6 deletions b/‎pkg/querier/http.go‎
Lines changed: 2 additions & 6 deletions
diff --git a/‎pkg/querier/queryrange/engine_router.go‎
Lines changed: 244 additions & 0 deletions b/‎pkg/querier/queryrange/engine_router.go‎
Lines changed: 244 additions & 0 deletions
@@ -4849,6 +4849,15 @@ engine_v2:
   # CLI flag: -querier.engine-v2.enable
   [enable: <boolean> | default = false]
 
+  # Amount of time until data objects are available.
+  # CLI flag: -querier.engine-v2.dataobj-storage-lag
+  [dataobj_storage_lag: <duration> | default = 1h]
+
+  # Initial date when data objects became available. Format YYYY-MM-DD. If not
+  # set, assume data objects are always available no matter how far back.
+  # CLI flag: -querier.engine-v2.dataobj-storage-start
+  [dataobj_storage_start: <time> | default = 0]
+
   # Experimental: Batch size of the next generation query engine.
   # CLI flag: -querier.engine-v2.batch-size
   [batch_size: <int> | default = 100]
 
@@ -17,6 +17,8 @@ import (
 	"go.opentelemetry.io/otel/codes"
 	"go.opentelemetry.io/otel/trace"
 
+	dskit_flagext "github.com/grafana/dskit/flagext"
+
 	"github.com/grafana/loki/v3/pkg/dataobj/metastore"
 	"github.com/grafana/loki/v3/pkg/engine/internal/executor"
 	"github.com/grafana/loki/v3/pkg/engine/internal/planner/logical"
@@ -68,6 +70,9 @@ type Config struct {
 	// Enable the next generation Loki Query Engine for supported queries.
 	Enable bool `yaml:"enable" category:"experimental"`
 
+	DataobjStorageLag   time.Duration      `yaml:"dataobj_storage_lag" category:"experimental"`
+	DataobjStorageStart dskit_flagext.Time `yaml:"dataobj_storage_start" category:"experimental"`
+
 	// Batch size of the v2 execution engine.
 	BatchSize int `yaml:"batch_size" category:"experimental"`
 
@@ -78,11 +83,18 @@ type Config struct {
 	RangeConfig rangeio.Config `yaml:"range_reads" category:"experimental" doc:"description=Configures how to read byte ranges from object storage when using the V2 engine."`
 }
 
-func (opts *Config) RegisterFlagsWithPrefix(prefix string, f *flag.FlagSet) {
-	f.BoolVar(&opts.Enable, prefix+"enable", false, "Experimental: Enable next generation query engine for supported queries.")
-	f.IntVar(&opts.BatchSize, prefix+"batch-size", 100, "Experimental: Batch size of the next generation query engine.")
-	f.IntVar(&opts.MergePrefetchCount, prefix+"merge-prefetch-count", 0, "Experimental: The number of inputs that are prefetched simultaneously by any Merge node. A value of 0 means that only the currently processed input is prefetched, 1 means that only the next input is prefetched, and so on. A negative value means that all inputs are be prefetched in parallel.")
-	opts.RangeConfig.RegisterFlags(prefix+"range-reads.", f)
+func (cfg *Config) RegisterFlagsWithPrefix(prefix string, f *flag.FlagSet) {
+	f.BoolVar(&cfg.Enable, prefix+"enable", false, "Experimental: Enable next generation query engine for supported queries.")
+	f.IntVar(&cfg.BatchSize, prefix+"batch-size", 100, "Experimental: Batch size of the next generation query engine.")
+	f.IntVar(&cfg.MergePrefetchCount, prefix+"merge-prefetch-count", 0, "Experimental: The number of inputs that are prefetched simultaneously by any Merge node. A value of 0 means that only the currently processed input is prefetched, 1 means that only the next input is prefetched, and so on. A negative value means that all inputs are be prefetched in parallel.")
+	cfg.RangeConfig.RegisterFlags(prefix+"range-reads.", f)
+
+	f.DurationVar(&cfg.DataobjStorageLag, prefix+"dataobj-storage-lag", 1*time.Hour, "Amount of time until data objects are available.")
+	f.Var(&cfg.DataobjStorageStart, prefix+"dataobj-storage-start", "Initial date when data objects became available. Format YYYY-MM-DD. If not set, assume data objects are always available no matter how far back.")
+}
+
+func (cfg *Config) ValidQueryRange() (time.Time, time.Time) {
+	return time.Time(cfg.DataobjStorageStart).UTC(), time.Now().UTC().Add(-cfg.DataobjStorageLag)
 }
 
 // QueryEngine combines logical planning, physical planning, and execution to evaluate LogQL queries.
@@ -276,6 +288,11 @@ func (e *QueryEngine) Execute(ctx context.Context, params logql.Params) (logqlmo
 	return builder.Build(stats, metadataCtx), nil
 }
 
+func IsQuerySupported(params logql.Params) bool {
+	_, err := logical.BuildPlan(params)
+	return err == nil
+}
+
 func collectResult(ctx context.Context, pipeline executor.Pipeline, builder ResultBuilder) error {
 	for {
 		rec, err := pipeline.Read(ctx)
 
@@ -1146,6 +1146,7 @@ func (t *Loki) initQueryFrontendMiddleware() (_ services.Service, err error) {
 	middleware, stopper, err := queryrange.NewMiddleware(
 		t.Cfg.QueryRange,
 		t.Cfg.Querier.Engine,
+		t.Cfg.Querier.EngineV2,
 		ingesterQueryOptions{t.Cfg.Querier},
 		util_log.Logger,
 		t.Overrides,
 
@@ -113,12 +113,8 @@ func hasDataObjectsAvailable(config Config, start, end time.Time) bool {
 	// Data objects in object storage lag behind 20-30 minutes.
 	// We are generous and only enable v2 engine queries that end earlier than 1DataObjStorageLag ago (default 1h),
 	// to ensure data objects are available.
-	if config.DataobjStorageStart != "" {
-		startTime, _ := time.Parse("2006-01-02", config.DataobjStorageStart) // already validated
-		return end.Before(time.Now().Add(-1*config.DataobjStorageLag.Abs())) && start.After(startTime)
-	}
-	// no start time; assume we always have data objects no matter how far back
-	return end.Before(time.Now().Add(-1 * config.DataobjStorageLag.Abs()))
+	v2Start, v2End := config.EngineV2.ValidQueryRange()
+	return end.Before(v2End) && start.After(v2Start)
 }
 
 // InstantQueryHandler is a http.HandlerFunc for instant queries.
 
@@ -0,0 +1,244 @@
+package queryrange
+
+import (
+	"context"
+	"fmt"
+	"slices"
+	"time"
+
+	"github.com/go-kit/log"
+	"github.com/go-kit/log/level"
+	"github.com/pkg/errors"
+
+	"github.com/grafana/loki/v3/pkg/engine"
+	"github.com/grafana/loki/v3/pkg/logproto"
+	"github.com/grafana/loki/v3/pkg/querier/queryrange/queryrangebase"
+)
+
+// engineReqResp represents a request with its result channel
+type engineReqResp struct {
+	lokiResult
+	isV2Engine bool
+}
+
+// engineRouter handles splitting queries between V1 and V2 engines
+type engineRouter struct {
+	v2Start, v2End time.Time // v2 engine time range
+	forMetricQuery bool
+
+	v1Next queryrangebase.Handler
+	v2Next queryrangebase.Handler
+
+	merger queryrangebase.Merger
+
+	logger log.Logger
+}
+
+// newEngineRouterMiddleware creates a middleware that splits and routes part of the query
+// to v2 engine if the query is supported by it.
+func newEngineRouterMiddleware(
+	v2Start, v2End time.Time,
+	v2EngineHandler queryrangebase.Handler,
+	v1Chain []queryrangebase.Middleware,
+	merger queryrangebase.Merger,
+	metricQuery bool,
+	logger log.Logger,
+) queryrangebase.Middleware {
+	if v2EngineHandler == nil {
+		panic("v2EngineHandler cannot be nil")
+	}
+
+	return queryrangebase.MiddlewareFunc(func(next queryrangebase.Handler) queryrangebase.Handler {
+		return &engineRouter{
+			v2Start:        v2Start,
+			v2End:          v2End,
+			v1Next:         queryrangebase.MergeMiddlewares(v1Chain...).Wrap(next),
+			v2Next:         v2EngineHandler,
+			merger:         merger,
+			logger:         logger,
+			forMetricQuery: metricQuery,
+		}
+	})
+}
+
+func (e *engineRouter) Do(ctx context.Context, r queryrangebase.Request) (queryrangebase.Response, error) {
+	// if query is entirely before or after v2 engine range, process using next handler.
+	// ignore any boundary overlap, splitting requests that fall on bounary would result in tiny requests.
+	if !r.GetEnd().After(e.v2Start) || !r.GetStart().Before(e.v2End) {
+		return e.v1Next.Do(ctx, r)
+	}
+
+	params, err := ParamsFromRequest(r)
+	if err != nil {
+		return nil, err
+	}
+
+	// Unsupported queries should be entirely executed by chunks.
+	if !engine.IsQuerySupported(params) {
+		return e.v1Next.Do(ctx, r)
+	}
+
+	inputs := e.splitOverlapping(r, e.v2Start, e.v2End)
+
+	// for log queries, order the splits to return early on hitting limits.
+	var limit uint32
+	if !e.forMetricQuery && len(inputs) > 1 {
+		r, ok := r.(*LokiRequest)
+		if !ok {
+			level.Error(e.logger).Log("msg", "engine router received unexpected request type", "type", fmt.Sprintf("%T", r))
+			return nil, errors.New("engine router: unexpected request type")
+		}
+
+		limit = r.Limit
+
+		if r.Direction == logproto.BACKWARD {
+			slices.SortFunc(inputs, func(a, b *engineReqResp) int {
+				return b.req.GetStart().Compare(a.req.GetStart())
+			})
+		} else {
+			slices.SortFunc(inputs, func(a, b *engineReqResp) int {
+				return a.req.GetStart().Compare(b.req.GetStart())
+			})
+		}
+	}
+
+	responses, err := e.process(ctx, inputs, limit)
+	if err != nil {
+		return nil, err
+	}
+
+	// Merge responses
+	return e.merger.MergeResponse(responses...)
+}
+
+// splitOverlapping breaks down the request into multiple ranges based on the V2 engine time range.
+// It returns a max of 3 requests:
+// - one for the range before V2 engine
+// - one for the range overlapping V2 engine range
+// - one for the range after V2 engine
+func (e *engineRouter) splitOverlapping(r queryrangebase.Request, v2Start, v2End time.Time) []*engineReqResp {
+	var (
+		reqs []*engineReqResp
+
+		stepNs = r.GetStep() * int64(time.Millisecond)
+		gap    = time.Duration(stepNs)
+	)
+
+	// metric query splits are separated by a gap of 1 step. This is to ensure a step is included only in a single split.
+	if !e.forMetricQuery {
+		gap = 0
+	}
+
+	// align the ranges by step before splitting.
+	start, end := alignStartEnd(stepNs, r.GetStart(), r.GetEnd())
+	v2Start, v2End = alignStartEnd(stepNs, v2Start, v2End)
+
+	// chunk req before V2 engine range
+	if start.Before(v2Start) {
+		reqs = append(reqs, &engineReqResp{
+			lokiResult: lokiResult{
+				req: r.WithStartEnd(start, v2Start.Add(-gap)), // add gap between splits
+				ch:  make(chan *packedResp),
+			},
+			isV2Engine: false,
+		})
+	}
+
+	addSplitGap := false
+	// chunk req after V2 engine range
+	if end.After(v2End) {
+		reqs = append(reqs, &engineReqResp{
+			lokiResult: lokiResult{
+				req: r.WithStartEnd(v2End, end),
+				ch:  make(chan *packedResp),
+			},
+			isV2Engine: false,
+		})
+
+		// add gap after v2 query only if there is a chunk query after it.
+		addSplitGap = true
+	}
+
+	if start.After(v2Start) {
+		v2Start = start
+	}
+	if end.Before(v2End) {
+		v2End = end
+	} else if addSplitGap {
+		v2End = v2End.Add(-gap)
+	}
+
+	return append(reqs, &engineReqResp{
+		lokiResult: lokiResult{
+			req: r.WithStartEnd(v2Start, v2End),
+			ch:  make(chan *packedResp),
+		},
+		isV2Engine: true,
+	})
+}
+
+func (e *engineRouter) handleReq(ctx context.Context, r *engineReqResp) {
+	var resp packedResp
+	if r.isV2Engine {
+		resp.resp, resp.err = e.v2Next.Do(ctx, r.req)
+	} else {
+		resp.resp, resp.err = e.v1Next.Do(ctx, r.req)
+	}
+
+	select {
+	case <-ctx.Done():
+		return
+	case r.ch <- &resp:
+	}
+}
+
+// process executes the inputs in parallel and collects the responses.
+func (e *engineRouter) process(ctx context.Context, inputs []*engineReqResp, limit uint32) ([]queryrangebase.Response, error) {
+	ctx, cancel := context.WithCancelCause(ctx)
+	defer cancel(errors.New("engine router process cancelled"))
+
+	// Run all requests in parallel as we only get a max of 3 splits.
+	for _, r := range inputs {
+		go e.handleReq(ctx, r)
+	}
+
+	var responses []queryrangebase.Response
+	var count int64
+	for _, x := range inputs {
+		select {
+		case <-ctx.Done():
+			return nil, ctx.Err()
+		case data := <-x.ch:
+			if data.err != nil {
+				return nil, data.err
+			}
+
+			responses = append(responses, data.resp)
+			if limit > 0 {
+				// exit early if limit has been reached
+				if r, ok := data.resp.(*LokiResponse); ok {
+					count += r.Count()
+					if count >= int64(limit) {
+						return responses, nil
+					}
+				}
+			}
+
+		}
+	}
+
+	return responses, nil
+}
+
+// alignStartEnd aligns start and end times to step boundaries.
+func alignStartEnd(stepNs int64, start, end time.Time) (time.Time, time.Time) {
+	startNs := start.UnixNano()
+	endNs := end.UnixNano()
+
+	startNs -= startNs % stepNs // round down
+	if mod := endNs % stepNs; mod != 0 {
+		endNs += stepNs - mod // round up
+	}
+
+	return time.Unix(0, startNs), time.Unix(0, endNs)
+}