Fix a bug in LinearActivationQuantizedTensor (#1400)

jerryzh168 · amdfaa · commit d14b3c257072 · 2025-01-10T23:36:40.000Z
* Fix a bug in LinearActivationQuantizedTensor

Summary:
quant_kwargs is not populated in some places

Test Plan:
python test/dtypes/test_affine_quantized_tensor_parallel.py

Reviewers:

Subscribers:

Tasks:

Tags:

* ruff
diff --git a/test/dtypes/test_affine_quantized_tensor_parallel.py b/test/dtypes/test_affine_quantized_tensor_parallel.py
@@ -181,6 +181,9 @@ class TestFloat8dqRowAffineQuantizedTensorParallel(
         def test_tp(self, dtype):
             return self._test_tp(dtype)
 
+    common_utils.instantiate_parametrized_tests(
+        TestFloat8woAffineQuantizedTensorParallel
+    )
     common_utils.instantiate_parametrized_tests(
         TestFloat8dqTensorAffineQuantizedTensorParallel
     )
diff --git a/torchao/quantization/linear_activation_quantized_tensor.py b/torchao/quantization/linear_activation_quantized_tensor.py
@@ -147,8 +147,8 @@ def _(func, types, args, kwargs):
         )
         input_quant_func = weight_tensor.input_quant_func
         original_weight_tensor = weight_tensor.original_weight_tensor
-        aqt = input_quant_func(input_tensor)
-        return func(bias, aqt, original_weight_tensor)
+        qtensor = input_quant_func(input_tensor, **weight_tensor.quant_kwargs)
+        return func(bias, qtensor, original_weight_tensor)
     else:
         # aten.mm.default
         assert args[0].shape[-1] == args[1].shape[0], (
@@ -161,8 +161,8 @@ def _(func, types, args, kwargs):
         )
         input_quant_func = weight_tensor.input_quant_func
         original_weight_tensor = weight_tensor.original_weight_tensor
-        aqt = input_quant_func(input_tensor)
-        return func(aqt, original_weight_tensor)
+        qtensor = input_quant_func(input_tensor, **weight_tensor.quant_kwargs)
+        return func(qtensor, original_weight_tensor)
 
 
 @implements(aten.detach.default)
@@ -203,7 +203,9 @@ def _(func, types, args, kwargs):
         args,
         kwargs,
         LinearActivationQuantizedTensor(
-            func(args[0].original_weight_tensor, *args[1:]), args[0].input_quant_func
+            func(args[0].original_weight_tensor, *args[1:]),
+            args[0].input_quant_func,
+            args[0].quant_kwargs,
         ),
     )
 
@@ -216,7 +218,9 @@ def _(func, types, args, kwargs):
         args,
         kwargs,
         LinearActivationQuantizedTensor(
-            func(args[0].original_weight_tensor, *args[1:]), args[0].input_quant_func
+            func(args[0].original_weight_tensor, *args[1:]),
+            args[0].input_quant_func,
+            args[0].quant_kwargs,
         ),
     )
 

Original file line number	Diff line number	Diff line change
`@@ -181,6 +181,9 @@ class TestFloat8dqRowAffineQuantizedTensorParallel(`
`181`	`181`	`def test_tp(self, dtype):`
`182`	`182`	`return self._test_tp(dtype)`
`183`	`183`
	`184`	`+ common_utils.instantiate_parametrized_tests(`
	`185`	`+ TestFloat8woAffineQuantizedTensorParallel`
	`186`	`+ )`
`184`	`187`	`common_utils.instantiate_parametrized_tests(`
`185`	`188`	`TestFloat8dqTensorAffineQuantizedTensorParallel`
`186`	`189`	`)`