apache
diff --git a/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/Analyzer.scala‎
Lines changed: 25 additions & 0 deletions b/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/Analyzer.scala‎
Lines changed: 25 additions & 0 deletions
diff --git a/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/CheckAnalysis.scala‎
Lines changed: 2 additions & 1 deletion b/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/CheckAnalysis.scala‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/expressions/codegen/CodeGenerator.scala‎
Lines changed: 47 additions & 0 deletions b/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/expressions/codegen/CodeGenerator.scala‎
Lines changed: 47 additions & 0 deletions
diff --git a/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/expressions/collectionOperations.scala‎
Lines changed: 136 additions & 1 deletion b/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/expressions/collectionOperations.scala‎
Lines changed: 136 additions & 1 deletion
diff --git a/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/expressions/ordering.scala‎
Lines changed: 6 additions & 1 deletion b/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/expressions/ordering.scala‎
Lines changed: 6 additions & 1 deletion
diff --git a/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/util/TypeUtils.scala‎
Lines changed: 8 additions & 3 deletions b/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/util/TypeUtils.scala‎
Lines changed: 8 additions & 3 deletions
@@ -104,6 +104,7 @@ class Analyzer(
       ResolveAggregateFunctions ::
       TimeWindowing ::
       ResolveInlineTables ::
+      SortMaps ::
       TypeCoercion.typeCoercionRules ++
       extendedResolutionRules : _*),
     Batch("Nondeterministic", Once,
@@ -2332,3 +2333,27 @@ object ResolveCreateNamedStruct extends Rule[LogicalPlan] {
       CreateNamedStruct(children.toList)
   }
 }
+
+/**
+ * MapType expressions are not comparable.
+ */
+object SortMaps extends Rule[LogicalPlan] {
+  private def hasUnorderedMap(e: Expression): Boolean = e.dataType match {
+    case m: MapType => !m.ordered
+    case _ => false
+  }
+
+  override def apply(plan: LogicalPlan): LogicalPlan = plan.transformAllExpressions {
+    case cmp @ BinaryComparison(left, right) if cmp.resolved && hasUnorderedMap(left) =>
+      cmp.withNewChildren(SortMap(left) :: right :: Nil)
+    case cmp @ BinaryComparison(left, right) if cmp.resolved && hasUnorderedMap(right) =>
+      cmp.withNewChildren(left :: SortMap(right) :: Nil)
+  } transform {
+    case a: Aggregate if a.resolved && a.groupingExpressions.exists(hasUnorderedMap) =>
+      a.transformExpressionsUp {
+        case a: Attribute if hasUnorderedMap(a) =>
+          Alias(SortMap(a), a.name)(exprId = a.exprId, qualifier = a.qualifier)
+        case e if hasUnorderedMap(e) => SortMap(e)
+      }
+  }
+}
@@ -190,7 +190,8 @@ trait CheckAnalysis extends PredicateHelper {
               case e if e.dataType.isInstanceOf[BinaryType] =>
                 failAnalysis(s"binary type expression ${e.sql} cannot be used " +
                   "in join conditions")
-              case e if e.dataType.isInstanceOf[MapType] =>
+              case e if e.dataType.isInstanceOf[MapType] &&
+                       !e.dataType.asInstanceOf[MapType].ordered =>
                 failAnalysis(s"map type expression ${e.sql} cannot be used " +
                   "in join conditions")
               case _ => // OK
 
@@ -544,6 +544,53 @@ class CodegenContext {
         """
       addNewFunction(compareFunc, funcCode)
       s"this.$compareFunc($c1, $c2)"
+    case MapType(keyType, valueType, _, true) =>
+      val compareFunc = freshName("compareMap")
+      val funcCode: String =
+        s"""
+          public int $compareFunc(MapData a, MapData b) {
+            int lengthA = a.numElements();
+            int lengthB = b.numElements();
+            ArrayData aKeys = a.keyArray();
+            ArrayData aValues = a.valueArray();
+            ArrayData bKeys = b.keyArray();
+            ArrayData bValues = b.valueArray();
+            int minLength = (lengthA > lengthB) ? lengthB : lengthA;
+            for (int i = 0; i < minLength; i++) {
+              ${javaType(keyType)} keyA = ${getValue("aKeys", valueType, "i")};
+              ${javaType(keyType)} keyB = ${getValue("bKeys", valueType, "i")};
+              int comp = ${genComp(valueType, "keyA", "keyB")};
+              if (comp != 0) {
+                return comp;
+              }
+              boolean isNullA = aValues.isNullAt(i);
+              boolean isNullB = bValues.isNullAt(i);
+              if (isNullA && isNullB) {
+                // Nothing
+              } else if (isNullA) {
+                return -1;
+              } else if (isNullB) {
+                return 1;
+              } else {
+                ${javaType(valueType)} valueA = ${getValue("aValues", valueType, "i")};
+                ${javaType(valueType)} valueB = ${getValue("bValues", valueType, "i")};
+                int comp = ${genComp(valueType, "valueA", "valueB")};
+                if (comp != 0) {
+                  return comp;
+                }
+              }
+            }
+
+            if (lengthA < lengthB) {
+              return -1;
+            } else if (lengthA > lengthB) {
+              return 1;
+            }
+            return 0;
+          }
+        """
+      addNewFunction(compareFunc, funcCode)
+      s"this.$compareFunc($c1, $c2)"
     case schema: StructType =>
       INPUT_ROW = "i"
       val comparisons = GenerateOrdering.genComparisons(this, schema)
 
@@ -21,7 +21,7 @@ import java.util.Comparator
 import org.apache.spark.sql.catalyst.InternalRow
 import org.apache.spark.sql.catalyst.analysis.TypeCheckResult
 import org.apache.spark.sql.catalyst.expressions.codegen.{CodegenContext, CodegenFallback, ExprCode}
-import org.apache.spark.sql.catalyst.util.{ArrayData, GenericArrayData, MapData}
+import org.apache.spark.sql.catalyst.util.{ArrayBasedMapData, ArrayData, GenericArrayData, MapData}
 import org.apache.spark.sql.types._
 
 /**
@@ -287,3 +287,138 @@ case class ArrayContains(left: Expression, right: Expression)
 
   override def prettyName: String = "array_contains"
 }
+
+/**
+ * This expression sorts a map in ascending order.
+ */
+case class SortMap(child: Expression) extends UnaryExpression with ExpectsInputTypes {
+
+  override def inputTypes: Seq[AbstractDataType] = Seq(MapType)
+
+  /** Create a data type in which all maps are ordered. */
+  private[this] def createDataType(dataType: DataType): DataType = dataType match {
+    case StructType(fields) =>
+      StructType(fields.map { field =>
+        field.copy(dataType = createDataType(field.dataType))
+      })
+    case ArrayType(elementType, containsNull) =>
+      ArrayType(createDataType(elementType), containsNull)
+    case MapType(keyType, valueType, valueContainsNull, false) =>
+      MapType(createDataType(keyType), createDataType(valueType), valueContainsNull, true)
+    case _ =>
+      dataType
+  }
+
+  override lazy val dataType: DataType = createDataType(child.dataType)
+
+  private[this] val id = identity[Any] _
+
+  /**
+   * Create a function that transforms a Spark SQL datum to a new datum for which all MapData
+   * elements have been ordered.
+   */
+  private[this] def createTransform(dataType: DataType): Option[Any => Any] = {
+    dataType match {
+      case m@MapType(keyType, valueType, _, false) =>
+        val keyTransform = createTransform(keyType).getOrElse(id)
+        val valueTransform = createTransform(valueType).getOrElse(id)
+        val ordering = Ordering.Tuple2(m.interpretedKeyOrdering, m.interpretedValueOrdering)
+        Option((data: Any) => {
+          val input = data.asInstanceOf[MapData]
+          val length = input.numElements()
+          val buffer = Array.ofDim[(Any, Any)](length)
+
+          // Move the entries into a temporary buffer.
+          var i = 0
+          val keys = input.keyArray()
+          val values = input.valueArray()
+          while (i < length) {
+            val key = keyTransform(keys.get(i, keyType))
+            val value = if (!values.isNullAt(i)) {
+              valueTransform(values.get(i, valueType))
+            } else {
+              null
+            }
+            buffer(i) = key -> value
+            i += 1
+          }
+
+          // Sort the buffer.
+          java.util.Arrays.sort(buffer, ordering)
+
+          // Recreate the map data.
+          i = 0
+          val sortedKeys = Array.ofDim[Any](length)
+          val sortedValues = Array.ofDim[Any](length)
+          while (i < length) {
+            sortedKeys(i) = buffer(i)._1
+            sortedValues(i) = buffer(i)._2
+            i += 1
+          }
+          ArrayBasedMapData(sortedKeys, sortedValues)
+        })
+      case ArrayType(dt, _) =>
+        createTransform(dt).map { transform =>
+          data: Any => {
+            val input = data.asInstanceOf[ArrayData]
+            val length = input.numElements()
+            val output = Array.ofDim[Any](length)
+            var i = 0
+            while (i < length) {
+              if (!input.isNullAt(i)) {
+                output(i) = transform(input.get(i, dt))
+              }
+              i += i
+            }
+            new GenericArrayData(output)
+          }
+        }
+      case StructType(fields) =>
+        val transformOpts = fields.map { field =>
+          createTransform(field.dataType)
+        }
+        // Only transform a struct if a meaningful transformation has been defined.
+        if (transformOpts.exists(_.isDefined)) {
+          val transforms = transformOpts.zip(fields).map { case (opt, field) =>
+            val dataType = field.dataType
+            val transform = opt.getOrElse(id)
+            (input: InternalRow, i: Int) => {
+              transform(input.get(i, dataType))
+            }
+          }
+          val length = fields.length
+          val tf = (data: Any) => {
+            val input = data.asInstanceOf[InternalRow]
+            val output = Array.ofDim[Any](length)
+            var i = 0
+            while (i < length) {
+              if (!input.isNullAt(i)) {
+                output(i) = transforms(i)(input, i)
+              }
+              i += 1
+            }
+            new GenericInternalRow(output)
+          }
+          Some(tf)
+        } else {
+          None
+        }
+      case _ =>
+        None
+    }
+  }
+
+  @transient private[this] lazy val transform = {
+    createTransform(child.dataType).getOrElse(id)
+  }
+
+  override protected def nullSafeEval(input: Any): Any = transform(input)
+
+  override def doGenCode(ctx: CodegenContext, ev: ExprCode): ExprCode = {
+    // TODO we should code generate this.
+    val tf = ctx.addReferenceObj("transform", transform, classOf[Any => Any].getCanonicalName)
+    nullSafeCodeGen(ctx, ev, eval => {
+      s"${ev.value} = (MapData)$tf.apply($eval);"
+    })
+  }
+}
@@ -53,6 +53,10 @@ class InterpretedOrdering(ordering: Seq[SortOrder]) extends Ordering[InternalRow
             a.interpretedOrdering.asInstanceOf[Ordering[Any]].compare(left, right)
           case a: ArrayType if order.direction == Descending =>
             a.interpretedOrdering.asInstanceOf[Ordering[Any]].reverse.compare(left, right)
+          case m: MapType if m.ordered && order.direction == Ascending =>
+            m.interpretedOrdering.asInstanceOf[Ordering[Any]].compare(left, right)
+          case m: MapType if m.ordered && order.direction == Descending =>
+            m.interpretedOrdering.asInstanceOf[Ordering[Any]].reverse.compare(left, right)
           case s: StructType if order.direction == Ascending =>
             s.interpretedOrdering.asInstanceOf[Ordering[Any]].compare(left, right)
           case s: StructType if order.direction == Descending =>
@@ -66,7 +70,7 @@ class InterpretedOrdering(ordering: Seq[SortOrder]) extends Ordering[InternalRow
       }
       i += 1
     }
-    return 0
+    0
   }
 }
 
@@ -92,6 +96,7 @@ object RowOrdering {
     case dt: AtomicType => true
     case struct: StructType => struct.fields.forall(f => isOrderable(f.dataType))
     case array: ArrayType => isOrderable(array.elementType)
+    case map: MapType => map.ordered
     case udt: UserDefinedType[_] => isOrderable(udt.sqlType)
     case _ => false
   }
 
@@ -69,9 +69,14 @@ object TypeUtils {
   }
 
   def compareBinary(x: Array[Byte], y: Array[Byte]): Int = {
-    for (i <- 0 until x.length; if i < y.length) {
-      val res = x(i).compareTo(y(i))
-      if (res != 0) return res
+    var i = 0
+    val length = scala.math.min(x.length, y.length)
+    while (i < length) {
+      val res = x(i) - y(i)
+      if (res != 0) {
+        return res
+      }
+      i += 1
     }
     x.length - y.length
   }
Original file line number	Diff line number	Diff line change
`@@ -53,6 +53,10 @@ class InterpretedOrdering(ordering: Seq[SortOrder]) extends Ordering[InternalRow`
`53`	`53`	`a.interpretedOrdering.asInstanceOf[Ordering[Any]].compare(left, right)`
`54`	`54`	`case a: ArrayType if order.direction == Descending =>`
`55`	`55`	`a.interpretedOrdering.asInstanceOf[Ordering[Any]].reverse.compare(left, right)`
	`56`	`+ case m: MapType if m.ordered && order.direction == Ascending =>`
	`57`	`+ m.interpretedOrdering.asInstanceOf[Ordering[Any]].compare(left, right)`
	`58`	`+ case m: MapType if m.ordered && order.direction == Descending =>`
	`59`	`+ m.interpretedOrdering.asInstanceOf[Ordering[Any]].reverse.compare(left, right)`
`56`	`60`	`case s: StructType if order.direction == Ascending =>`
`57`	`61`	`s.interpretedOrdering.asInstanceOf[Ordering[Any]].compare(left, right)`
`58`	`62`	`case s: StructType if order.direction == Descending =>`
`@@ -66,7 +70,7 @@ class InterpretedOrdering(ordering: Seq[SortOrder]) extends Ordering[InternalRow`
`66`	`70`	`}`
`67`	`71`	`i += 1`
`68`	`72`	`}`
`69`		`- return 0`
	`73`	`+ 0`
`70`	`74`	`}`
`71`	`75`	`}`
`72`	`76`
`@@ -92,6 +96,7 @@ object RowOrdering {`
`92`	`96`	`case dt: AtomicType => true`
`93`	`97`	`case struct: StructType => struct.fields.forall(f => isOrderable(f.dataType))`
`94`	`98`	`case array: ArrayType => isOrderable(array.elementType)`
	`99`	`+ case map: MapType => map.ordered`
`95`	`100`	`case udt: UserDefinedType[_] => isOrderable(udt.sqlType)`
`96`	`101`	`case _ => false`
`97`	`102`	`}`
Original file line number	Diff line number	Diff line change
`@@ -69,9 +69,14 @@ object TypeUtils {`
`69`	`69`	`}`
`70`	`70`
`71`	`71`	`def compareBinary(x: Array[Byte], y: Array[Byte]): Int = {`
`72`		`- for (i <- 0 until x.length; if i < y.length) {`
`73`		`- val res = x(i).compareTo(y(i))`
`74`		`- if (res != 0) return res`
	`72`	`+ var i = 0`
	`73`	`+ val length = scala.math.min(x.length, y.length)`
	`74`	`+ while (i < length) {`
	`75`	`+ val res = x(i) - y(i)`
	`76`	`+ if (res != 0) {`
	`77`	`+ return res`
	`78`	`+ }`
	`79`	`+ i += 1`
`75`	`80`	`}`
`76`	`81`	`x.length - y.length`
`77`	`82`	`}`