intel
diff --git a/‎CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions b/‎CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎Makefile‎
Lines changed: 22 additions & 6 deletions b/‎Makefile‎
Lines changed: 22 additions & 6 deletions
diff --git a/‎Makefile.config.example‎
Lines changed: 1 addition & 0 deletions b/‎Makefile.config.example‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎cmake/Dependencies.cmake‎
Lines changed: 20 additions & 0 deletions b/‎cmake/Dependencies.cmake‎
Lines changed: 20 additions & 0 deletions
diff --git a/‎cmake/Summary.cmake‎
Lines changed: 1 addition & 0 deletions b/‎cmake/Summary.cmake‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎include/caffe/layers/mkldnn_layers.hpp‎
Lines changed: 250 additions & 0 deletions b/‎include/caffe/layers/mkldnn_layers.hpp‎
Lines changed: 250 additions & 0 deletions
@@ -30,6 +30,7 @@ caffe_option(CPU_ONLY  "Build Caffe without CUDA support" OFF) # TODO: rename to
 caffe_option(USE_OPENMP "Build Caffe with OpenMP support" ON )
 caffe_option(USE_CUDNN "Build Caffe with cuDNN library support" ON IF NOT CPU_ONLY)
 caffe_option(USE_MKL2017_AS_DEFAULT_ENGINE "Use MKL2017 primitives for supported layers" OFF)
+caffe_option(USE_MKLDNN_AS_DEFAULT_ENGINE "Use MKL-DNN primitives for supported layers" OFF)
 caffe_option(BUILD_SHARED_LIBS "Build shared libraries" ON)
 caffe_option(BUILD_python "Build Python wrapper" ON)
 set(python_version "2" CACHE STRING "Specify which Python version to use")
 
@@ -403,10 +403,23 @@ ifeq ($(WITH_PYTHON_LAYER), 1)
 	LIBRARIES += $(PYTHON_LIBRARIES)
 endif
 
+# MKLDNN configuration
+# detect support for mkl-dnn primitives
+MKLDNN_LDFLAGS=
+MKLDNN_INCLUDE ?= $(MKLDNNROOT)/include
+ifneq ("$(wildcard $(MKLDNN_INCLUDE)/mkldnn.hpp)","")
+	CXXFLAGS += -DMKLDNN_SUPPORTED -std=c++11
+	ifeq ($(USE_MKLDNN_AS_DEFAULT_ENGINE), 1)
+	CXXFLAGS += -DUSE_MKLDNN_AS_DEFAULT_ENGINE
+	endif
+	LIBRARIES += mkldnn
+	MKLDNN_LDFLAGS+=-L$(MKLDNNROOT)/lib -Wl,-rpath,$(MKLDNNROOT)/lib
+endif
+
 # BLAS configuration (default = MKL)
+MKL_LDFLAGS=
 MKL_EXTERNAL := 0
 BLAS ?= mkl
-MKL_LDFLAGS=
 ifeq ($(BLAS), mkl)
 	# MKL
 	ICC_ON=0
@@ -463,6 +476,9 @@ endif
 INCLUDE_DIRS += $(BLAS_INCLUDE)
 LIBRARY_DIRS += $(BLAS_LIB)
 
+INCLUDE_DIRS += $(MKLDNN_INCLUDE)
+LIBRARY_DIRS += $(MKLDNN_LIB)
+
 LIBRARY_DIRS += $(LIB_BUILD_DIR)
 
 # Automatic dependency generation (nvcc is handled separately)
@@ -672,7 +688,7 @@ $(ALL_BUILD_DIRS): | $(BUILD_DIR_LINK)
 
 $(DYNAMIC_NAME): $(OBJS) | $(LIB_BUILD_DIR)
 	@ echo LD -o $@
-	$(Q)$(CXX) -shared -o $@ $(OBJS) $(VERSIONFLAGS) $(LINKFLAGS) $(MKL_LDFLAGS) $(CXX_HARDENING_FLAGS) $(LINKER_SHARED_HARDENING_FLAGS) $(LDFLAGS)
+	$(Q)$(CXX) -shared -o $@ $(OBJS) $(VERSIONFLAGS) $(LINKFLAGS) $(MKL_LDFLAGS) $(MKLDNN_LDFLAGS) $(CXX_HARDENING_FLAGS) $(LINKER_SHARED_HARDENING_FLAGS) $(LDFLAGS)
 	@ cd $(BUILD_DIR)/lib; rm -f $(DYNAMIC_NAME_SHORT);   ln -s $(DYNAMIC_VERSIONED_NAME_SHORT) $(DYNAMIC_NAME_SHORT)
 
 $(STATIC_NAME): $(OBJS) | $(LIB_BUILD_DIR)
@@ -704,7 +720,7 @@ $(TEST_ALL_BIN): $(TEST_MAIN_SRC) $(TEST_OBJS) $(GTEST_OBJS) \
 		| $(DYNAMIC_NAME) $(TEST_BIN_DIR)
 	@ echo CXX/LD -o $@ $<
 	$(Q)$(CXX) $(TEST_MAIN_SRC) $(TEST_OBJS) $(GTEST_OBJS) \
-		-o $@ $(LINKFLAGS) $(MKL_LDFLAGS) $(CXX_HARDENING_FLAGS) $(LINKER_EXEC_HARDENING_FLAGS) $(LDFLAGS) -l$(LIBRARY_NAME) -Wl,-rpath,$(ORIGIN)/../lib
+		-o $@ $(LINKFLAGS) $(MKL_LDFLAGS) $(MKLDNN_LDFLAGS) $(CXX_HARDENING_FLAGS) $(LINKER_EXEC_HARDENING_FLAGS) $(LDFLAGS) -l$(LIBRARY_NAME) -Wl,-rpath,$(ORIGIN)/../lib
 
 $(TEST_CU_BINS): $(TEST_BIN_DIR)/%.testbin: $(TEST_CU_BUILD_DIR)/%.o \
 	$(GTEST_OBJS) | $(DYNAMIC_NAME) $(TEST_BIN_DIR)
@@ -716,7 +732,7 @@ $(TEST_CXX_BINS): $(TEST_BIN_DIR)/%.testbin: $(TEST_CXX_BUILD_DIR)/%.o \
 	$(GTEST_OBJS) | $(DYNAMIC_NAME) $(TEST_BIN_DIR)
 	@ echo LD $<
 	$(Q)$(CXX) $(TEST_MAIN_SRC) $< $(GTEST_OBJS) \
-		-o $@ $(LINKFLAGS) $(MKL_LDFLAGS) $(CXX_HARDENING_FLAGS) $(LINKER_EXEC_HARDENING_FLAGS) $(LDFLAGS) -l$(LIBRARY_NAME) -Wl,-rpath,$(ORIGIN)/../lib
+		-o $@ $(LINKFLAGS) $(MKL_LDFLAGS) $(MKLDNN_LDFLAGS) $(CXX_HARDENING_FLAGS) $(LINKER_EXEC_HARDENING_FLAGS) $(LDFLAGS) -l$(LIBRARY_NAME) -Wl,-rpath,$(ORIGIN)/../lib
 
 # Target for extension-less symlinks to tool binaries with extension '*.bin'.
 $(TOOL_BUILD_DIR)/%: $(TOOL_BUILD_DIR)/%.bin | $(TOOL_BUILD_DIR)
@@ -725,12 +741,12 @@ $(TOOL_BUILD_DIR)/%: $(TOOL_BUILD_DIR)/%.bin | $(TOOL_BUILD_DIR)
 
 $(TOOL_BINS): %.bin : %.o | $(DYNAMIC_NAME)
 	@ echo CXX/LD -o $@
-	$(Q)$(CXX) $< -o $@ $(LINKFLAGS) $(MKL_LDFLAGS) $(CXX_HARDENING_FLAGS) $(LINKER_EXEC_HARDENING_FLAGS) -l$(LIBRARY_NAME) $(LDFLAGS) \
+	$(Q)$(CXX) $< -o $@ $(LINKFLAGS) $(MKL_LDFLAGS) $(MKLDNN_LDFLAGS) $(CXX_HARDENING_FLAGS) $(LINKER_EXEC_HARDENING_FLAGS) -l$(LIBRARY_NAME) $(LDFLAGS) \
 		-Wl,-rpath,$(ORIGIN)/../lib
 
 $(EXAMPLE_BINS): %.bin : %.o | $(DYNAMIC_NAME)
 	@ echo CXX/LD -o $@
-	$(Q)$(CXX) $< -o $@ $(LINKFLAGS) $(CXX_HARDENING_FLAGS) $(LINKER_EXEC_HARDENING_FLAGS) -l$(LIBRARY_NAME) $(LDFLAGS) \
+	$(Q)$(CXX) $< -o $@ $(LINKFLAGS) $(MKL_LDFLAGS) $(MKLDNN_LDFLAGS) $(CXX_HARDENING_FLAGS) $(LINKER_EXEC_HARDENING_FLAGS) -l$(LIBRARY_NAME) $(LDFLAGS) \
 		-Wl,-rpath,$(ORIGIN)/../../lib
 
 proto: $(PROTO_GEN_CC) $(PROTO_GEN_HEADER)
 
@@ -9,6 +9,7 @@
 
 # Uncomment to use optimized MKL2017 primitives by default for supported layers
 # USE_MKL2017_AS_DEFAULT_ENGINE := 1
+# USE_MKLDNN_AS_DEFAULT_ENGINE := 1
 
 # uncomment to disable IO dependencies and corresponding data layers
 # USE_OPENCV := 0
 
@@ -184,6 +184,26 @@ if(BLAS STREQUAL "MKL" OR BLAS STREQUAL "mkl")
   endif()
 endif()
 
+# ---[ MKLDNN
+set(MKLDNN_INCLUDE_DIR "$ENV{MKLDNNROOT}/include/")
+if(EXISTS ${MKLDNN_INCLUDE_DIR}/mkldnn.hpp)
+  message(STATUS "Found MKLDNN")
+  set(MKLDNN_SUPPORTED ON)
+  set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -DMKLDNN_SUPPORTED -std=c++11")
+  if(USE_MKLDNN_AS_DEFAULT_ENGINE)
+    message(STATUS "MKLDNN engine will be used as a default engine")
+    set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -DUSE_MKLDNN_AS_DEFAULT_ENGINE")
+  endif()
+  list(APPEND Caffe_LINKER_LIBS "$ENV{MKLDNNROOT}/lib/libmkldnn.so")
+	include_directories(SYSTEM ${MKLDNN_INCLUDE_DIR})
+else()
+  message(STATUS "MKLDNN not found. MKLDNN_INCLUDE_DIR = ${MKLDNN_INCLUDE_DIR}")
+  set(MKLDNN_SUPPORTED OFF)
+  if(USE_MKLDNN_AS_DEFAULT_ENGINE)
+    message(WARNING "Flag USE_MKLDNN_AS_DEFAULT_ENGINE was set, but MKLDNN not found")
+  endif()
+endif()
+
 # ---[ Python
 if(BUILD_python)
   if(NOT "${python_version}" VERSION_LESS "3.0.0")
 
@@ -126,6 +126,7 @@ function(caffe_print_configuration_summary)
   if(BLAS STREQUAL "MKL" OR BLAS STREQUAL "mkl")
     caffe_status("  MKL2017_SUPPORTED : " MKL2017_SUPPORTED AND USE_MKL2017_AS_DEFAULT_ENGINE THEN "ON, is a default engine" ELSE "  ${MKL2017_SUPPORTED}")
   endif()
+  caffe_status("  MKLDNN_SUPPORTED : " MKLDNN_SUPPORTED AND USE_MKLDNN_AS_DEFAULT_ENGINE THEN "ON, is a default engine" ELSE "  ${MKLDNN_SUPPORTED}")
   caffe_status("  Boost             :   Yes (ver. ${Boost_MAJOR_VERSION}.${Boost_MINOR_VERSION})")
   caffe_status("  glog              :   Yes")
   caffe_status("  gflags            :   Yes")
 
@@ -0,0 +1,250 @@
+#ifndef CAFFE_MKLDNN_LAYERS_HPP_
+#define CAFFE_MKLDNN_LAYERS_HPP_
+
+#include <string>
+#include <vector>
+
+#include "boost/enable_shared_from_this.hpp"
+#include "caffe/blob.hpp"
+#include "caffe/common.hpp"
+#include "caffe/layers/base_conv_layer.hpp"
+#include "caffe/layers/conv_layer.hpp"
+#include "caffe/layers/inner_product_layer.hpp"
+#include "caffe/layers/neuron_layer.hpp"
+#include "caffe/proto/caffe.pb.h"
+#include "caffe/mkldnn_memory.hpp"
+#include "mkldnn.hpp"
+
+using namespace mkldnn;
+
+namespace caffe {
+
+// =====  CpuEngine =======================================
+// cpu_engine singleton
+class CpuEngine
+{
+public:
+    static CpuEngine & Instance()
+    {
+        // I's thread-safe in C++11.
+        static CpuEngine myInstance;
+        return myInstance;
+    }
+    CpuEngine(CpuEngine const&) = delete;             // Copy construct
+    CpuEngine(CpuEngine&&) = delete;                  // Move construct
+    CpuEngine& operator=(CpuEngine const&) = delete;  // Copy assign
+    CpuEngine& operator=(CpuEngine &&) = delete;      // Move assign
+
+    engine & get_engine() { return _cpu_engine; }
+protected:
+    CpuEngine() : _cpu_engine(engine::cpu, 0) {}
+    ~CpuEngine() {}
+private:
+    engine _cpu_engine;
+};
+
+// =====  MKLDNNConvolutionLayer =======================================
+template <typename Dtype>
+class MKLDNNConvolutionLayer : public ConvolutionLayer<Dtype> {
+public:
+    explicit MKLDNNConvolutionLayer(const LayerParameter& param);
+    virtual ~MKLDNNConvolutionLayer() {}
+protected:
+    virtual void Forward_cpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Forward_gpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Backward_cpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down
+                                , const vector<Blob<Dtype>*>& bottom);
+    virtual void Backward_gpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down
+                                , const vector<Blob<Dtype>*>& bottom);
+    // Customized methods
+    virtual void LayerSetUp(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    void Reshape(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+private:
+    virtual void compute_output_shape();
+    virtual void init_properties(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    void InitConvolution(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+
+    shared_ptr<MKLDNNData<Dtype> > fwd_bottom_data, fwd_top_data, fwd_weights_data, fwd_bias_data;
+    shared_ptr<convolution::primitive_desc> convFwd_pd;
+
+    shared_ptr<convolution> convFwd;
+    shared_ptr<memory> input_memory, weights_memory, bias_memory, output_memory;
+
+    uint32_t width_, height_, width_out_, height_out_, kernel_w_, kernel_h_, stride_w_, stride_h_;
+    int  pad_w_, pad_h_;
+};
+
+// =====  MKLDNNInnerProductLayer =======================================
+template <typename Dtype>
+class MKLDNNInnerProductLayer : public InnerProductLayer<Dtype> {
+public:
+    explicit MKLDNNInnerProductLayer(const LayerParameter& param);
+    virtual ~MKLDNNInnerProductLayer();
+protected:
+    virtual void Forward_cpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Forward_gpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Backward_cpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down
+                                , const vector<Blob<Dtype>*>& bottom);
+    virtual void Backward_gpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down
+                                , const vector<Blob<Dtype>*>& bottom);
+    // Customized methods
+    virtual void LayerSetUp(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    void Reshape(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+private:
+    void InitInnerProduct(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+
+    shared_ptr<MKLDNNData<Dtype> > fwd_bottom_data, fwd_top_data, fwd_weights_data, fwd_bias_data;
+    shared_ptr<inner_product::primitive_desc> ipFwd_pd;
+
+    shared_ptr<inner_product> ipFwd;
+    shared_ptr<memory> input_memory, weights_memory, bias_memory, output_memory;
+
+    uint32_t w_, h_;
+};
+
+
+/**
+ * @brief Normalize the input in a local region across feature maps.
+ */
+
+// =====  MKLDNNLRNLayer =======================================
+template <typename Dtype>
+class MKLDNNLRNLayer : public Layer<Dtype> {
+public:
+    explicit MKLDNNLRNLayer(const LayerParameter& param)
+        : Layer<Dtype>(param)
+        , fwd_top_data(NULL)
+        , fwd_bottom_data(NULL)
+        , lrnFwd_pd(NULL)
+        , lrnFwd(NULL)
+        , input_memory(NULL)
+        , output_memory(NULL)
+        , scratch_(NULL) {}
+    virtual ~MKLDNNLRNLayer() {}
+protected:
+    virtual void LayerSetUp(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Reshape(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Forward_cpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Backward_cpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down
+                                , const vector<Blob<Dtype>*>& bottom);
+    virtual void Forward_gpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Backward_gpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down
+                                , const vector<Blob<Dtype>*>& bottom);
+
+    virtual inline const char* type() const { return "LRN"; }
+    virtual inline int ExactNumBottomBlobs() const { return 1; }
+    virtual inline int ExactNumTopBlobs() const { return 1; }
+private:
+    void InitLRN(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+
+    Dtype alpha_, beta_, k_;
+    int size_, num_, width_, height_, channels_;
+
+    shared_ptr<MKLDNNData<Dtype> > fwd_top_data, fwd_bottom_data;
+    shared_ptr<lrn::primitive_desc> lrnFwd_pd;
+
+    shared_ptr<lrn> lrnFwd;
+    shared_ptr<memory> input_memory, output_memory;
+
+    shared_ptr<memory> scratch_;
+};
+
+// ===== MKLDNNPoolingLayer =======================================
+template <typename Dtype>
+class MKLDNNPoolingLayer : public Layer<Dtype> {
+public:
+    explicit MKLDNNPoolingLayer(const LayerParameter& param)
+            : Layer<Dtype>(param)
+            , fwd_top_data(NULL)
+            , fwd_bottom_data(NULL)
+            , poolingFwd_pd(NULL)
+            , poolingFwd(NULL)
+            , indices_memory(NULL)
+            , input_memory(NULL)
+            , output_memory(NULL)
+            , indices_pd(NULL)
+            {}
+    ~MKLDNNPoolingLayer() {}
+protected:
+    virtual void LayerSetUp(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Reshape(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+
+    virtual inline const char* type() const { return "Pooling"; }
+    virtual inline int ExactNumBottomBlobs() const { return 1; }
+    virtual inline int MinTopBlobs() const { return 1; }
+    // MAX POOL layers can output an extra top blob for the mask;
+    // others can only output the pooled inputs.
+    virtual inline int MaxTopBlobs() const {
+        return (this->layer_param_.pooling_param().pool() == PoolingParameter_PoolMethod_MAX) ? 2 : 1;
+    }
+protected:
+    virtual void Forward_cpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Forward_gpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Backward_cpu(const vector<Blob<Dtype>*>& top,const vector<bool>& propagate_down
+                                ,const vector<Blob<Dtype>*>& bottom);
+    virtual void Backward_gpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down
+                                ,const vector<Blob<Dtype>*>& bottom);
+
+private:
+    void InitPooling(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+
+    uint32_t num_, channels_, width_, height_, width_out_, height_out_;
+    uint32_t kernel_w_, kernel_h_;
+    uint32_t stride_w_, stride_h_;
+    int32_t  pad_w_, pad_h_;
+
+    Blob<uint32_t> max_idx_;
+    bool global_pooling_;
+
+    shared_ptr<MKLDNNData<Dtype> > fwd_top_data, fwd_bottom_data;
+    shared_ptr<pooling::primitive_desc> poolingFwd_pd;
+    shared_ptr<pooling> poolingFwd;
+    shared_ptr<memory> indices_memory, input_memory, output_memory;
+    shared_ptr<memory::primitive_desc> indices_pd;
+
+};
+
+// =====  MKLDNNReLULayer =======================================
+template <typename Dtype>
+class MKLDNNReLULayer : public NeuronLayer<Dtype> {
+public:
+    /**
+    * @param param provides ReLUParameter relu_param,
+    *     with ReLULayer options:
+    *   - negative_slope (\b optional, default 0).
+    *     the value @f$ \nu @f$ by which negative values are multiplied.
+    */
+    explicit MKLDNNReLULayer(const LayerParameter& param)
+            : NeuronLayer<Dtype>(param)
+            , fwd_top_data    (NULL)
+            , fwd_bottom_data (NULL)
+            , reluFwd_pd(NULL)
+            , reluFwd(NULL)
+            , input_memory(NULL)
+            , output_memory(NULL)
+        {}
+
+    ~MKLDNNReLULayer() {}
+protected:
+    virtual void LayerSetUp(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Reshape(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual inline const char* type() const { return "ReLU"; }
+    virtual void Forward_cpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Forward_gpu(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    virtual void Backward_cpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down
+                                , const vector<Blob<Dtype>*>& bottom);
+    virtual void Backward_gpu(const vector<Blob<Dtype>*>& top, const vector<bool>& propagate_down
+                                , const vector<Blob<Dtype>*>& bottom);
+private:
+    void InitReLU(const vector<Blob<Dtype>*>& bottom, const vector<Blob<Dtype>*>& top);
+    shared_ptr<MKLDNNData<Dtype> > fwd_top_data, fwd_bottom_data;
+    shared_ptr<relu::primitive_desc> reluFwd_pd;
+
+    shared_ptr<relu> reluFwd;
+    shared_ptr<memory> input_memory, output_memory;
+
+    uint32_t num_, width_, height_, channels_;
+};
+
+}  // namespace caffe
+#endif  // #ifndef CAFFE_MKLDNN_LAYERS_HPP_