fix include in tensorrt-inl.h, fix bug following modification of buildCudaEngine, changer assert_allclose to assert_almost_equal

Caenorst · Caenorst · commit d086543263fd · 2019-08-06T13:46:12.000-07:00
diff --git a/src/operator/subgraph/tensorrt/nnvm_to_onnx-inl.h b/src/operator/subgraph/tensorrt/nnvm_to_onnx-inl.h
@@ -140,17 +140,17 @@ void ConvertBatchNorm(NodeProto *node_proto,
                     const nnvm::IndexedGraph &ig,
                     const array_view<IndexedGraph::NodeEntry> &inputs);
 
-void ConvertElementwiseSub(NodeProto *node_proto,
+void ConvertElementwiseAdd(NodeProto *node_proto,
                     const NodeAttrs &attrs,
                     const nnvm::IndexedGraph &ig,
                     const array_view<IndexedGraph::NodeEntry> &inputs);
 
-void ConvertElementwiseSub(NodeProto *node_proto,
+void ConvertElementwiseMul(NodeProto *node_proto,
                     const NodeAttrs &attrs,
                     const nnvm::IndexedGraph &ig,
                     const array_view<IndexedGraph::NodeEntry> &inputs);
 
-void ConvertElementwiseMul(NodeProto *node_proto,
+void ConvertElementwiseSub(NodeProto *node_proto,
                     const NodeAttrs &attrs,
                     const nnvm::IndexedGraph &ig,
                     const array_view<IndexedGraph::NodeEntry> &inputs);
@@ -183,8 +183,8 @@ static const std::unordered_map<std::string, ConverterFunction> converter_map =
   {"Concat", ConvertConcatenate},
   {"Dropout", ConvertDropout},
   {"elemwise_add", ConvertElementwiseAdd},
-  {"elemwise_sub", ConvertElementwiseSub},
   {"elemwise_mul", ConvertElementwiseMul},
+  {"elemwise_sub", ConvertElementwiseSub},
   {"Flatten", ConvertFlatten},
   {"FullyConnected", ConvertFullyConnected},
   {"Pad", ConvertPad},
diff --git a/src/operator/subgraph/tensorrt/tensorrt-inl.h b/src/operator/subgraph/tensorrt/tensorrt-inl.h
@@ -34,6 +34,13 @@
 #include <string>
 #include <vector>
 
+#include "../../nn/activation-inl.h"
+#include "../../nn/batch_norm-inl.h"
+#include "../../nn/concat-inl.h"
+#include "../../nn/convolution-inl.h"
+#include "../../nn/dropout-inl.h"
+#include "../../nn/fully_connected-inl.h"
+#include "../../nn/pooling-inl.h"
 #include "../common.h"
 #include "../subgraph_property.h"
 #include "nnvm_to_onnx-inl.h"
diff --git a/tests/python/gpu/test_tensorrt.py b/tests/python/gpu/test_tensorrt.py
@@ -20,7 +20,7 @@
 from itertools import product
 import copy
 
-from mxnet.test_utils import assert_allclose
+from mxnet.test_utils import assert_almost_equal
 
 def check_unsupported_single_sym(sym):
     wrapped_sym = mx.sym.Group([mx.sym.identity(s) for s in sym])
@@ -74,15 +74,8 @@ def check_single_sym(sym, arg_params_shapes=None, aux_params_shapes=None,
 
         trt_fp32_outputs = [arr.asnumpy() for arr in trt_fp32_executor.outputs]
         for j, (orig, fp16, fp32) in enumerate(zip(orig_outputs, trt_fp16_outputs, trt_fp32_outputs)):
-            #abs_orig = abs(orig)
-            #diff32 = abs(fp32 - orig)
-            #diff16 = abs(fp16.astype('float32') - orig)
-            #_atol32 = diff32 - rtol_fp32 * abs_orig
-            #_atol16 = diff16 - rtol_fp16 * abs_orig
-            #print("{}: diff32({:.2E}) | diff16({:.2E}) | atol32({:.2E}) | atol16({:.2E}) | orig.min({:.2E})".format(
-            #      j, diff32.max(), diff16.max(), _atol32.max(), _atol16.max(), abs_orig.min()))
-            assert_allclose(fp32, orig, rtol=rtol_fp32, atol=atol_fp32)
-            assert_allclose(fp16.astype('float32'), orig, rtol=rtol_fp16, atol=atol_fp16)
+            assert_almost_equal(fp32, orig, rtol=rtol_fp32, atol=atol_fp32)
+            assert_almost_equal(fp16.astype('float32'), orig, rtol=rtol_fp16, atol=atol_fp16)
 
 def test_noop():
     data = mx.sym.Variable('data')
@@ -108,7 +101,7 @@ def test_fp16():
     executor.copy_params_from(arg_params, {})
     executor.forward(is_train=False)
     outputs = executor.outputs[0].asnumpy()
-    assert_allclose(outputs, arr, rtol=0., atol=0.)
+    assert_almost_equal(outputs, arr, rtol=0., atol=0.)
 
 def test_convolution2d():
     data = mx.sym.Variable('data')
@@ -318,15 +311,8 @@ def check_batch_norm(sym, arg_params_shapes=None, aux_params_shapes=None,
         for j, (orig, fp16, fp32) in enumerate(zip(orig_outputs,
                                                    trt_fp16_outputs,
                                                    trt_fp32_outputs)):
-            #abs_orig = abs(orig)
-            #diff32 = abs(fp32 - orig)
-            #diff16 = abs(fp16.astype('float32') - orig)
-            #_atol32 = diff32 - rtol_fp32 * abs_orig
-            #_atol16 = diff16 - rtol_fp16 * abs_orig
-            #print("{}: diff32({:.2E}) | diff16({:.2E}) | atol32({:.2E}) | atol16({:.2E}) | orig.min({:.2E})".format(
-            #      j, diff32.max(), diff16.max(), _atol32.max(), _atol16.max(), abs_orig.min()))
-            assert_allclose(fp32, orig, rtol=rtol_fp32, atol=atol_fp32)
-            assert_allclose(fp16.astype('float32'), orig, rtol=rtol_fp16, atol=atol_fp16)
+            assert_almost_equal(fp32, orig, rtol=rtol_fp32, atol=atol_fp32)
+            assert_almost_equal(fp16.astype('float32'), orig, rtol=rtol_fp16, atol=atol_fp16)
 
 def test_batch_norm():
     data = mx.sym.Variable('data')