improve the converter debugging (#466)

wenbingl · web-flow · commit 49e00fe8f3a9 · 2020-05-04T11:48:10.000-07:00
diff --git a/keras2onnx/_parser_1x.py b/keras2onnx/_parser_1x.py
@@ -83,7 +83,7 @@ def on_parsing_keras_layer(graph, node_list, layer, kenode, model, varset, prefi
     kenode_input_shapes = kenode.input_shapes if isinstance(kenode.input_shapes, list) else [kenode.input_shapes]
     for n_, i_ in enumerate(inputs):
         iname = prefix + i_.name
-        k2o_logger().debug('input : ' + iname)
+        k2o_logger().debug('\tinput : ' + iname)
         var_type = adjust_input_batch_size(infer_variable_type(i_, varset.target_opset, kenode_input_shapes[n_]))
         i0 = varset.get_local_variable_or_declare_one(iname, var_type)
         operator.add_input(i0)
@@ -92,22 +92,22 @@ def on_parsing_keras_layer(graph, node_list, layer, kenode, model, varset, prefi
         in_mask = layer.input_mask if isinstance(layer.input_mask, (list, tuple)) else [layer.input_mask]
         for im_ in [m_ for m_ in in_mask if m_ is not None]:
             mts_name = im_.name  # input mask in a shared model is not supported yet, why is it needed?
-            k2o_logger().debug('input mask: ' + mts_name)
+            k2o_logger().debug('\tinput mask: ' + mts_name)
             mts_var = varset.get_local_variable_or_declare_one(mts_name, infer_variable_type(im_, varset.target_opset))
             operator.add_input_mask(mts_var)
 
     kenode_output_shapes = kenode.output_shapes if isinstance(kenode.output_shapes, list) else [kenode.output_shapes]
     for n_, o_ in enumerate(outputs):
         oname = prefix + o_.name
-        k2o_logger().debug('output: ' + oname)
+        k2o_logger().debug('\toutput: ' + oname)
         o1 = varset.get_local_variable_or_declare_one(oname, infer_variable_type(o_, varset.target_opset, kenode_output_shapes[n_]))
         operator.add_output(o1)
 
     if hasattr(layer, 'output_mask') and layer.output_mask is not None:
         out_mask = layer.output_mask if isinstance(layer.output_mask, (list, tuple)) else [layer.output_mask]
         for om_ in [m_ for m_ in out_mask if m_ is not None]:
             mts_name = prefix + om_.name
-            k2o_logger().debug('output mask: ' + mts_name)
+            k2o_logger().debug('\toutput mask: ' + mts_name)
             mts_var = varset.get_local_variable_or_declare_one(mts_name, infer_variable_type(om_, varset.target_opset))
             operator.add_output_mask(mts_var)
 
diff --git a/keras2onnx/_parser_tf.py b/keras2onnx/_parser_tf.py
@@ -311,27 +311,27 @@ def on_parsing_keras_layer_v2(graph, layer_info, varset, prefix=None):
     for o_ in layer_info.outputs:
         if o_ not in output_masks:  # the layer converter will handle output_mask by itself.
             oname = prefix + o_.name
-            k2o_logger().debug('output: ' + oname)
+            k2o_logger().debug('\toutput: ' + oname)
             o1 = varset.get_local_variable_or_declare_one(oname, infer_variable_type(o_, varset.target_opset))
             operator.add_output(o1)
 
     for i_ in layer_info.inputs:
         if i_ not in input_masks:  # the layer converter will handle input_mask by itself.
             iname = prefix + i_.name
-            k2o_logger().debug('input : ' + iname)
+            k2o_logger().debug('\tinput : ' + iname)
             var_type = adjust_input_batch_size(infer_variable_type(i_, varset.target_opset))
             i0 = varset.get_local_variable_or_declare_one(iname, var_type)
             operator.add_input(i0)
 
     for om_ in [m_ for m_ in output_masks if m_ is not None]:
         mts_name = prefix + om_.name
-        k2o_logger().debug('output mask: ' + mts_name)
+        k2o_logger().debug('\toutput mask: ' + mts_name)
         mts_var = varset.get_local_variable_or_declare_one(mts_name, infer_variable_type(om_, varset.target_opset))
         operator.add_output_mask(mts_var)
 
     for im_ in [m_ for m_ in input_masks if m_ is not None]:
         mts_name = im_.name  # input mask in a shared model is not supported yet, why is it needed?
-        k2o_logger().debug('input mask: ' + mts_name)
+        k2o_logger().debug('\tinput mask: ' + mts_name)
         mts_var = varset.get_local_variable_or_declare_one(mts_name, infer_variable_type(im_, varset.target_opset))
         operator.add_input_mask(mts_var)
 
diff --git a/keras2onnx/parser.py b/keras2onnx/parser.py
@@ -313,12 +313,12 @@ def _on_parsing_tf_nodes(graph, nodelist, varset, debug_mode):
 
         for o_ in node_.outputs:
             oname = o_.name
-            k2o_logger().debug('output: ' + oname)
+            k2o_logger().debug('\toutput: ' + oname)
             out0 = varset.get_local_variable_or_declare_one(oname, infer_variable_type(o_, varset.target_opset))
             operator.add_output(out0)
 
         for i_ in node_.inputs:
-            k2o_logger().debug('input : ' + i_.name)
+            k2o_logger().debug('\tinput : ' + i_.name)
             var_type = infer_variable_type(i_, varset.target_opset)
             i0 = varset.get_local_variable_or_declare_one(i_.name, var_type)
             operator.add_input(i0)
diff --git a/keras2onnx/topology.py b/keras2onnx/topology.py
@@ -203,6 +203,53 @@ def _remove_unused_initializers(nodes, initializers):
     return adjusted_initializers
 
 
+def _remove_unused_nodes(nodes, inputs, outputs):
+    nodes_input_set = set()
+    for n_ in nodes:
+        for input_name_ in n_.input:
+            nodes_input_set.add(input_name_)
+
+    input_dict = set([in_.name for in_ in inputs])
+    output_dict = {}
+    for nd_ in nodes:
+        output_dict.update({o_: nd_ for o_ in nd_.output})
+
+    nodes_to_keep = set()
+    node_inputs = [output_dict[ts_.name] for ts_ in outputs]
+    while node_inputs:
+        nd_ = node_inputs[0]
+        del node_inputs[0]
+        if id(nd_) in nodes_to_keep:
+            continue
+
+        nodes_to_keep.add(id(nd_))
+        for in_ in nd_.input:
+            if in_ in output_dict:
+                node_inputs.append(output_dict[in_])
+            else:
+                assert in_ == '' or in_ in input_dict
+
+    return [nd_ for nd_ in nodes if id(nd_) in nodes_to_keep]
+
+
+def _build_extra_inputs(container):
+    # When calling ModelComponentContainer's add_initializer(...), nothing is added into the input list.
+    # However, In ONNX, for target opset < 9, initializers should also be model's (GraphProto) inputs.
+    # Thus, we create ValueInfoProto objects from initializers (type: TensorProto) directly and then add them into model's input list.
+    extra_inputs = []  # ValueInfoProto list of the initializers
+    for tensor in container.initializers:
+        # Sometimes (especially when creating optional input values such as RNN's initial hidden state), an initializer
+        # is also one of the original model's input, so it has been added into the container's input list. If this is
+        # the case, we need to skip one iteration to avoid duplicated inputs.
+        if tensor.name in [value_info.name for value_info in container.inputs]:
+            continue
+
+        # Initializers are always tensors so we can just call make_tensor_value_info(...)
+        value_info = helper.make_tensor_value_info(tensor.name, tensor.data_type, tensor.dims)
+        extra_inputs.append(value_info)
+    return extra_inputs
+
+
 def convert_topology(topology, model_name, doc_string, target_opset, channel_first_inputs=None):
     """
     This function is used to convert our Topology object defined in _parser.py into a ONNX model (type: ModelProto).
@@ -271,28 +318,15 @@ def convert_topology(topology, model_name, doc_string, target_opset, channel_fir
             raise RuntimeError("Unexpected error on find the converter for op {}".format(operator.type))
         cvt(scope, operator, container)
 
-    # When calling ModelComponentContainer's add_initializer(...), nothing is added into the input list.
-    # However, In ONNX, for target opset < 9, initializers should also be model's (GraphProto) inputs.
-    # Thus, we create ValueInfoProto objects from initializers (type: TensorProto) directly and then add them into model's input list.
-    extra_inputs = []  # ValueInfoProto list of the initializers
-    for tensor in container.initializers:
-        # Sometimes (especially when creating optional input values such as RNN's initial hidden state), an initializer
-        # is also one of the original model's input, so it has been added into the container's input list. If this is
-        # the case, we need to skip one iteration to avoid duplicated inputs.
-        if tensor.name in [value_info.name for value_info in container.inputs]:
-            continue
-
-        # Initializers are always tensors so we can just call make_tensor_value_info(...)
-        value_info = helper.make_tensor_value_info(tensor.name, tensor.data_type, tensor.dims)
-        extra_inputs.append(value_info)
-
     # enable the ONNX optimizations
     graph = None
-    nodes = container.nodes
+    extra_inputs = _build_extra_inputs(container)
+    nodes = _remove_unused_nodes(container.nodes, container.inputs + extra_inputs, container.outputs)
+
     if not topology.debug_mode:
         try:
             import onnxconverter_common
-            origin_node_number = len(container.nodes)
+            origin_node_number = len(nodes)
             if target_opset < 9:
                 nodes = onnxconverter_common.optimizer.optimize_onnx(nodes, nchw_inputs=nchw_inputs,
                                                                      inputs=container.inputs + extra_inputs,
@@ -307,7 +341,8 @@ def convert_topology(topology, model_name, doc_string, target_opset, channel_fir
                                                                            model_name=model_name,
                                                                            target_opset=container.target_opset)
                 node_number = len(graph.node)
-            k2o_logger().info("The node number after optimization: {} -> {}".format(origin_node_number, node_number))
+            k2o_logger().info(
+                "The ONNX operator number change on the optimization: {} -> {}".format(origin_node_number, node_number))
         except ImportError:
             onnx_not_imported = 'onnxconverter_common is not imported,'
             if nchw_inputs:
@@ -326,8 +361,8 @@ def convert_topology(topology, model_name, doc_string, target_opset, channel_fir
     if graph is None:
         # Create a graph from its main components
         adjusted_initializers = _remove_unused_initializers(nodes, container.initializers)
-        adjusted_extra_inputs = _remove_unused_initializers(nodes, extra_inputs)
         if target_opset < 9:
+            adjusted_extra_inputs = _remove_unused_initializers(nodes, extra_inputs)
             graph = helper.make_graph(nodes, model_name, container.inputs + adjusted_extra_inputs,
                                       container.outputs, adjusted_initializers)
         else: