Bugfixes in analysis and notebooks (#49)

NRauschmayr · web-flow · commit e94a40c1e0e1 · 2020-08-13T10:33:20.000-07:00
diff --git a/examples/profiler/analyze_performance_bottlenecks.ipynb b/examples/profiler/analyze_performance_bottlenecks.ipynb
@@ -46,7 +46,7 @@
    ],
    "source": [
     "\n",
-    "! pip install -q sdk/smdebug-0.9.2b20200807-py3-none-any.whl"
+    "! pip install -q ../sdk/smdebug-0.9.2b20200810-py2.py3-none-any.whl"
    ]
   },
   {
@@ -1478,7 +1478,7 @@
    "source": [
     "import matplotlib.pyplot as plt\n",
     "\n",
-    "plt.pie(system_usage.values(), autopct='%1.1f%%', labels=system_usage.keys())\n",
+    "plt.pie(system_usage.values(), autopct='%1.1f%%', labels=system_usage.keys(), labeldistance=1.3)\n",
     "plt.show()"
    ]
   },
@@ -1971,8 +1971,11 @@
    "source": [
     "import pandas as pd\n",
     "\n",
-    "dataloaders['start_time'] = pd.to_datetime(dataloaders['start_time'], format='%Y-%m-%dT%H:%M:%S:%f')\n",
-    "dataloaders = dataloaders.set_index(['start_time'])"
+    "if dataloaders.shape[0] > 0:\n",
+    "    dataloaders['start_time'] = pd.to_datetime(dataloaders['start_time'], format='%Y-%m-%dT%H:%M:%S:%f')\n",
+    "    dataloaders = dataloaders.set_index(['start_time'])\n",
+    "else:\n",
+    "    print('No profiling information for dataloaders available')"
    ]
   },
   {
@@ -1988,7 +1991,10 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "active_threads_per_second = dataloaders['tid'].groupby([pd.Grouper(freq='1S')]).count()"
+    "if dataloaders.shape[0] > 0:\n",
+    "    active_threads_per_second = dataloaders['tid'].groupby([pd.Grouper(freq='1S')]).count()\n",
+    "else:\n",
+    "    print('No profiling information for dataloaders available')"
    ]
   },
   {
@@ -2020,7 +2026,10 @@
     }
    ],
    "source": [
-    "plt.plot(active_threads_per_second[:500])"
+    "if dataloaders.shape[0] > 0:\n",
+    "    plt.plot(active_threads_per_second[:500])\n",
+    "else:\n",
+    "    print('No profiling information for dataloaders available')"
    ]
   },
   {
@@ -2036,7 +2045,10 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "unique_active_threads_per_second = dataloaders.groupby([pd.Grouper(freq='1S'), pd.Grouper('tid'), pd.Grouper('pid')]).agg(['count'])"
+    "if dataloaders.shape[0] > 0:\n",
+    "    unique_active_threads_per_second = dataloaders.groupby([pd.Grouper(freq='1S'), pd.Grouper('tid'), pd.Grouper('pid')]).agg(['count'])\n",
+    "else:\n",
+    "    print('No profiling information for dataloaders available')"
    ]
   },
   {
@@ -2070,9 +2082,13 @@
     }
    ],
    "source": [
-    "max_threads = unique_active_threads_per_second.groupby('start_time').count().max()[0]\n",
-    "if max_threads < n_cpus:\n",
-    "    print(\"Available cores:\", n_cpus, \"Maximum number of threads seen per time aggregation\", max_threads)"
+    "if dataloaders.shape[0] > 0:\n",
+    "    max_threads = unique_active_threads_per_second.groupby('start_time').count().max()[0]\n",
+    "    if max_threads < n_cpus:\n",
+    "        print(\"Available cores:\", n_cpus, \"Maximum number of threads seen per time aggregation\", max_threads)\n",
+    "    \n",
+    "else:\n",
+    "    print('No profiling information for dataloaders available')"
    ]
   },
   {
@@ -2250,9 +2266,9 @@
     }
    ],
    "source": [
-    "plt.pie(framework_metrics.values(), autopct='%1.1f%%', labels=framework_metrics.keys())\n",
+    "plt.pie(framework_metrics.values(), autopct='%1.1f%%', labels=framework_metrics.keys(), labeldistance=1.3)\n",
     "plt.show()\n",
-    "plt.pie(training_phase.values(), autopct='%1.1f%%', labels=training_phase.keys())\n",
+    "plt.pie(training_phase.values(), autopct='%1.1f%%', labels=training_phase.keys(), labeldistance=1.3)\n",
     "plt.show()"
    ]
   },
@@ -2309,9 +2325,9 @@
     }
    ],
    "source": [
-    "plt.pie(framework_metrics.values(), autopct='%1.1f%%', labels=framework_metrics.keys())\n",
+    "plt.pie(framework_metrics.values(), autopct='%1.1f%%', labels=framework_metrics.keys(), labeldistance=1.3)\n",
     "plt.show()\n",
-    "plt.pie(training_phase.values(), autopct='%1.1f%%', labels=training_phase.keys())\n",
+    "plt.pie(training_phase.values(), autopct='%1.1f%%', labels=training_phase.keys(), labeldistance=1.3)\n",
     "plt.show()"
    ]
   },
@@ -2356,7 +2372,7 @@
     }
    ],
    "source": [
-    "plt.pie(results['outlier'].values(), autopct='%1.1f%%', labels=results['outlier'].keys())\n",
+    "plt.pie(results['outlier'].values(), autopct='%1.1f%%', labels=results['outlier'].keys(), labeldistance=1.3)\n",
     "plt.show()"
    ]
   },
@@ -2394,7 +2410,7 @@
     }
    ],
    "source": [
-    "plt.pie(results['normal'].values(), autopct='%1.1f%%', labels=results['normal'].keys())\n",
+    "plt.pie(results['normal'].values(), autopct='%1.1f%%', labels=results['normal'].keys(), labeldistance=1.3)\n",
     "plt.show()"
    ]
   },
diff --git a/examples/profiler/aws_sagemaker_profiler_example_pytorch.ipynb b/examples/profiler/aws_sagemaker_profiler_example_pytorch.ipynb
@@ -23,7 +23,7 @@
    "outputs": [],
    "source": [
     "! pip install ../sdk/sagemaker-1.60.3.dev0.tar.gz -q\n",
-    "! pip install ../sdk/smdebug-0.9.2b20200807-py3-none-any.whl\n",
+    "! pip install ../sdk/smdebug-0.9.2b20200810-py2.py3-none-any.whl\n",
     "\n",
     "# The following command will enable the SDK to use new profiler configs in the API\n",
     "! aws configure add-model --service-model file://../sdk/sagemaker-2017-07-24.normal.json --service-name sagemaker"
@@ -75,7 +75,29 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Define an Estimator"
+    "### Set region where this notebook is running"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import boto3\n",
+    "\n",
+    "session = boto3.session.Session()\n",
+    "region = session.region_name\n",
+    "\n",
+    "image_name = f'385479125792.dkr.ecr.{region}.amazonaws.com/profiler-gpu:pt_tag1'\n",
+    "print(f\"image being used is {image_name}\")"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Define PyTorch estimator"
    ]
   },
   {
@@ -89,6 +111,7 @@
     "\n",
     "estimator = PyTorch(\n",
     "    role=sagemaker.get_execution_role(),\n",
+    "    image_name=image_name,\n",
     "    train_instance_count=1,\n",
     "    train_instance_type='ml.p3.8xlarge',\n",
     "    source_dir='demo',\n",
@@ -155,7 +178,7 @@
    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
-   "version": "3.7.3"
+   "version": "3.7.7"
   }
  },
  "nbformat": 4,
diff --git a/examples/profiler/aws_sagemaker_profiler_example_tensorflow.ipynb b/examples/profiler/aws_sagemaker_profiler_example_tensorflow.ipynb
@@ -23,7 +23,7 @@
    "outputs": [],
    "source": [
     "! pip install ../sdk/sagemaker-1.60.3.dev0.tar.gz -q\n",
-    "! pip install ../sdk/smdebug-0.9.2b20200807-py3-none-any.whl\n",
+    "! pip install ../sdk/smdebug-0.9.2b20200810-py2.py3-none-any.whl\n",
     "\n",
     "# The following command will enable the SDK to use new profiler configs in the API\n",
     "! aws configure add-model --service-model file://../sdk/sagemaker-2017-07-24.normal.json --service-name sagemaker"
@@ -76,12 +76,22 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "import os\n",
-    "region = os.environ['AWS_REGION'] # Set it to the region like us-east-1, us-east-2 if AWS_REGION is not set\n",
+    "import boto3\n",
+    "\n",
+    "session = boto3.session.Session()\n",
+    "region = session.region_name\n",
+    "\n",
     "image_name = f'385479125792.dkr.ecr.{region}.amazonaws.com/profiler-gpu:latest'\n",
     "print(f\"image being used is {image_name}\")\n"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Define TensorFlow estimator"
+   ]
+  },
   {
    "cell_type": "code",
    "execution_count": null,
@@ -98,7 +108,7 @@
     "    image_name=image_name,\n",
     "    train_instance_count=1,\n",
     "    train_instance_type='ml.p3.8xlarge',\n",
-    "    entry_point='train.py',\n",
+    "    entry_point='train_tf.py',\n",
     "    source_dir='demo',\n",
     "    framework_version='2.2.0',\n",
     "    py_version='py37',\n",
@@ -171,7 +181,7 @@
     "    image_name=image_name,\n",
     "    train_instance_count=1,\n",
     "    train_instance_type='ml.p3.8xlarge',\n",
-    "    entry_point='train.py',\n",
+    "    entry_point='train_tf.py',\n",
     "    source_dir='demo',\n",
     "    framework_version='2.2.0',\n",
     "    py_version='py37',\n",
@@ -241,7 +251,7 @@
    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
-   "version": "3.7.3"
+   "version": "3.7.7"
   }
  },
  "nbformat": 4,
diff --git a/examples/profiler/profiler_generic_dashboard.ipynb b/examples/profiler/profiler_generic_dashboard.ipynb
@@ -39,7 +39,7 @@
     "! which pip\n",
     "! pip --version\n",
     "! pip uninstall smdebug --yes\n",
-    "! pip install ./sdk/smdebug-0.9.0b20200804-py2.py3-none-any.whl\n"
+    "! pip install ../sdk/smdebug-0.9.2b20200810-py2.py3-none-any.whl\n"
    ]
   },
   {
diff --git a/examples/profiler/sdk/smdebug-0.9.0b20200804-py2.py3-none-any.whl b/examples/profiler/sdk/smdebug-0.9.0b20200804-py2.py3-none-any.whl
diff --git a/examples/profiler/sdk/smdebug-0.9.2b20200807-py3-none-any.whl b/examples/profiler/sdk/smdebug-0.9.2b20200807-py3-none-any.whl
diff --git a/smdebug/profiler/analysis/notebook_utils/timeline_charts.py b/smdebug/profiler/analysis/notebook_utils/timeline_charts.py
@@ -247,10 +247,10 @@ def plot_framework_events(self, events, begin_timestamp, end_timestamp):
                     yaxis[event.event_phase],
                 ]
             )
-            if index > 1000:
+            if index > 500:
                 print(
-                    """Reached more than 1000 datapoints.
-                      Will only plot first 1000 datapoints for the given timerange"""
+                    """Reached more than 500 datapoints.
+                      Will only plot first 500 datapoints for the given timerange"""
                 )
                 break
         return framework_events
@@ -272,8 +272,8 @@ def plot_dataloaders(self, events, begin_timestamp, end_timestamp):
                 dataloaders[event.event_name].append(
                     [int(event.start_time / 1000.0), int(event.end_time / 1000.0), tids[event.tid]]
                 )
-                if index > 1000:
-                    print("Reached more than 1000 datapoints. Will stop plotting.")
+                if index > 500:
+                    print("Reached more than 500 datapoints. Will stop plotting.")
                     break
 
         return dataloaders
diff --git a/smdebug/profiler/analysis/utils/pandas_data_analysis.py b/smdebug/profiler/analysis/utils/pandas_data_analysis.py
@@ -53,13 +53,13 @@ def get_job_statistics(self):
                     ["Step:ModeKeys.TRAIN", "Step:ModeKeys.GLOBAL"]
                 )
             )
-        ]
-        job_statistics["training_loop_start"] = step_0["start_time"][step_0.index[0]]
+        ].reset_index(drop=True)
+        job_statistics["training_loop_start"] = step_0["start_time"][0]
         job_statistics["training_loop_end"] = max(self.framework_metrics_df["end_time"])
         job_statistics["training_loop_duration"] = (
             max(self.framework_metrics_df["end_time_us"]) - step_0["start_time_us"]
         ) / 1000
-        job_statistics["initialization"] = step_0["start_time_us"][step_0.index[0]] / 1000
+        job_statistics["initialization"] = step_0["start_time_us"][0] / 1000
         job_statistics["finalization"] = (
             max(self.sys_metrics_df["timestamp_us"]) - max(self.framework_metrics_df["end_time_us"])
         ) / 1000
@@ -268,7 +268,9 @@ def get_training_phase_intervals(self, phase=None):
                 )
             ).reset_index(drop=True)
         else:
-            mode_df = mode_df[["start_time_us", "end_time_us", "framework_metric"]]
+            mode_df = mode_df[["start_time_us", "end_time_us", "framework_metric"]].reset_index(
+                drop=True
+            )
             mode_df.rename({"framework_metric": "phase"}, axis="columns", inplace=True)
 
         for i in range(len(mode_df.index) - 1):
@@ -283,11 +285,11 @@ def get_training_phase_intervals(self, phase=None):
                     "phase": "Between " + " and ".join(sorted([this_phase, next_phase])),
                 }
                 mode_df.loc[next_index] = row
-        # need to revisit this. For PT jobs, index[0] is not 0
+
         row = {
             "start_time_us": self.sys_metrics_df["timestamp_us"].min(),
-            "end_time_us": mode_df["start_time_us"][mode_df.index[0]] - 1,
-            "phase": "Before " + mode_df["phase"][mode_df.index[0]],
+            "end_time_us": mode_df["start_time_us"][0] - 1,
+            "phase": "Before " + mode_df["phase"][0],
         }
         mode_df.loc[-1] = row
         mode_df = mode_df.sort_index().reset_index(drop=True)
diff --git a/smdebug/profiler/analysis/utils/profiler_data_to_pandas.py b/smdebug/profiler/analysis/utils/profiler_data_to_pandas.py
@@ -16,7 +16,7 @@
 
 
 class PandasFrame:
-    def __init__(self, path, use_in_memory_cache=False, scan_interval=50000000):
+    def __init__(self, path, use_in_memory_cache=False, scan_interval=5000000000):
 
         self.path = path
         self.step_time_mapping = dict()
@@ -288,6 +288,7 @@ def get_profiler_data_by_time(
                         int(event.timestamp * CONVERT_TO_MICROSECS),
                         event.value,
                         event.name,
+                        event.dimension,
                     ]
                 )
 
@@ -297,7 +298,8 @@ def get_profiler_data_by_time(
 
         # create data frame for system metrics
         system_metrics_df = pd.DataFrame(
-            system_metrics, columns=["timestamp", "timestamp_us", "value", "system_metric"]
+            system_metrics,
+            columns=["timestamp", "timestamp_us", "value", "system_metric", "dimension"],
         )
 
         system_metrics_df["timestamp_us"] = system_metrics_df["timestamp_us"] - self.start_time
@@ -384,7 +386,10 @@ def get_profiler_data_by_time(
         )
         framework_metrics_df["end_time_us"] = framework_metrics_df["end_time_us"] - self.start_time
 
-        return system_metrics_df, framework_metrics_df
+        return (
+            system_metrics_df[system_metrics_df.duplicated() == False],
+            framework_metrics_df[framework_metrics_df.duplicated() == False],
+        )
 
     def get_profiler_data_by_step(self, start_step, end_step, cache_metrics=False):
         """
diff --git a/tests/profiler/core/test_pandas_frames.py b/tests/profiler/core/test_pandas_frames.py

Original file line number	Diff line number	Diff line change
`@@ -46,7 +46,7 @@`
`46`	`46`	`],`
`47`	`47`	`"source": [`
`48`	`48`	`"\n",`
`49`		`- "! pip install -q sdk/smdebug-0.9.2b20200807-py3-none-any.whl"`
	`49`	`+ "! pip install -q ../sdk/smdebug-0.9.2b20200810-py2.py3-none-any.whl"`
`50`	`50`	`]`
`51`	`51`	`},`
`52`	`52`	`{`
`@@ -1478,7 +1478,7 @@`
`1478`	`1478`	`"source": [`
`1479`	`1479`	`"import matplotlib.pyplot as plt\n",`
`1480`	`1480`	`"\n",`
`1481`		`- "plt.pie(system_usage.values(), autopct='%1.1f%%', labels=system_usage.keys())\n",`
	`1481`	`+ "plt.pie(system_usage.values(), autopct='%1.1f%%', labels=system_usage.keys(), labeldistance=1.3)\n",`
`1482`	`1482`	`"plt.show()"`
`1483`	`1483`	`]`
`1484`	`1484`	`},`
`@@ -1971,8 +1971,11 @@`
`1971`	`1971`	`"source": [`
`1972`	`1972`	`"import pandas as pd\n",`
`1973`	`1973`	`"\n",`
`1974`		`- "dataloaders['start_time'] = pd.to_datetime(dataloaders['start_time'], format='%Y-%m-%dT%H:%M:%S:%f')\n",`
`1975`		`- "dataloaders = dataloaders.set_index(['start_time'])"`
	`1974`	`+ "if dataloaders.shape[0] > 0:\n",`
	`1975`	`+ " dataloaders['start_time'] = pd.to_datetime(dataloaders['start_time'], format='%Y-%m-%dT%H:%M:%S:%f')\n",`
	`1976`	`+ " dataloaders = dataloaders.set_index(['start_time'])\n",`
	`1977`	`+ "else:\n",`
	`1978`	`+ " print('No profiling information for dataloaders available')"`
`1976`	`1979`	`]`
`1977`	`1980`	`},`
`1978`	`1981`	`{`
`@@ -1988,7 +1991,10 @@`
`1988`	`1991`	`"metadata": {},`
`1989`	`1992`	`"outputs": [],`
`1990`	`1993`	`"source": [`
`1991`		`- "active_threads_per_second = dataloaders['tid'].groupby([pd.Grouper(freq='1S')]).count()"`
	`1994`	`+ "if dataloaders.shape[0] > 0:\n",`
	`1995`	`+ " active_threads_per_second = dataloaders['tid'].groupby([pd.Grouper(freq='1S')]).count()\n",`
	`1996`	`+ "else:\n",`
	`1997`	`+ " print('No profiling information for dataloaders available')"`
`1992`	`1998`	`]`
`1993`	`1999`	`},`
`1994`	`2000`	`{`
`@@ -2020,7 +2026,10 @@`
`2020`	`2026`	`}`
`2021`	`2027`	`],`
`2022`	`2028`	`"source": [`
`2023`		`- "plt.plot(active_threads_per_second[:500])"`
	`2029`	`+ "if dataloaders.shape[0] > 0:\n",`
	`2030`	`+ " plt.plot(active_threads_per_second[:500])\n",`
	`2031`	`+ "else:\n",`
	`2032`	`+ " print('No profiling information for dataloaders available')"`
`2024`	`2033`	`]`
`2025`	`2034`	`},`
`2026`	`2035`	`{`
`@@ -2036,7 +2045,10 @@`
`2036`	`2045`	`"metadata": {},`
`2037`	`2046`	`"outputs": [],`
`2038`	`2047`	`"source": [`
`2039`		`- "unique_active_threads_per_second = dataloaders.groupby([pd.Grouper(freq='1S'), pd.Grouper('tid'), pd.Grouper('pid')]).agg(['count'])"`
	`2048`	`+ "if dataloaders.shape[0] > 0:\n",`
	`2049`	`+ " unique_active_threads_per_second = dataloaders.groupby([pd.Grouper(freq='1S'), pd.Grouper('tid'), pd.Grouper('pid')]).agg(['count'])\n",`
	`2050`	`+ "else:\n",`
	`2051`	`+ " print('No profiling information for dataloaders available')"`
`2040`	`2052`	`]`
`2041`	`2053`	`},`
`2042`	`2054`	`{`
`@@ -2070,9 +2082,13 @@`
`2070`	`2082`	`}`
`2071`	`2083`	`],`
`2072`	`2084`	`"source": [`
`2073`		`- "max_threads = unique_active_threads_per_second.groupby('start_time').count().max()[0]\n",`
`2074`		`- "if max_threads < n_cpus:\n",`
`2075`		`- " print(\"Available cores:\", n_cpus, \"Maximum number of threads seen per time aggregation\", max_threads)"`
	`2085`	`+ "if dataloaders.shape[0] > 0:\n",`
	`2086`	`+ " max_threads = unique_active_threads_per_second.groupby('start_time').count().max()[0]\n",`
	`2087`	`+ " if max_threads < n_cpus:\n",`
	`2088`	`+ " print(\"Available cores:\", n_cpus, \"Maximum number of threads seen per time aggregation\", max_threads)\n",`
	`2089`	`+ " \n",`
	`2090`	`+ "else:\n",`
	`2091`	`+ " print('No profiling information for dataloaders available')"`
`2076`	`2092`	`]`
`2077`	`2093`	`},`
`2078`	`2094`	`{`
`@@ -2250,9 +2266,9 @@`
`2250`	`2266`	`}`
`2251`	`2267`	`],`
`2252`	`2268`	`"source": [`
`2253`		`- "plt.pie(framework_metrics.values(), autopct='%1.1f%%', labels=framework_metrics.keys())\n",`
	`2269`	`+ "plt.pie(framework_metrics.values(), autopct='%1.1f%%', labels=framework_metrics.keys(), labeldistance=1.3)\n",`
`2254`	`2270`	`"plt.show()\n",`
`2255`		`- "plt.pie(training_phase.values(), autopct='%1.1f%%', labels=training_phase.keys())\n",`
	`2271`	`+ "plt.pie(training_phase.values(), autopct='%1.1f%%', labels=training_phase.keys(), labeldistance=1.3)\n",`
`2256`	`2272`	`"plt.show()"`
`2257`	`2273`	`]`
`2258`	`2274`	`},`
`@@ -2309,9 +2325,9 @@`
`2309`	`2325`	`}`
`2310`	`2326`	`],`
`2311`	`2327`	`"source": [`
`2312`		`- "plt.pie(framework_metrics.values(), autopct='%1.1f%%', labels=framework_metrics.keys())\n",`
	`2328`	`+ "plt.pie(framework_metrics.values(), autopct='%1.1f%%', labels=framework_metrics.keys(), labeldistance=1.3)\n",`
`2313`	`2329`	`"plt.show()\n",`
`2314`		`- "plt.pie(training_phase.values(), autopct='%1.1f%%', labels=training_phase.keys())\n",`
	`2330`	`+ "plt.pie(training_phase.values(), autopct='%1.1f%%', labels=training_phase.keys(), labeldistance=1.3)\n",`
`2315`	`2331`	`"plt.show()"`
`2316`	`2332`	`]`
`2317`	`2333`	`},`
`@@ -2356,7 +2372,7 @@`
`2356`	`2372`	`}`
`2357`	`2373`	`],`
`2358`	`2374`	`"source": [`
`2359`		`- "plt.pie(results['outlier'].values(), autopct='%1.1f%%', labels=results['outlier'].keys())\n",`
	`2375`	`+ "plt.pie(results['outlier'].values(), autopct='%1.1f%%', labels=results['outlier'].keys(), labeldistance=1.3)\n",`
`2360`	`2376`	`"plt.show()"`
`2361`	`2377`	`]`
`2362`	`2378`	`},`
`@@ -2394,7 +2410,7 @@`
`2394`	`2410`	`}`
`2395`	`2411`	`],`
`2396`	`2412`	`"source": [`
`2397`		`- "plt.pie(results['normal'].values(), autopct='%1.1f%%', labels=results['normal'].keys())\n",`
	`2413`	`+ "plt.pie(results['normal'].values(), autopct='%1.1f%%', labels=results['normal'].keys(), labeldistance=1.3)\n",`
`2398`	`2414`	`"plt.show()"`
`2399`	`2415`	`]`
`2400`	`2416`	`},`
Original file line number	Diff line number	Diff line change
`@@ -39,7 +39,7 @@`
`39`	`39`	`"! which pip\n",`
`40`	`40`	`"! pip --version\n",`
`41`	`41`	`"! pip uninstall smdebug --yes\n",`
`42`		`- "! pip install ./sdk/smdebug-0.9.0b20200804-py2.py3-none-any.whl\n"`
	`42`	`+ "! pip install ../sdk/smdebug-0.9.2b20200810-py2.py3-none-any.whl\n"`
`43`	`43`	`]`
`44`	`44`	`},`
`45`	`45`	`{`
Original file line number	Diff line number	Diff line change
`@@ -247,10 +247,10 @@ def plot_framework_events(self, events, begin_timestamp, end_timestamp):`
`247`	`247`	`yaxis[event.event_phase],`
`248`	`248`	`]`
`249`	`249`	`)`
`250`		`- if index > 1000:`
	`250`	`+ if index > 500:`
`251`	`251`	`print(`
`252`		`- """Reached more than 1000 datapoints.`
`253`		`- Will only plot first 1000 datapoints for the given timerange"""`
	`252`	`+ """Reached more than 500 datapoints.`
	`253`	`+ Will only plot first 500 datapoints for the given timerange"""`
`254`	`254`	`)`
`255`	`255`	`break`
`256`	`256`	`return framework_events`
`@@ -272,8 +272,8 @@ def plot_dataloaders(self, events, begin_timestamp, end_timestamp):`
`272`	`272`	`dataloaders[event.event_name].append(`
`273`	`273`	`[int(event.start_time / 1000.0), int(event.end_time / 1000.0), tids[event.tid]]`
`274`	`274`	`)`
`275`		`- if index > 1000:`
`276`		`- print("Reached more than 1000 datapoints. Will stop plotting.")`
	`275`	`+ if index > 500:`
	`276`	`+ print("Reached more than 500 datapoints. Will stop plotting.")`
`277`	`277`	`break`
`278`	`278`
`279`	`279`	`return dataloaders`