Amazon SageMaker IP Insights アルゴリズムを試してみる

Amazon SageMaker IP Insights アルゴリズムを試してみる:

Amazon AI by ナレコム Advent Calendar 2018の16日目の記事です。

今日は、Amazon SageMaker IP Insights アルゴリズムを試してみました。

IP Insights アルゴリズムは、IPアドレスの異常な動作や使用パターンを検出するものです。
チュートリアルがあるので、実行してみましょう。


ノートブックインスタンスの作成

1.AWS Consoleを開き、SageMakerを開きます。

2.左のメニューのノートブック->ノートブックインスタンスを選択し、ノートブックインスタンスの作成をクリックして新規作成します。


ipinsights01.PNG


3.ステータスがInServiceになったら、アクションにある開く Jupyterをクリックして、Jupyterを開きます。


Jupyterの作成

1.SageMaker Examplesタブをクリックし、Introduction to Amazon Algorithmsを展開します。

2.ipinsights-tutorial.ipynbの右側にあるUseをクリックし、Create Copyをクリックしてチュートリアルのコピーを作成します。

3.S3を作成します。バケット名は、sagemaker-ipinsights-testとしました。


ipinsights05.PNG


4.作成したS3を指定します。
ipinsights06.PNG



データセットの準備

1.データセットをインストールします。


ipinsights07.PNG


2.ファイルを読み込みます。


ipinsights08.PNG


3.タイムスタンプをDateTimeオブジェクトに変換します。
ipinsights09.PNG

4.タイムゾーンの一致を確認します。
ipinsights10.PNG

5.タイムゾーンの処理をします。


ipinsights11.PNG


6.リソースを選択します。


ipinsights12.PNG


7.ユーザーとIPアドレスを抽出します。


ipinsights13.PNG


8.学習とテストのデータセットを作成します。


ipinsights14.PNG


9.10日間のログイベントを使用し、7日間を学習、3日間をテストとします。
ipinsights15.PNG

10.学習データをシャッフルします。


ipinsights16.PNG



学習

1.S3に格納します。


ipinsights17.PNG


2.イメージを取得します。


ipinsights18.PNG


3.学習します。


ipinsights19.PNG

ipinsights20.PNG



推論

1.エンドポイントを作成します。


ipinsights21.PNG

ipinsights22.PNG

2.データのシリアライズ/デシリアライズ


ipinsights23.PNG


3.dot_productを表示します。


ipinsights24.PNG



異常検出スコアの計算

1.通常のトラフィックデータセットを使用します。


ipinsights25.PNG


2.異常のトラフィックデータセットを挿入します。


ipinsights26.PNG




ipinsights27.PNG



分布の表示



ipinsights28.PNG

ipinsights29.PNG

ipinsights30.PNG


閾値が0.0の場合、103390件の中、98394件が異常と予測してます。

精度は95%となりました。


まとめ

Amazon SageMaker IP Insights アルゴリズムを試してみました。

独自のデータセットでやってみたいですね。


参考文献

[1] Amazon SageMaker IP Insights アルゴリズムを使用して、不審な IP アドレスを検出する

コメント

このブログの人気の投稿

投稿時間:2021-06-17 05:05:34 RSSフィード2021-06-17 05:00 分まとめ(1274件)

投稿時間:2021-06-20 02:06:12 RSSフィード2021-06-20 02:00 分まとめ(3871件)

投稿時間:2024-02-12 22:08:06 RSSフィード2024-02-12 22:00分まとめ(7件)