Amazon SageMaker Ground Truth と自動化されたデータのラベル付けによる低コストでのデータのアノテーション : Amazon SageMaker Ground Truth を使うと、正確にラベル付けされた機械学習データセットを簡単に低価格で構築することができます。ラベル付けのコストを削減するために、Ground Truth の機械学習を使用して、人によるアノテーションが必要な「困難な」画像と、機械学習で自動的にラベル付けできる「簡単な」画像を選択します。この記事では、自動化されたデータのラベル付けの仕組みと、その結果の評価方法について説明します。 自動化されたデータのラベル付けを伴う物体検出ジョブを実行する 以前のブログ記事 では、Julien Simon が AWS マネジメントコンソールを使ってデータのラベル付けジョブを実行する方法を説明しました。このプロセスをより細かく制御するには、API を使用できます。 その方法をご紹介するため、今回は鳥の画像 1,000 個に対して バウンディングボックスアノテーション を生成する API を使用した Amazon SageMaker Jupyter ノートブックを使用します。 注意: デモノートブックの実行コストは約 200 USD です。 デモノートブックにアクセスするには、ml.m4.xlarge インスタンスタイプを使用して Amazon SageMaker ノートブックインスタンスを開始します。インスタンスは、 このステップバイステップチュートリアル に従ってセットアップできます。 ステップ 3 では、IAM ロールの作成時に「任意の S3 バケット」にチェックを入れるようにしてください 。 以下にあるように、Jupyter ノートブックを開いて [ SageMaker Examples ] タブを選択し、 object_detection_tutorial.ipynb を起動します。 ノートブックの「Introduction」および「Run a Ground Truth labeling job」の各セクションにあるセルのすべてを実行します。セルには変更が必要なものもあるため、ノートブックの指示を注意深く読んでください。これらのセクションを実行すると、以...