カスタム分類モデルを実行するために必要なこと

カスタム分類モデルを使用してドキュメントを判断する前に以下の準備が必要です。

特にドキュメント分類の判定結果の精度を上げるにはトレーニングデータの作成が重要になります。

トレーニングデータの作成

トレーニングデータの作成方法については以下を参照して下さい。

カスタム分類モデルトレーニングデータ

カスタム分類モデルが読み込むトレーニングデータは予めS3バケットにアップロードしておく必要があります。
その為、トレーニングデータ読み込み用にS3バケットを作成する必要があります。
S3バケットの作成方法は割愛させて頂きます。

カスタム分類モデルへ文章を読み込ませた結果はS3へ出力されます。
その為、結果出力用にS3バケットを作成する必要があります。
S3バケットの作成方法は割愛させて頂きます。

オプションの指定になるので必須ではありませんが、カスタム分類モデルを調教する際に自作のテストデータを指定できます。

テストデータ

Amazon Comprehendを利用する為のロールを作成します。
モデル作成時(後述)にロールを作成出来ますが今回は予め作成しておきます。
なお、AWSのロールについての詳細は割愛させて頂きます。

任意のロール名でポリシーにComprehendDataAccessRolePolicyを付与すればAmazon Comprehendが必要とする一通りの操作は出来ます。