愛犬の声を再生するAmazon Echo (Alexa) スキルをノンコーディングでサクッと開発する:

0. はじめに

開発者待望のAlexaスキル内課金が米国で可能に！など、2019年は日本でもスマートスピーカーのスキル開発がより注目される予感がしています。本記事では、超初心者にもハードルが低くなるよう、MicrosoftAzureLogicAppsを使ってノンコーディングでAmazonEchoのスキルを開発してみます。実家に帰省しないと会うことができない愛犬の声をいつでも気軽AmazonEchoから聞くことができるスキルを開発しました。

1. 開発するスキル

今回開発するスキルのイメージはこちらです。呼び出されると、愛犬の声を再生するようにします。

鳴き声を使って、愛犬を #AmazonEcho のスキルで再現してみた。鳴き声の録音が難しい。笑 #VUI #駆け出しエンジニアと繋がりたい #100DaysOfCode pic.twitter.com/amaM7Hc6SK

— さいちゃん�� (@saisan78) 2019年1月1日

2. 開発の全体像と流れ

手順は、大きく以下の3ステップです。

①AlexaDeveloperConsoleでスキルの作成

②AzureLogicAppsで応答処理の作成

③自作音声ファイルの準備とDropboxでの共有

①AlexaDeveloperConsoleでスキルを作成

まず、https://developer.amazon.com/ja/にて、スキルを作成しましょう。AmazonEchoスキルの開発に必要な概念は、Amazon Echo (Alexa) のSkillの開発に必要な基本概念を押さえるを参照してください。今回は、「おさんぽ」とよんだら、音声を返すシンプルなスキルなので、インテントをひとつだけ登録します。おさんぽということで"walking"と命名しました。

②AzureLogicAppsでで応答処理の作成

続けて、AzureLogicAppsにて、AlexaSkillConsoleからIntentを受け取り、応答を返すAPIサーバをAzureLogicAppsで作成します。

AlexaからJSONをうけとりJSONをかえすAPIサーバです。

「もっと丁寧にAzureLogicAppsの使いたいを知りたい！」という方は、以下のLINEBotの作成記事を参考にしてください。
ノンコーディングで質問に自動回答するLINE BOTを作ってみよう

AzureLogicAppsで開発するAPIサーバの全体像ですが以下のイメージになります。

②-1.HTTP要求の受信時のモジュールを作成

まずはAlexaからPOSTでJSONを受け取れるように、「HTTP要求の受信時」のモジュールを用意します。

メソッドをPSOTに設定し、JSONのスキーマを登録しておきます。

また、HTTP POSTのURLは、先程のAlexaDeveloperConsoleでエンドポイントに登録しておきます。

「HTTP要求の受信時」のモジュールに登録するJSONスキーマ（クリックすると開きます）

request.json

{ 
    "properties": { 
        "request": { 
            "properties": { 
                "dialogState": { 
                    "type": "string" 
                }, 
                "intent": { 
                    "properties": { 
                        "confirmationStatus": { 
                            "type": "string" 
                        }, 
                        "name": { 
                            "type": "string" 
                        }, 
                        "slots": { 
                            "properties": { 
                                "anatanoslotname": { 
                                    "properties": { 
                                        "confirmationStatus": { 
                                            "type": "string" 
                                        }, 
                                        "name": { 
                                            "type": "string" 
                                        }, 
                                        "resolutions": { 
                                            "properties": { 
                                                "resolutionsPerAuthority": { 
                                                    "items": { 
                                                        "properties": { 
                                                            "authority": { 
                                                                "type": "string" 
                                                            }, 
                                                            "status": { 
                                                                "properties": { 
                                                                    "code": { 
                                                                        "type": "string" 
                                                                    } 
                                                                }, 
                                                                "type": "object" 
                                                            }, 
                                                            "values": { 
                                                                "items": { 
                                                                    "properties": { 
                                                                        "value": { 
                                                                            "properties": { 
                                                                                "id": { 
                                                                                    "type": "string" 
                                                                                }, 
                                                                                "name": { 
                                                                                    "type": "string" 
                                                                                } 
                                                                            }, 
                                                                            "type": "object" 
                                                                        } 
                                                                    }, 
                                                                    "required": [ 
                                                                        "value" 
                                                                    ], 
                                                                    "type": "object" 
                                                                }, 
                                                                "type": "array" 
                                                            } 
                                                        }, 
                                                        "required": [ 
                                                            "authority", 
                                                            "status", 
                                                            "values" 
                                                        ], 
                                                        "type": "object" 
                                                    }, 
                                                    "type": "array" 
                                                } 
                                            }, 
                                            "type": "object" 
                                        }, 
                                        "value": { 
                                            "type": "string" 
                                        } 
                                    }, 
                                    "type": "object" 
                                } 
                            }, 
                            "type": "object" 
                        } 
                    }, 
                    "type": "object" 
                }, 
                "locale": { 
                    "type": "string" 
                }, 
                "requestId": { 
                    "type": "string" 
                }, 
                "timestamp": { 
                    "type": "string" 
                }, 
                "type": { 
                    "type": "string" 
                } 
            }, 
            "type": "object" 
        }, 
        "version": { 
            "type": "string" 
        } 
    }, 
    "type": "object" 
}

②-2.スキル起動時（IntentがLaunchRequestの際）の応答処理を作成

次に、スキル起動時（IntentがLaunchRequestの際）の応答処理を作成していきます。

Alexaから受信するJSONの中のtypeスキーマにLaunchRequestが含まれるので、それがあるかどうか条件式で判別しましょう。

Trueの場合の応答処理を応答モジュールで用意します。

応答用のJSON（クリックすると開きます）

response1.json

{ 
  "response": { 
    "outputSpeech": { 
      "ssml": "<speak><prosody pitch='x-high'>ごんただよ！</prosody></speak>", 
      "type": "SSML" 
    }, 
    "reprompt": { 
      "outputSpeech": { 
        "ssml": "<speak><prosody pitch='x-high'>なにしてあそぶ？</prosody></speak>", 
        "type": "SSML" 
      } 
    }, 
    "shouldEndSession": "False" 
  }, 
  "version": "1.0" 
}

②-3.Intentごとの応答処理を作成

同様に、起動時以外のIntentごとの応答処理を作っていきます。

最小のnameというスキーマにwalkingという値が入って送られてくるので、条件式を用意して、応答処理を作ります。

応答用のJSON（クリックすると開きます）

response2.json

{ 
  "response": { 
    "outputSpeech": { 
      "ssml": "<speak><audio src='https://dl.dropboxusercontent.com/s/あなたの音声ファイルのURL/あなたの音声ファイル.mp3' /></speak>", 
      "type": "SSML" 
    }, 
    "reprompt": { 
      "outputSpeech": { 
        "ssml": "<speak><prosody pitch='x-high'>ほかになにしてあそぶ？</prosody></speak>", 
        "type": "SSML" 
      } 
    }, 
    "shouldEndSession": "False" 
  }, 
  "version": "1.0" 
}

③自作音声ファイルの準備とDropboxでの共有

それでは、AmazonEchoのスキルで使う音声ファイルを用意しましょう。今回はiPhoneで再生した筆者の愛犬のなき声を利用します。

③-1.AmazonEchoで利用可能な形式へ「FFmpeg」を用いて変換

利用可能な形式が限られているため、音声ファイルを変換します。

　-　90秒以内である

　-　特定のビットレート・周波数にフォーマットされている

　-　個人情報や機密情報を含まない

今回は、「FFmpeg」という無料ソフトウェアで対応する形式に変換しました。

参考　AlexaスキルでMP3ファイルを流そう！効果音を入れてワンランクアップのスキル開発

$ ffmpeg -y -i before.mp3 -ar 16000 -ab 48k -codec:a libmp3lame -ac 1 after.mp3

③-2.dropboxでMP3ファイルを共有し、URLを作成する

次に、完成した音声ファイル（MP3ファイル）をオンライン上に共有します。今回は無料で利用可能なDropboxに保存します。

ファイルをアップロードし、共有を行うと、以下のような共有URLが取得できます。

https://www.dropbox.com/s/[取得したURL]?dl=0

しかしこのままではAmazonEchoのスキル上で再生できないので、以下のように少しURLを編集します。このURLを先程のAzureLogicAppsの中のSSML文の中に入れてあげると、Dropboxの音声ファイルをAmazonEchoのスキル上で再生することができるようになります。

https://dl.dropboxusercontent.com/s/[取得したURL]

公式のサウンドライブラリを使う / 音声ファイルを用意できない方へ

今回、自分で用意できない場合は、以下の公式のサウンドライブラリから音源を使うことも可能です。
サウンドライブラリ - Animal Sounds（動物の声）

<speak> 
    これはアレクサの通常音声です。音響効果「クマのうなり声（1）」を再生します。 
    <audio src='soundbank://soundlibrary/animals/amzn_sfx_bear_groan_roar_01'/> 
</speak>

3. まとめ

今回はAzureLogicAppsを使ってAmazonEchoのスキルを作ってみました。一般的にはAWSのLambdaを使った開発が多いですが、JSONの受け渡しができるAPIサーバを用意できれば簡単にAmazonEchoのスキルを開発することができます。ぜひみなさんも作ってみてくださいね！

AzureLogicAppsはオフィス系のモジュール(JiraやSalesforceなど)が多いので、オフィスでのスマートスピーカーアプリ開発にもぴったりです。

このブログを検索

IT音痴アラフィフおやじのストック記事倉庫

愛犬の声を再生するAmazon Echo (Alexa) スキルをノンコーディングでサクッと開発する

0. はじめに

1. 開発するスキル

2. 開発の全体像と流れ

①AlexaDeveloperConsoleでスキルを作成

②AzureLogicAppsでで応答処理の作成

②-1.HTTP要求の受信時のモジュールを作成

②-2.スキル起動時（IntentがLaunchRequestの際）の応答処理を作成

②-3.Intentごとの応答処理を作成

③自作音声ファイルの準備とDropboxでの共有

③-1.AmazonEchoで利用可能な形式へ「FFmpeg」を用いて変換

③-2.dropboxでMP3ファイルを共有し、URLを作成する

公式のサウンドライブラリを使う / 音声ファイルを用意できない方へ

3. まとめ

コメント

コメントを投稿

このブログの人気の投稿

投稿時間:2021-06-17 22:08:45 RSSフィード2021-06-17 22:00 分まとめ(2089件)

投稿時間:2021-06-20 02:06:12 RSSフィード2021-06-20 02:00 分まとめ(3871件)

投稿時間:2021-06-17 05:05:34 RSSフィード2021-06-17 05:00 分まとめ(1274件)