Wit SpeechAPIの紹介

投稿日:

(Wit.aiチーム)(2月12日2014)

音声コマンドは未来です。サイエンスフィクションには何十年もの間それらがありましたが、それでも、リモコンでテレビの電源を入れたり、アラームを設定したりすることができます。私たちの使命はこれを変えることです。アプリやデバイスに音声インターフェースを追加するのは簡単なはずです。

音声を実用的なデータに変える

本日、新しい「SpeechtoJSON」API 、「TexttoJSON」APIのリリースから4か月後。

Speech\_to\_json

これからは、アプリ、デバイス、さらにはウェブサイトでさえ、音声をサーバーにストリーミングして、実用的なデータを取得できるようになります。

ホームオートメーションの実際の動作を確認する:

どのように機能するか?

舞台裏では、Witはさまざまな最先端の自然言語処理技術といくつかの音声認識エンジンを組み合わせて、周囲のノイズと言い換えのバリエーションの両方に対して低遅延と高い堅牢性を実現しています(同じことを言うには何百万もの方法があります。

幸いなことに、このすべての機械を気にする必要はありません。私たちは、可能な限りシンプルな開発者エクスペリエンスの作成に全力を注いでいます。 当社のウェブサイトを使用して数分で稼働させることができます。 Witは、アイスクリームの配布から宇宙ミッションまで、時間の経過とともにドメインに適応します。 Witは想定を行わず、100%構成可能なままです。

独自のWit構成を構築するには5分かかります:

APIの使用

次に、APIの呼び出しは簡単です。 iOS Android またはのオーディオ録音とストリーミングを処理するクライアント側SDKを提供していますdiv id = “7df811a1be”>

このような単純なWebページでも HTTPインターフェースを使用して、ライブオーディオをストリーミングしたり、サウンドファイルを投稿したりすることもできます。

このサウンドを取得しましょう(有名人から録音された谷—誰を知っていますか?):

POSTを使用してWitAPIに送信しますリクエスト:

curl -XPOST "https://api.wit.ai/speech" \
-i -L \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: audio/wav" \
--data-binary "@sample.wav"

お返しにこれを受け取ります:

{
"msg\_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg\_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set\_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}

独自の音声インターフェースを構築することに興味がありますか?ここからサインアップしてください!

チームウィット

@WitNL