Einführung in die Wit Speech API

Veröffentlicht

(The Wit.ai Team) (12. Februar) 2014)

Sprachbefehle sind die Zukunft. Science-Fiction hat sie seit Jahrzehnten und dennoch haben wir immer noch die Möglichkeit, mit der Fernbedienung den Fernseher einzuschalten oder einen Alarm auszulösen. Unsere Mission ist es, dies zu ändern. Das Hinzufügen einer Sprachschnittstelle zu einer App oder einem Gerät sollte einfach sein.

Umwandlung von Sprache in verwertbare Daten

Heute freuen wir uns sehr, Ihnen unsere neue API „Speech to JSON“ , vier Monate nach dem Start der API „Text to JSON“.

language\_to\_json

Von nun an kann Ihre App, Ihr Gerät oder sogar Ihre Website Audio auf unseren Server streamen und im Gegenzug verwertbare Daten erhalten.

Sehen Sie es in Aktion für die Heimautomation:

Wie funktioniert es? ?

Hinter den Kulissen kombiniert Wit verschiedene hochmoderne Techniken zur Verarbeitung natürlicher Sprache und mehrere Spracherkennungs-Engines, um eine geringe Latenz und eine hohe Robustheit sowohl gegenüber Umgebungsgeräuschen als auch gegenüber paraphrastischen Variationen zu erzielen (es gibt) Millionen von Möglichkeiten, dasselbe zu sagen).

Glücklicherweise müssen Sie sich nicht um all diese Maschinen kümmern. Wir konzentrieren unsere ganze Energie darauf, ein möglichst einfaches Entwicklererlebnis zu schaffen. Mit unserer Website können Sie in wenigen Minuten einsatzbereit sein. Wit wird sich im Laufe der Zeit an Ihre Domain anpassen, von der Verteilung von Eiscreme bis hin zu Weltraummissionen. Wit macht keine Annahmen und bleibt zu 100\% konfigurierbar.

Es dauert 5 Minuten, um Ihre eigene Wit-Konfiguration zu erstellen:

API verbrauchen

Dann ist das Aufrufen der API einfach. Wir bieten clientseitige SDKs für Audioaufzeichnung und Streaming für iOS , Android oder sogar eine einfache Webseite wie diese . Sie können auch die HTTP-Schnittstelle verwenden, um Live-Audio zu streamen oder eine Sounddatei zu veröffentlichen:

Nehmen wir diesen Sound (aufgenommen von einem Prominenten in) das Tal – wissen Sie, wer?):

Senden Sie es mit einem POST an die Wit-API Anfrage:

curl -XPOST "https://api.wit.ai/speech" \
-i -L \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: audio/wav" \
--data-binary "@sample.wav"

Sie erhalten dies als Gegenleistung:

{
"msg\_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg\_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set\_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}

Möchten Sie Ihre eigene Sprachschnittstelle erstellen? Melden Sie sich hier an!

Team Wit

@WitNL

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.