Introductie van Wit Speech API

(The Wit.ai Team) (12 februari 2014)

Spraakopdrachten zijn de toekomst. Sciencefiction heeft ze al tientallen jaren en toch hebben we nog steeds een handreiking naar de afstandsbediening om de tv aan te zetten of een alarm in te stellen. Onze missie is om dit te veranderen. Het toevoegen van een spraakinterface aan een app of apparaat moet eenvoudig zijn.

Spraak omzetten in bruikbare gegevens

Vandaag kondigen we met veel plezier onze nieuwe “Speech to JSON” API , vier maanden na de lancering van de “Text to JSON” API.

speech\_to\_json

Vanaf nu kan uw app, apparaat of zelfs uw website audio naar onze server streamen en in ruil daarvoor bruikbare gegevens ontvangen.

Bekijk het in actie voor domotica:

Hoe werkt het ?

Achter de schermen combineert Wit verschillende state-of-the-art natuurlijke taalverwerkingstechnieken en verschillende spraakherkenningsengines om een ​​lage latentie en een hoge robuustheid voor zowel omgevingsgeluid als parafrastische variaties te bereiken (er zijn miljoenen manieren om hetzelfde te zeggen).

Gelukkig hoeft u zich geen zorgen te maken over al deze machines. We besteden al onze energie aan het creëren van de eenvoudigst mogelijke ontwikkelaarservaring. U kunt binnen een paar minuten aan de slag met onze website . Wit zal zich in de loop van de tijd aanpassen aan uw domein, van ijsdistributie tot ruimtemissies. Wit doet geen aannames en blijft 100\% configureerbaar.

Het duurt 5 minuten om je eigen Wit-configuratie te bouwen:

De API gebruiken

Vervolgens is het aanroepen van de API eenvoudig. We bieden client-side SDKs die audio-opname en streaming afhandelen voor iOS , Android of zelfs een simpele webpagina zoals deze . Je kunt ook de HTTP-interface gebruiken om live audio te streamen of een geluidsbestand te posten:

Laten we dit geluid nemen (opgenomen door een beroemdheid in the valley – weet je wie?):

Verzend het naar de Wit API met een POST request:

curl -XPOST "https://api.wit.ai/speech" \
-i -L \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: audio/wav" \
--data-binary "@sample.wav"

Je krijgt dit terug:

{
"msg\_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg\_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set\_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}

Geïnteresseerd om uw eigen spraakinterface te bouwen? Meld u hier aan!

Team Wit

@WitNL

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *