Introducerea Wit Speech API

(Echipa Wit.ai) (12 februarie 2014)

Comenzile vocale sunt viitorul. Știința-ficțiune le are de zeci de ani și, totuși, avem încă posibilitatea ca telecomanda să pornească televizorul sau să alarme. Misiunea noastră este să schimbăm acest lucru. Adăugarea unei interfețe vocale la o aplicație sau dispozitiv ar trebui să fie simplă.

Transformarea vorbirii în date care pot fi acționate

Astăzi, suntem foarte încântați să anunțăm noul nostru API „Speech to JSON” , la patru luni de la lansarea API-ului „Text către JSON”.

speech\_to\_json

De acum înainte, aplicația, dispozitivul sau chiar site-ul dvs. web pot transmite audio pe serverul nostru și pot obține în schimb date acționabile.

Vedeți-l în acțiune pentru automatizarea casei:

Cum funcționează ?

În spatele scenei, Wit combină diverse tehnici ultramoderne de procesare a limbajului natural și mai multe motoare de recunoaștere a vorbirii pentru a obține o latență scăzută și o robustețe ridicată atât la zgomotul înconjurător, cât și la variațiile parafrastice (există milioane de moduri de a spune același lucru).

Din fericire, nu trebuie să vă pese de toate aceste utilaje. Ne concentrăm toată energia pentru a crea cea mai simplă experiență posibilă pentru dezvoltatori. Puteți porni în funcțiune în câteva minute folosind site-ul nostru . Wit se va adapta domeniului dvs. în timp, de la distribuția înghețatei până la misiunile spațiale. Wit nu face presupuneri și rămâne 100\% configurabil.

Vă vor dura 5 minute pentru a vă crea propria configurație Wit:

Consumarea API

Apoi, apelarea API-ului este simplă. Oferim SDK-uri client care gestionează înregistrarea și transmiterea audio pentru iOS , Android sau chiar și o pagină web simplă ca aceasta . De asemenea, puteți utiliza interfața HTTP pentru a transmite audio live sau a posta un fișier de sunet:

Să luăm acest sunet (înregistrat de la o celebritate în valea – știi cine?):

Trimite-l la API-ul Wit cu un POST request:

curl -XPOST "https://api.wit.ai/speech" \
-i -L \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: audio/wav" \
--data-binary "@sample.wav"

Veți primi acest lucru în schimb:

{
"msg\_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg\_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set\_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}

Vreți să vă construiți propria interfață vocală? Înscrieți-vă aici!

Team Wit

@WitNL

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *