Przedstawiamy Wit Speech API

(The Wit.ai Team) (12 lutego, 2014)

Polecenia głosowe to przyszłość. Science-fiction ma je od dziesięcioleci, a mimo to wciąż możemy sięgnąć po pilota, aby włączyć telewizor lub ustawić alarm. Naszą misją jest to zmienić. Dodanie interfejsu głosowego do aplikacji lub urządzenia powinno być proste.

Przekształcanie mowy w przydatne dane

Dziś z ogromną przyjemnością ogłaszamy nasz nowy Interfejs API „Speech to JSON” , cztery miesiące po uruchomieniu interfejsu API „Text to JSON”.

speech\_to\_json

Od teraz Twoja aplikacja, urządzenie, a nawet witryna może przesyłać strumieniowo dźwięk na nasz serwer i otrzymywać w zamian przydatne dane.

Zobacz, jak to działa w automatyzacji domu:

Jak to działa ?

Za kulisami Wit łączy różne najnowocześniejsze techniki przetwarzania języka naturalnego i kilka silników rozpoznawania mowy, aby uzyskać niskie opóźnienie i wysoką odporność zarówno na otaczający hałas, jak i na zmiany parafrastyczne (istnieją miliony sposobów na powiedzenie tego samego).

Na szczęście nie musisz przejmować się tą całą maszynerią. Skupiamy całą naszą energię na tworzeniu możliwie najprostszego środowiska programistycznego. Możesz zacząć działać w ciągu kilku minut, korzystając z naszej witryny . Rozum z czasem dostosuje się do Twojej domeny, od dystrybucji lodów po misje kosmiczne. Wit nie przyjmuje żadnych założeń i pozostaje w 100\% konfigurowalny.

Zbudowanie własnej konfiguracji Wit zajmie Ci 5 minut:

Korzystanie z API

W takim przypadku wywołanie API jest proste. Udostępniamy pakiety SDK po stronie klienta, które obsługują nagrywanie i przesyłanie strumieniowe dźwięku na iOS , Android lub nawet prostą stronę internetową, taką jak ta . Możesz także użyć interfejsu HTTP , aby przesyłać strumieniowo dźwięk na żywo lub opublikować plik dźwiękowy:

Weźmy ten dźwięk (nagrany od znanej osoby w dolina – czy wiesz, kto?):

Prześlij go do interfejsu Wit API za pomocą POST żądanie:

curl -XPOST "https://api.wit.ai/speech" \
-i -L \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: audio/wav" \
--data-binary "@sample.wav"

Otrzymasz w zamian:

{
"msg\_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg\_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set\_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}

Chcesz zbudować własny interfejs głosowy? Zarejestruj się tutaj!

Team Wit

@WitNL

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *