Apresentando a API Wit Speech

(Equipe Wit.ai) (12 de fevereiro 2014)

Os comandos de voz são o futuro. A ficção científica os tem há décadas e, no entanto, ainda temos que pegar o controle remoto para ligar a TV ou definir um alarme. Nossa missão é mudar isso. Adicionar uma interface de voz a um aplicativo ou dispositivo deve ser simples.

Transformando a fala em dados acionáveis ​​

Hoje, temos o prazer de anunciar nosso novo API “Speech to JSON” , quatro meses após o lançamento da API “Text to JSON”.

speech\_to\_json

De agora em diante, seu aplicativo, dispositivo ou até mesmo seu site pode transmitir áudio para nosso servidor e obter dados acionáveis ​​em troca.

Veja-o em ação para automação residencial:

Como funciona ?

Nos bastidores, o Wit combina várias técnicas de processamento de linguagem natural de última geração e vários mecanismos de reconhecimento de voz para alcançar baixa latência e alta robustez para o ruído circundante e variações parafrásticas (há milhões de maneiras de dizer a mesma coisa).

Felizmente, você não precisa se preocupar com todo esse mecanismo. Concentramos toda a nossa energia na criação da experiência de desenvolvedor mais simples possível. Você pode começar a usar em alguns minutos usando nosso site . A inteligência se adaptará ao seu domínio com o tempo, desde a distribuição de sorvete até as missões espaciais. O Wit não faz suposições e permanece 100\% configurável.

Você levará 5 minutos para criar sua própria configuração do Wit:

Consumindo a API

Então, chamar a API é simples. Fornecemos SDKs do lado do cliente que lidam com gravação de áudio e streaming para iOS , Android ou até mesmo uma página da web simples como esta . Você também pode usar a interface HTTP para transmitir áudio ao vivo ou postar um arquivo de som:

Vamos pegar este som (gravado por uma celebridade em o vale – você sabe quem?):

Envie para a API do Wit com um POST solicitação:

curl -XPOST "https://api.wit.ai/speech" \
-i -L \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: audio/wav" \
--data-binary "@sample.wav"

Você receberá isso em troca:

{
"msg\_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg\_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set\_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}

Interessado em construir sua própria interface de voz? Inscreva-se aqui!

Equipe Wit

@WitNL

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *