(Equipe Wit.ai) (12 de fevereiro 2014)
Os comandos de voz são o futuro. A ficção científica os tem há décadas e, no entanto, ainda temos que pegar o controle remoto para ligar a TV ou definir um alarme. Nossa missão é mudar isso. Adicionar uma interface de voz a um aplicativo ou dispositivo deve ser simples.
Transformando a fala em dados acionáveis
Hoje, temos o prazer de anunciar nosso novo API “Speech to JSON” , quatro meses após o lançamento da API “Text to JSON”.

De agora em diante, seu aplicativo, dispositivo ou até mesmo seu site pode transmitir áudio para nosso servidor e obter dados acionáveis em troca.
Veja-o em ação para automação residencial:
Como funciona ?
Nos bastidores, o Wit combina várias técnicas de processamento de linguagem natural de última geração e vários mecanismos de reconhecimento de voz para alcançar baixa latência e alta robustez para o ruído circundante e variações parafrásticas (há milhões de maneiras de dizer a mesma coisa).
Felizmente, você não precisa se preocupar com todo esse mecanismo. Concentramos toda a nossa energia na criação da experiência de desenvolvedor mais simples possível. Você pode começar a usar em alguns minutos usando nosso site . A inteligência se adaptará ao seu domínio com o tempo, desde a distribuição de sorvete até as missões espaciais. O Wit não faz suposições e permanece 100\% configurável.
Você levará 5 minutos para criar sua própria configuração do Wit:
Consumindo a API
Então, chamar a API é simples. Fornecemos SDKs do lado do cliente que lidam com gravação de áudio e streaming para iOS , Android ou até mesmo uma página da web simples como esta . Você também pode usar a interface HTTP para transmitir áudio ao vivo ou postar um arquivo de som:
Vamos pegar este som (gravado por uma celebridade em o vale – você sabe quem?):
Envie para a API do Wit com um POST solicitação:
curl -XPOST "https://api.wit.ai/speech" \
-i -L \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: audio/wav" \
--data-binary "@sample.wav"
Você receberá isso em troca:
{
"msg\_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg\_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set\_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}
Interessado em construir sua própria interface de voz? Inscreva-se aqui!
Equipe Wit