Presentación de Wit Speech API

Publicado el

(El equipo de Wit.ai) (12 de febrero de 2014)

Los comandos de voz son el futuro. La ciencia ficción los ha tenido durante décadas y, sin embargo, todavía tenemos el control remoto para encender el televisor o configurar una alarma. Nuestra misión es cambiar esto. Agregar una interfaz de voz a una aplicación o dispositivo debería ser simple.

Convertir la voz en datos procesables

Hoy, estamos muy emocionados de anunciar nuestro nuevo API «Speech to JSON» , cuatro meses después del lanzamiento de la API «Text to JSON».

speech\_to\_json

De ahora en adelante, su aplicación, dispositivo o incluso su sitio web puede transmitir audio a nuestro servidor y obtener datos procesables a cambio.

Véalo en acción para la automatización del hogar:

¿Cómo funciona? ?

Detrás de escena, Wit combina varias técnicas de procesamiento de lenguaje natural de última generación y varios motores de reconocimiento de voz para lograr una baja latencia y una alta robustez tanto para el ruido circundante como para las variaciones parafrásticas (existen millones de formas de decir lo mismo).

Afortunadamente, no necesita preocuparse por toda esta maquinaria. Centramos toda nuestra energía en crear la experiencia de desarrollador más sencilla posible. Puede estar en funcionamiento en unos minutos utilizando nuestro sitio web . Wit se adaptará a tu dominio con el tiempo, desde la distribución de helados hasta las misiones espaciales. Wit no hace suposiciones y permanece 100\% configurable.

Le llevará 5 minutos crear su propia configuración de Wit:

Consumiendo la API

Entonces, llamar a la API es simple. Proporcionamos SDK del lado del cliente que manejan la grabación y transmisión de audio para iOS , Android o incluso una página web simple como esta . También puede usar la interfaz HTTP para transmitir audio en vivo o publicar un archivo de sonido:

Tomemos este sonido (grabado por una celebridad en the valley – ¿sabes quién?):

Envíalo a la API Wit con un POST solicitud:

curl -XPOST "https://api.wit.ai/speech" \
-i -L \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: audio/wav" \
--data-binary "@sample.wav"

Obtendrás esto a cambio:

{
"msg\_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg\_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set\_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}

¿Está interesado en crear su propia interfaz de voz? ¡Regístrate aquí!

Team Wit

@WitNL

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *