Wit Speech API 소개

(Wit.ai 팀) (2 월 12 일, 2014)

음성 명령은 미래입니다. 공상 과학 소설에는 수십 년 동안 이러한 기능이 있었지만 여전히 리모컨으로 TV를 켜거나 알람을 설정할 수 있습니다. 우리의 임무는 이것을 바꾸는 것입니다. 앱이나 기기에 음성 인터페이스를 추가하는 것은 간단해야합니다.

음성을 실행 가능한 데이터로 전환

오늘 새로운 Speech to JSONAPI , Text to JSONAPI 출시 4 개월 후

speech\_to\_json

이제부터 귀하의 앱, 기기 또는 웹 사이트는 Google 서버로 오디오를 스트리밍하고 실행 가능한 데이터를 얻을 수 있습니다.

가정 자동화를위한 실제 작동보기 :

작동 원리 ?

뒤에서 Wit는 다양한 최첨단 자연어 처리 기술과 여러 음성 인식 엔진을 결합하여 주변 소음과 의역 적 변화에 대한 낮은 지연 시간과 높은 견고성을 달성합니다. 같은 말을하는 수백만 가지 방법).

다행히도이 모든 기계에 대해 신경 쓸 필요는 없습니다. 우리는 가능한 가장 단순한 개발자 경험을 만드는 데 모든 에너지를 집중합니다. 웹 사이트 를 사용하여 몇 분 안에 시작할 수 있습니다. Wit는 아이스크림 배포에서 우주 임무에 이르기까지 시간이 지남에 따라 귀하의 도메인에 적응할 것입니다. Wit는 가정하지 않으며 100 \% 구성 가능합니다.

자신의 Wit 구성을 구축하는 데 5 분이 소요됩니다.

API 사용

그런 다음 API 호출은 간단합니다. iOS , Android 또는 이와 같은 간단한 웹 페이지도 . HTTP 인터페이스 를 사용하여 라이브 오디오를 스트리밍하거나 사운드 파일을 게시 할 수도 있습니다.

이 사운드 (유명인이 녹음 한 계곡 — 누군지 아십니까?) :

POST를 사용하여 Wit API에 제출 요청 :

curl -XPOST "https://api.wit.ai/speech" \
-i -L \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: audio/wav" \
--data-binary "@sample.wav"

이 결과를 얻을 수 있습니다.

{
"msg\_id" : "6a84eae3-969c-41ad-94d9-85076fbbdc99",
"msg\_body" : "set the kitchen table on fire",
"outcome" : {
"intent" : "set\_fire",
"entities" : {
"object" : {
"value" : "kitchen table",
"body" : "kitchen table"
}
},
"confidence" : 0.997
}
}

자신 만의 음성 인터페이스를 구축하고 싶으십니까? 여기에서 가입하세요!

Team Wit

@WitNL

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다