Asterisco tem interfaces de audiohooks que podem ser usadas para isso (requer codificação c / c ++)
Além disso, há interface EAGI (o som pode ser recebido no identificador de arquivo número 3).
Principal problema com tal bot não conexão. Os serviços de telefonia usam voz de 8khz e isso NÃO é suficiente para o reconhecimento correto. Não há como mudar para uma melhor voz, todos os codecs na conexão PSTN / GSM no momento atual são codecs de 8khz.
O IBM Watson também possui serviços de integração de telefonia (custosos) que aceitam chamadas, reconhecem e enviam resultados via retorno de chamada. Mas, novamente, a qualidade do reconhecimento é terrível se a linguagem da pessoa do outro lado não for perfeita.