4.1 - Speech to Text (STT)

Speech to Text (STT) é uma API do Google que, no Conecta, tem a função de exibir, automaticamente, o que um contato falou em áudio, caso o agente, por algum motivo qualquer, não possa escutá-lo.

Primeiramente, para ativá-la, é necessário ter uma conta no Google GCP e, depois, seguir a seguinte ordem: criar ou escolher um projeto existente acessando este link, habilitar a API Google Speech to Text no projeto selecionado e, por fim, criar uma credencial para esse serviço.

Documentação oficial API: Speech-to-Text: reconhecimento de fala automático | Google Cloud

Preços: Preços | Cloud Speech-to-Text | Google Cloud

Criação e Configuração do Serviço

Com o projeto criado, é necessário pesquisar por “Cloud Speech-to-Text” para habilitá-lo neste projeto e ativar o serviço nele clicando no botão Ativar. Depois, é preciso acessar, dentro do serviço ativado, o menu Credenciais - Criar Credenciais. A seguir, veja o passo a passo por meio das imagens:

Imagem 1 - Cloud Speech-to-Text

Imagem 2 – Ativação de Serviço

Depois da criação das credenciais, é necessário acessar o menu Service Accounts e preencher o formulário para efetuar a criação da conta de serviço. Em seguida, é preciso clicar no botão “Criar chave”, selecionar a opção JSON e confirmar clicando no botão Criar. O projeto finaliza ao clicar no botão Concluir.

Após a conclusão, a chave privada será salva e todo o processo de integração será realizado com a chave (JSON) de credenciais. A seguir, veja o passo a passo por meio das imagens:

Ativação do recurso na plataforma

Para ativar esse recurso na plataforma Conecta, faça login e acesse o menu Fluxo. Depois, acesse a coluna Ações do fluxo cadastrado e desejado, clique na opção Editar e habilite o serviço na opção “STT Transcrição de áudio”.

Outras opções aparecerão e é necessário anexar a credencial gerada no GCP na opção “Selecionar arquivo”. Ainda é possível definir o idioma que se deseja e realizar testes. Armazene as configurações no botão Salvar.

A API do Speech to Text (STT) funciona apenas para os áudios enviados do contato para o agente, ou seja, caso o cliente receba uma resposta em áudio do atendente, não receberá a transcrição em texto. E, por uma restrição da API, a transcrição é limitada a áudios de um minuto. Aqueles que excedem este tempo podem não ser transcritos.

Voltar para Manual de Configuração do Conecta

Voltar para Tela Administrativa

Voltar para Fluxo

Wiki Leucotron

4.1 - Speech to Text (STT)

Analytics

Criação e Configuração do Serviço

Ativação do recurso na plataforma

Related content