语音流对接大模型
# 通过TCP推流和播放流(适合用于人机对话场景)
APP写法:
<action application="cti_audio_stream",data="remote-ip:remote-port <native> <param>"/>
1
参数说明:
remote-ip:remote-port
(必填):远端IP和远端端口。native
(选填):如果不设置,流格式为 8000hz 16位,如果设置了,就是原始的音频格式。param
:自定义参数
推送协议:
- 前面4字节 引导数据长度 网络字节顺序
- 时间戳 8字节
- 引导数据
{"uuid":"","codec":"","param":"自定义参数"}
- 数据流
连接断开后会自动重连,并且重发引导数据。返回的放音流需要和推流的编码一样,不需要引导数据。
# 配置拨号方案
进入呼叫中心->拨号方案设置->http话术 页面,配置一个呼叫http1
就进入流对接的例子。具体配置步骤如图所示:
# 测试流程
- 创建并注册分机。
- 分机呼叫
http1
,进入流对接,进行测试。
# 推送字节解析
图中所示是在测试过程中获取到的推送数据流:
00 00 00 50
:最前面的4个字节表示了时间戳和引导数据的长度之和,也就说时间戳加引导数据的字节长度为80。E7 81 D9 F6 96 01 00 00
:这8个字节为时间戳。- 中间72字节:引导数据。
- 最后的字节:音频流数据。
上次更新: 2025/05/23, 09:14:26