OpenClaw人人养虾:对话模式

张开发
2026/4/11 3:22:17 15 分钟阅读

分享文章

OpenClaw人人养虾:对话模式
Talk Mode对话模式是 OpenClaw 的实时语音交互功能让你可以像和真人对话一样与 Agent 进行语音沟通。启动对话模式openclaw node --type audio --talk快速启动对话模式会自动启用音频节点的 STT 和 TTS 功能无需单独配置。对话方式OpenClaw 支持两种语音交互模式Push-to-Talk按键说话按住指定按键时录音松开后 Agent 开始处理。talk: mode: push_to_talk trigger_key: space # 触发按键空格键 min_duration: 0.5 # 最短录音时长秒 max_duration: 60 # 最长录音时长秒适用场景嘈杂环境需要精确控制录音时机移动设备上使用Always-Listening持续监听Agent 持续监听通过 VADVoice Activity Detection语音活动检测自动识别用户发言。talk: mode: always_listening vad: enabled: true sensitivity: medium # low / medium / high silence_timeout: 1500 # 静默超时毫秒超过此时间认为发言结束 min_speech: 300 # 最短语音时长毫秒过滤噪音适用场景安静环境免提使用智能音箱场景注意Always-listening 模式下麦克风持续处于录音状态。请确保在隐私安全的环境中使用并注意功耗。全双工语音Full-DuplexFull-Duplex全双工模式允许你和 Agent 同时说话Agent 在播放回复的同时仍能听到你的新输入。talk: duplex: full # full / half interrupt: true # 允许打断 Agent 的回复 echo_cancellation: true # 回声消除模式说明适用场景full全双工可同时收发自然对话体验half半双工轮流说话性能较低的设备打断机制开启interrupt后用户可以随时打断 Agent 的语音回复Agent正在朗读一篇长文章... 用户停直接告诉我结论。 Agent好的结论是...语音活动检测VADVAD 是对话模式的核心组件负责区分语音和静默/噪音。支持的 VAD 引擎引擎精度性能特点Silero VAD高轻量推荐本地运行WebRTC VAD中极轻量浏览器原生支持Energy-based低极轻量基于音量阈值talk: vad: engine: silero # silero / webrtc / energy threshold: 0.5 # 检测阈值 (0.0-1.0) window_size: 1024 # 检测窗口大小采样点延迟优化语音对话的体验很大程度取决于端到端延迟 Latency响应时间用户发言结束 → STT 转文字 → LLM 推理 → TTS 合成 → 开始播放 ~300ms ~500ms ~200ms ~50ms ≈ 总延迟约 1-1.5 秒优化建议优化项方法效果STT 延迟使用流式 STTDeepgram减少 ~200msLLM 延迟使用流式输出首字延迟减少 ~300msTTS 延迟使用流式 TTS减少 ~150ms网络延迟节点与网关同一局域网减少 ~50ms低延迟配置省带宽配置talk: mode: always_listening duplex: full streaming: stt: true # 流式语音识别 llm: true # 流式 LLM 输出 tts: true # 流式语音合成 vad: engine: silero silence_timeout: 800 # 缩短静默超时对话上下文对话模式下的语音对话也会保存上下文Agent 记得之前说过什么talk: context: max_turns: 20 # 保留最近 20 轮对话 include_timestamps: true # 记录每轮对话的时间配置示例智能音箱场景talk: mode: always_listening duplex: full interrupt: true vad: engine: silero sensitivity: medium silence_timeout: 1500 streaming: stt: true llm: true tts: true tts: voice: zh-CN-YunxiNeural speed: 1.1车载助手场景talk: mode: always_listening duplex: half vad: engine: silero sensitivity: low # 降低灵敏度过滤车内噪音 silence_timeout: 2000 audio: noise_suppression: true noise_level: aggressive常用命令# 启动对话模式 openclaw node --type audio --talk # 按键说话模式 openclaw node --type audio --talk --push-to-talk # 指定 TTS 音色 openclaw node --type audio --talk --voice zh-CN-XiaoxiaoNeural故障排查问题解决方案Agent 不回复检查 STT 和 LLM 配置是否正确回声问题开启echo_cancellation持续误触发调低 VADsensitivity或切换 push_to_talk延迟太高开启所有流式选项使用低延迟提供商《DeepSeek高效数据分析从数据清洗到行业案例》聚焦DeepSeek在数据分析领域的高效应用是系统讲解其从数据处理到可视化全流程的实用指南。作者结合多年职场实战经验不仅深入拆解DeepSeek数据分析的核心功能——涵盖数据采集、清洗、预处理、探索分析、建模回归、聚类、时间序列等及模型评估更通过金融量化数据分析、电商平台数据分析等真实行业案例搭配报告撰写技巧提供独到见解与落地建议。助力职场人在激烈竞争中凭借先进技能突破瓶颈实现职业进阶开启发展新篇。

更多文章