语音模式入门
在 CLI 与 Telegram 中用语音与 Hermes 对话,适合免打字场景
本文内容译自 Nous Research 官方文档,技术细节以英文原文为准。对照官方文档
走路、做饭时想查资料或记待办——语音模式让你用说的方式驱动 Hermes,回复仍可为文字或语音(视配置而定)。
开启方式
对话中:
/voice on
或参考CLI 基础中的斜杠命令表。需安装官方 voice 扩展(hermes doctor 会提示缺失项)。
适用场景(个人)
- 早晨口述今日待办,让 Agent 整理成列表
- 双手占用时追问上一条回答
- 结合 Telegram gateway 在手机端语音交互
官方详解:Voice Mode、Use Voice Mode with Hermes。
与 Cron 组合
可搭建「早晨语音提问 + 定时推送摘要」流水线,见实战 语音 + 定时自检。
常见误区
- 未装 voice 扩展就期望
/voice on可用 → 先hermes doctor - 在嘈杂环境识别差 → 缩短句子、关键名词用英文
- 语音与记忆无关 → 重要结论仍应要求写入记忆
本章自检
- 已知如何开启
/voice on并确认扩展已安装 - 能完成一次「口述问题 → 文字回答」闭环
- 知悉与 Cron 组合的 Lab 入口