什么是 Native Speech?
Native Speech 指的是浏览器内置的 Web Speech API,它包含两个主要部分:
- SpeechSynthesis:用于将文本转换为语音(TTS,Text-to-Speech)。
- SpeechRecognition:用于将用户的语音转换为文本(STT,Speech-to-Text)。
这些功能无需第三方库或插件,只需使用原生 JavaScript 即可调用。
语音合成示例
点击下方按钮,让浏览器朗读一段文字:
// JavaScript 示例
const utterance = new SpeechSynthesisUtterance('你好,这是原生语音合成功能。');
speechSynthesis.speak(utterance);
语音识别说明
语音识别功能依赖于浏览器对 SpeechRecognition 接口的支持(注意:目前仅部分浏览器如 Chrome 支持)。
使用前需获得用户授权麦克风权限。
// 伪代码示例(实际使用需处理兼容性和权限)
const recognition = new webkitSpeechRecognition();
recognition.onresult = (event) => {
console.log('识别结果:', event.results[0][0].transcript);
};
recognition.start();
注意事项
- 语音识别在 Firefox 和 Safari 中支持有限。
- 所有语音功能均需在安全上下文(HTTPS 或 localhost)下运行。
- 用户必须明确授权才能使用麦克风进行语音识别。