Langchain-Chatchat/frontend/docs/usage/features/tts.zh-CN.mdx

31 lines
2.3 KiB
Plaintext
Raw Permalink Normal View History

2024-12-20 16:04:03 +08:00
import { Callout } from 'nextra/components';
# TTS & STT 语音会话
<Image
alt={'TTS & STT 语音会话'}
src={
'https://github-production-user-asset-6210df.s3.amazonaws.com/17870709/284072124-c9853d8d-f1b5-44a8-a305-45ebc0f6d19a.png'
}
cover
/>
LobeChat 支持文字转语音Text-to-SpeechTTS和语音转文字Speech-to-TextSTT技术我们的应用能够将文本信息转化为清晰的语音输出用户可以像与真人交谈一样与我们的对话代理进行交流。用户可以从多种声音中选择给助手搭配合适的音源。 同时对于那些倾向于听觉学习或者想要在忙碌中获取信息的用户来说TTS 提供了一个极佳的解决方案。
在 LobeChat 中,我们精心挑选了一系列高品质的声音选项 (OpenAI Audio, Microsoft Edge Speech),以满足不同地域和文化背景用户的需求。用户可以根据个人喜好或者特定场景来选择合适的语音,从而获得个性化的交流体验。
## Lobe TTS
![](https://camo.githubusercontent.com/278c08d77b754726f5ed40cb03bfc7a5632a69750518d11d140ae13ae06d0f48/68747470733a2f2f6769746875622d70726f64756374696f6e2d757365722d61737365742d3632313064662e73332e616d617a6f6e6177732e636f6d2f31373837303730392f3238343037373930392d38353463633039612d623363372d346663342d396561372d6637313337616262613335312e706e67)
[@lobehub/tts](https://tts.lobehub.com) 是一个使用 TS 语言开发的,高质量 TTS 工具包,支持在服务端和浏览器中使用。
- **服务端**:只要使用 15 行代码,即可实现对标 OpenAI TTS 服务的高质量语音生成能力。目前支持 EdgeSpeechTTS 与 MicrosoftTTS 与 OpenAITTS、OpenAISTT。
- **浏览器**:提供了高质量的 React Hooks 与可视化音频组件,支持加载、播放、暂停、拖动时间轴等常用功能,且提供了非常丰富的音轨样式调整能力。
<Callout type={'info'}>
我们在实现 LobeChat 的 TTS 功能过程中,发现市面上并没有一款很好的 TTS
前端库,导致在实现上耗费了很多精力,包括数据转换、音频进度管理、语音可视化等。秉承「 Community
First 」 的理念,我们把这套实现打磨并开源了出来,希望能帮助到想要实现 TTS 的社区开发者们。
</Callout>