神经网络架构
基于Transformer的先进神经网络架构,用于自然语音合成
通过我们的交互式演示体验KittenTTS的强大功能。输入您的文本并聆听自然的语音合成。
演示托管在 Hugging Face Spaces
探索让KittenTTS成为神经网络文本转语音强有力选择的特性
基于Transformer的先进神经网络架构,用于自然语音合成
支持多种具有不同特征和语言能力的声音模型
优化的推理流水线,支持实时文本转语音生成
卓越的音频质量,具有自然的韵律和语调
获得关于KittenTTS常见问题的答案
KittenTTS是一个先进的神经网络文本转语音系统,能够从文本输入产生高质量、自然音质的语音。
KittenTTS支持包括英语在内的多种语言,更多语言模型正在开发中。
您可以通过上面的交互式演示使用KittenTTS,或使用GitHub仓库将其集成到您的应用程序中。
是的,KittenTTS是开源的,在MIT许可证下可在GitHub上获得。