2025-01-19
分享到
金融界2025年1月18日消息,国家知识产权局信息显示,厦门她趣信息技术有限公司申请一项名为“一种语音转化方法、装置、设备及可读存储介质”的专利,公开号 CN 119314501 A,申请日期为 2024年12月。
专利摘要显示,本发明提供了一种语音转化方法、装置、设备及可读存储介质,通过先将待转换音频和参考音频通过音频量化器进行压缩量化,以生成待转换音频的语义编码和参考音频的参考编码,接着,将语义编码和参考编码按其梅尔频谱的长度进行对齐,以拼接成一组特征向量,调用音频大语言模型对特征向量进行自回归解码生成输出编码,将参考音频的梅尔频谱输入音色风格网络生成感知向量,将输出编码和感知向量融合生成向量编码;再接着,调用流预测网络结合时间序列embedding和先验分布对向量编码进行处理,以逐步生成梅尔频谱;最后,将梅尔频谱通过声码器还原为目标语音信号,解决了现有的小规模的模型对细微声音特征还原效果不够理想的问题。
天眼查资料显示,厦门她趣信息技术有限公司,成立于2017年,位于厦门市,是一家以从事互联网和相关服务为主的企业。企业注册资本1950万人民币。通过天眼查大数据分析,厦门她趣信息技术有限公司共对外投资了6家企业,参与招投标项目13次,知识产权方面有商标信息14条,专利信息47条,此外企业还拥有行政许可12个。