加载中...

小众AI赛道之声音克隆--GPT-sovits推理特化包让你轻松简单上手

发表于2025-10-15|更新于2025-10-15|折腾

|总字数:962|阅读时长:3分钟|浏览量:

小众AI赛道之声音克隆–GPT-sovits推理特化包让你轻松简单上手

EMMM前两天写了这个系列的第一篇小众AI赛道之声音克隆–从GPT-SoVITS开始，虽然好像没啥人对这玩意感兴趣，但是我想了想还是继续完成这一篇，万一有人看是吧（

什么是特化包

GPT-SoVITS是花儿不哭大佬研发的低成本AI音色克隆软件，缩写是GSV

GSVI是由AI-Hobbyist开发的gpt-sovits的推理特化包，
项目地址：https://github.com/AI-Hobbyist/GPT-SoVITS-V4-Inference

相比原版整合包

使用vue美化了推理前端
可以快速选择角色和参考音频，再给参考音频标注后可以通过选择不同情感的参考音频来控制合成语音的情感
可以一键下载4000+角色多语种的模型（原神&星铁&崩三&绝区零&蔚蓝档案&明日方舟&NIKKE……且在持续更新）

上面内容全部来自官方文档，感谢花儿不哭，红血球AE3803，白菜工厂1145号员工三位大佬的奉献

下载安装

下载链接：https://modelscope.cn/models/aihobbyist/GPT-SoVITS-Inference/files

‍

打开后你会看到上面页面，框出来的就是整合包，0927和1007是更新时间，直接最新就好，后面的cu是CUDA版本，你得看看你显卡支持的最大CUDA版本了

还是以我自己的为例，WIN+R输入powershell打开命令行，输入nvidia-smi查看驱动版本和最高支持的CUDA版本，比如我这13.0就直接下cu12.8就完了

安装就直接解压

使用

模型下载

来到我们的解压目录，双击gsvi.bat打开WEBUI

然后就熟悉地出现一个小黑框框，加载完成后自动http://127.0.0.1:8000/，然后会显示下面页面（因为我自个已经点了，所有下面两张图也来自官方文档）

点击我同意，下一步

输入三位作者名并保证，进入网页

然后！让我们查看GSVI相比原版最大的区别！模型库！

在社区模型，我们可以找自己想要的角色的模型，试听然后点击下载就好，需要注意的是有些模型会标注V4，V2PROPLUS什么的，这个我们后面会用

点击下载我们会跳转到ai-hobbyist社区并看到一个下载链接

下载解压后得到一个文件夹，我们需要手动把它移到对应的目录去，比如我下的丛雨酱的模型，它标注了一个V4，那我们就移动到models/v4下，标注啥放哪就行

而对于一键下载就很方便了，点一下，完事

推理

我们推理有三种模式

情感模式需要下载的模型支持，不然是用不了这个模式的，很多支持的模型也就一种情感不太好用。

至于使用，先选择版本，我们之前下的是V4这里还是选V4，然后就能看到下载的模型，再选择语言情感和语气就好

至于种子，-1就是随机，你也可以输入其他值，遇到喜欢的可以记录下来能够保证生成效果的一致性

然后经典模式就是上传参考文本和参考音频了，不知道怎么生成合适的参考文本和参考音频可以参考我的上一篇小众AI赛道之声音克隆–从GPT-SoVITS开始

模型生成

特化版也是支持模型生成的，随便双击一个，然后参考前文干就完了

参考文献

官方文档：https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/gos50nrqrlipryqq#dphBp

再次感谢大佬的付出！

文章作者: 洛风缘

文章链接: https://www.windyl.de/post/niche-ai-track-sound-cloninggptsovits-inference-specialized-package-allows-you-to-get-started-easily-2mahph.html

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源洛风缘的小屋！

相关推荐

白嫖英伟达DeepSeek R1 API简明教程

白嫖英伟达DeepSeek R1 API简明教程白嫖API打开网站，点击Build with this NIM 输入邮箱，点击Next，注意，这里使用企业邮箱是5000次，普通邮箱是1000次对话。输入邮箱密码创建用户，验证邮箱（验证码被Outlook丢进垃圾箱也是绝了）设置完用户名之后会跳转回来，创建API，复制API之后点击Got it！使用APIWindows客户端建议使用Cherry Studio，点击这里下载安装。按照图示顺序配置API，点击管理添加DeepSeek R1模型，然后在首页使用即可

我用AI搓了个Outlook邮箱管理程序

我用AI搓了个Outlook邮箱管理程序项目地址：https://github.com/fengyuanluo/FireMail 前缘最近想研究大模型的逆向拿来自己用，之前也买过一些 Outlook 邮箱，但是都是拿 Thunderbird 管理的。这么做有啥坏处呢？一方面是雷鸟上放一大堆不常用的邮箱严重影响美观，另外一方面，雷鸟导入的过程也挺繁琐的… 当然，市面上也有类似功能的程序，比如心蓝邮件助手什么的，但是…收费所以就起了想法，一个代码小白，能不能完全依靠 AI，完成一个项目？ ‍ 过程简单回顾很庆幸肝了两天经过三次彻底重构最后是让我搞成了，感谢 Cursor 的大力支持，愣生生让我用废了将近 3 个号的额度。至于过程真是一言难尽，这里放一个最初版的首 Prompt，虽然最后这个版本是没有成功的，oauth2_imap_demo.py...

还在求Manus邀请码？来试试本地部署Lite版Manus！

最简单粗暴的Stable Diffusion Webui本地部署教程！让每个人都能自己实现AI画图！

先放两张自己画的图片镇楼。 ‍ ‍ 什么是Stable Diffusion Webui Stable Diffusion WebUI是 Stable Diffusion 的浏览器界面，Stable Diffusion 是一种 AI 模型，可以根据文本提示生成图像或用文本提示修改现有图像。 Stable Diffusion Web UI 是探索 Stable Diffusion 可能性的好方法，只需点击几下即可创建令人惊叹的图像。内容来自官网还是大白话翻译一下，就用这玩意，你就能抛弃GPT4，抛弃Mj（当然实际效果很大可能不如Mj……）,在本地实现AI绘画！部署前提条件虽然咱教程的目标是让所有人都能用上Stable Diffusion...

实战！基于SPEC的AI开发

实战！基于SPEC的AI开发规范驱动开发颠覆了传统软件开发的模式。几十年来，代码一直是王道——规范只是我们搭建的脚手架，一旦“真正的”编码工作开始，就被丢弃。规范驱动开发改变了这一点：规范变得可执行...

后Augment时代的低成本Vibe coding实践

后Augment时代的低成本Vibe coding实践喜欢折腾，就你喜欢折腾是吧什么是Vibe codingVibe coding（有译氛围编程）是一种使用AI辅助的编程范式，程序员会用提示描述要处理的问题，提供给软件开发专用的大型语言模型（LLM）。应用程序的源代码是由大型语言模型产生，程序员的工作从原来的撰写程式码，改为指导AI产生程式码，测试及优化程式码。Vibe coding的提倡者认为这甚至可以让新手程序员在没有以往软件工程要求技能的情形下，可以产出软件。此一词语是由安德烈·卡帕斯在2025年2月提出，在3月时列在韦氏英语惯用法词典的”slang &...

数据加载中