AIGC归纳

发表于 2025-09-27 更新于 2026-01-02 分类于 AIGC

失业的第一天，把现有的关于AIGC的乱七八糟的东西归纳一下

AI大善人们

我主要用的是这个平台，每天签到有2核时，大概A10可以用40分钟。有256g的存储，放一些图片和模型文件也够用。有一些现成的comfyUI的应用，还比较好用。

但感觉像没啥人维护了，文档不太好，怎么自己创建应用，在哪里写配置文件没找到。

应该和上面用法差不多，只是我没怎么用。

免费用户可以用T4大概4小时，我这两天基本都有，好处是不用搞签到啥的，坏处是每次环境都是新的，重新安装依赖，下一遍模型。我试了index-tts是在这上面部署的。

硅基流动还是挺好的，送我的14块钱一直用不完，模型也比较全，唯独api base
url不好找，https://api.siliconflow.cn/v1

和硅基流动差不多，开源的模型挺全的，而且api很快，我claude
code用的就是SophNet部署的kimi v2

主要是来这里学生图提示词的，lora模型比较丰富，还可以训练，但没试过。

看了b站的index-tts，类似的能实现声音克隆的还有阿里的CosyVoice，社区的GPT-SoVITS。

index-tts最大特点在于他把音色和情绪解耦了，你可以单独控制声音的情绪。

github.com/index-tts/index-tts.git，可以直接在colab上部署。

做声音有个现成的方式是用minimax.io 可以克隆音色

最近比较流行的生图工具了，支持的模型很多，最早我是想去试用qwen-image的。网页部署唯一比较麻烦的是下载模型，这里附上一些huggingface的命令。

1 2	huggingface-cli list Kijai/flux-fp8\ huggingface-cli download Kijai/flux-fp8 \--include flux1-dev-fp8.safetensor \--local-dir ./workspace/Comfyui/models/unet

comfyUI也不用自己搭，有很多平台能用，阿里、LibLib、runninghub都有

对做视频比较好用的几个模型

wan2.2-animate，能做吴京视频。

Wan-Animate supports two modes: (1) Animation mode, which generates high-fidelity character animation videos by precisely replicating the facial expressions and body movements from the reference video; (2) Replacement mode, which seamlessly integrates the character into the reference video, replacing the original character while reproducing the scene’s lighting and color style to achieve natural environmental blending.
humo，可以做数字人。