来自B站的人工智能放大图片新模型：Real-CUGAN

win8 发表于 2022-2-14 00:43

本帖最后由 win8 于 2022-2-14 00:43 编辑

人工智能放大图片嘛，不管用过没用过，肯定都知道Waifu2x。

最近Bilibili放出了一个新的人工智能放大图片的模型Real-CUGAN：
https://github.com/bilibili/ailab/tree/main/Real-CUGAN
号称使用百万级动漫数据进行训练的，提供与Waifu2x-caffe兼容的模型
它支持2x\3x\4x倍超分辨率，其中2倍模型支持4种降噪强度与保守修复，3倍/4倍模型支持2种降噪强度与保守修复。
（然后github release竟然真的只放了模型没有放解压即可使用的包；没有详细说明，还是会有很多人不知道怎么使用的）
waifu2x-extension-gui项目已经增加了这个模型，不嫌大可以下载这个https://github.com/AaronFeng753/Waifu2x-Extension-GUI/
waifu2x-caffe本身就挺大的，所以我也不重新打包上传了。

发出来一是分享（估计感兴趣的人也早就知道了？) 二是想讨论下深度学习放大图片到底是个什么情况。
1. 我现在看到很多深度学习超分辨率的项目，广为人知的waifu2xreal-esrgan，同样实装到waifu2x-extension-gui里的srmd realsr，github也有其他的项目如BSRGAN, SwinIR等等。这些项目大多数原先是python——毕竟深度学习的大环境嘛，但是为什么release通常没有提供给普通用户的可执行程序？我猜测是Python和cuda这种东西直接打包体积巨大，使用也还是有门槛，还有其他的原因嘛？
2. 如果把Python下的超分模型转换为其他语言，是不是很复杂？按我的理解，不管什么语言，都是把图片解析为像素点构成的矩阵，模型就是非常复杂的矩阵运算过程，经过运算得到的矩阵再次恢复为图像，就完事了。所以转换过程有两步，一是把图片转矩阵矩阵转图片的过程用其他语言写了，二是把模型文件转为其他格式。但是实际似乎很麻烦？到底还发生了什么？我在real-cugan的issues看到这个：

tumuyan commented 2 days ago
既然已经有为waifu2x-caffe玩家提供了两套参数，那么是否可以直接把caffe模型转换为ncnn模型，从而直接使用waifu2x-ncnn调用模型来使用呢？我不了解其中的细节，但是我试了试看上去caffe2ncnn工具只能转换prototxt格式的文件，无法处理protobin？

nihui commented 2 days ago
模型推理的实现细节不一样，得重新写……

https://github.com/bilibili/ailab/issues/3

下边是节选github的介绍：
其模型结构魔改自Waifu2x官方CUNe，训练代码主要参考腾讯发布的RealESRGAN。
效果图对比

Waifu2x(CUNet)Real-ESRGAN(Anime6B)Real-CUGAN
训练集私有二次元训练集，量级与质量未知私有二次元训练集，量级与质量未知百万级高清二次元patch dataset
推理耗时(1080P)Baseline2.2x1x
效果(见对比图)无法去模糊，artifact去除不干净锐化强度最大，容易改变画风，线条可能错判，
虚化区域可能强行清晰化更锐利的线条，更好的纹理保留，虚化区域保留
兼容性大量windows-APP使用，VapourSynth支持，
Caffe支持，PyTorch支持，NCNN支持PyTorch支持，VapourSynth支持，NCNN支持同Waifu2x，结构相同，参数不同，与Waifu2x无缝兼容
强度调整仅支持多种降噪强度不支持已完成4种降噪程度版本和保守版，未来将支持调节不同去模糊、
去JPEG伪影、锐化、降噪强度
尺度仅支持1倍和2倍仅支持4倍已支持2倍、3倍、4倍，1倍训练中

yufangwen 发表于 2022-2-14 03:10

之前B站ai的官号发了这个的专栏，后来删了不知道为啥

泰坦失足 发表于 2022-2-14 03:52

RealESRGAN是腾讯的啊，我都用RealESRGAN+anime训练集的模型，就不琢磨着换新工具跑超分辨率了

整活骑士 发表于 2022-2-14 04:00

本帖最后由整活骑士于 2022-2-14 04:12 编辑

lz的意思是b站开源的这个模型声称兼容另一个开源模型waifux，但是没法简单替换掉waifu2x的gui项目中的模型吗

win8 发表于 2022-2-14 08:11

整活骑士发表于 2022-2-14 04:00
lz的意思是b站开源的这个模型声称兼容另一个开源模型waifux，但是没法简单替换掉waifu2x的gui项目中的模型 ...

waifu2x有使用不同库来实现的项目，其中有2个是waifu2x-caffe，waifu2x-ncnn。caffee模型转换成ncnn模型给waifu2x用不了。

win8 发表于 2022-2-14 08:42

yufangwen 发表于 2022-2-14 03:10
之前B站ai的官号发了这个的专栏，后来删了不知道为啥

盲猜还是因为没有提供开箱即用用的gui，原Python仓库又需要安装cuda才能运行。不会玩的人太多

madnesshare 发表于 2022-2-14 09:24

这些引擎有个问题，修漫画的图，修的越清晰的，网点越干净，最狠的一个把网点全擦没了，全都变成白色区域了

Nanachi 发表于 2022-2-14 09:44

所以B站这个有简单易用的GUI客户端吗

若荼泱 发表于 2022-2-14 10:16

Nanachi 发表于 2022-2-14 09:44
所以B站这个有简单易用的GUI客户端吗

waifu2x-extension-gui项目已经增加了这个模型，不嫌大可以下载这个https://github.com/AaronFeng753/Waifu2x-Extension-GUI/
仔细看看主楼呗，没想到这个适配的这么快。

fcbjay 发表于 2022-2-14 10:42

waifu2x有网页直接可以用
这个有没有？

herryk159 发表于 2022-2-14 12:55

这个超级缝合怪不太好用。

win8 发表于 2022-2-14 14:49

fcbjay 发表于 2022-2-14 10:42
waifu2x有网页直接可以用
这个有没有？

显然没有网页，不然肯定更有热度。
这种东西还是开销蛮大的。

win8 发表于 2022-2-16 09:54

炸裂nihui大佬已经完成了体积小巧免安装的ncnn版 https://github.com/nihui/realcugan-ncnn-vulkan/releases/

baicon 发表于 2022-2-16 11:18

借贴问下现在视频resize用什么还是topaz吗？

中川夏纪 发表于 2022-2-16 12:19

yufangwen 发表于 2022-2-14 03:10
之前B站ai的官号发了这个的专栏，后来删了不知道为啥

都改到哔哩哔哩技术官方号了

chaos7 发表于 2022-2-16 12:36

能不能像anime4k那样用于实时视频放大

霜月琉璃 发表于 2022-2-16 17:35

泰坦失足发表于 2022-2-14 03:52
RealESRGAN是腾讯的啊，我都用RealESRGAN+anime训练集的模型，就不琢磨着换新工具跑超分辨率了 ...

我觉得可以换一换，不仅仅是分辨率的问题
esrgan没法很好的保留条纹或者点阵

QUI 发表于 2022-2-17 16:50

光CUDA toolkit就超过1GB了
模型部分的backend反正也不是python，转ONNX之类的C++ runtime还是可以的
不过竟然是U-Net，这算伪化生反哺社会吗

页: [1]

Stage1st's Archiver

来自B站的人工智能放大图片新模型：Real-CUGAN