找回密码
 立即注册
搜索
查看: 5112|回复: 17

[软件] 来自B站的人工智能放大图片新模型:Real-CUGAN

[复制链接]
     
发表于 2022-2-14 00:43 | 显示全部楼层 |阅读模式
本帖最后由 win8 于 2022-2-14 00:43 编辑

人工智能放大图片嘛,不管用过没用过,肯定都知道Waifu2x。

最近Bilibili放出了一个新的人工智能放大图片的模型Real-CUGAN:
https://github.com/bilibili/ailab/tree/main/Real-CUGAN
号称使用百万级动漫数据进行训练的,提供与Waifu2x-caffe兼容的模型
它支持2x\3x\4x倍超分辨率,其中2倍模型支持4种降噪强度与保守修复,3倍/4倍模型支持2种降噪强度与保守修复。
(然后github release竟然真的只放了模型没有放解压即可使用的包;没有详细说明,还是会有很多人不知道怎么使用的)
waifu2x-extension-gui项目已经增加了这个模型,不嫌大可以下载这个  https://github.com/AaronFeng753/Waifu2x-Extension-GUI/
waifu2x-caffe本身就挺大的,所以我也不重新打包上传了。


发出来一是分享(估计感兴趣的人也早就知道了?) 二是想讨论下深度学习放大图片到底是个什么情况。
1. 我现在看到很多深度学习超分辨率的项目,广为人知的waifu2x  real-esrgan,同样实装到waifu2x-extension-gui里的srmd realsr,github也有其他的项目如BSRGAN, SwinIR等等。这些项目大多数原先是python——毕竟深度学习的大环境嘛,但是为什么release通常没有提供给普通用户的可执行程序?我猜测是Python和cuda这种东西直接打包体积巨大,使用也还是有门槛,还有其他的原因嘛?
2. 如果把Python下的超分模型转换为其他语言,是不是很复杂?按我的理解,不管什么语言,都是把图片解析为像素点构成的矩阵,模型就是非常复杂的矩阵运算过程,经过运算得到的矩阵再次恢复为图像,就完事了。所以转换过程有两步,一是把图片转矩阵 矩阵转图片的过程用其他语言写了,二是把模型文件转为其他格式。但是实际似乎很麻烦?到底还发生了什么? 我在real-cugan的issues看到这个:
tumuyan commented 2 days ago
既然已经有为waifu2x-caffe玩家提供了两套参数,那么是否可以直接把caffe模型转换为ncnn模型,从而直接使用waifu2x-ncnn调用模型来使用呢?我不了解其中的细节,但是我试了试看上去caffe2ncnn工具只能转换prototxt格式的文件,无法处理protobin?

nihui commented 2 days ago
模型推理的实现细节不一样,得重新写……



https://github.com/bilibili/ailab/issues/3



下边是节选github的介绍:
其模型结构魔改自Waifu2x官方CUNe,训练代码主要参考腾讯发布的RealESRGAN。

效果图对比
image.png

Waifu2x(CUNet)Real-ESRGAN(Anime6B)Real-CUGAN
训练集私有二次元训练集,量级与质量未知私有二次元训练集,量级与质量未知百万级高清二次元patch dataset
推理耗时(1080P)Baseline2.2x1x
效果(见对比图)无法去模糊,artifact去除不干净锐化强度最大,容易改变画风,线条可能错判,
虚化区域可能强行清晰化
更锐利的线条,更好的纹理保留,虚化区域保留
兼容性大量windows-APP使用,VapourSynth支持,
Caffe支持,PyTorch支持,NCNN支持
PyTorch支持,VapourSynth支持,NCNN支持同Waifu2x,结构相同,参数不同,与Waifu2x无缝兼容
强度调整仅支持多种降噪强度不支持已完成4种降噪程度版本和保守版,未来将支持调节不同去模糊、
去JPEG伪影、锐化、降噪强度
尺度仅支持1倍和2倍仅支持4倍已支持2倍、3倍、4倍,1倍训练中



评分

参与人数 1战斗力 +2 收起 理由
Sza + 2 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2022-2-14 03:10 | 显示全部楼层
之前B站ai的官号发了这个的专栏,后来删了不知道为啥
回复

使用道具 举报

     
发表于 2022-2-14 03:52 | 显示全部楼层
RealESRGAN是腾讯的啊,我都用RealESRGAN+anime训练集的模型,就不琢磨着换新工具跑超分辨率了
回复

使用道具 举报

     
发表于 2022-2-14 04:00 来自手机 | 显示全部楼层
本帖最后由 整活骑士 于 2022-2-14 04:12 编辑

lz的意思是b站开源的这个模型声称兼容另一个开源模型waifux,但是没法简单替换掉waifu2x的gui项目中的模型吗
回复

使用道具 举报

     
 楼主| 发表于 2022-2-14 08:11 来自手机 | 显示全部楼层
整活骑士 发表于 2022-2-14 04:00
lz的意思是b站开源的这个模型声称兼容另一个开源模型waifux,但是没法简单替换掉waifu2x的gui项目中的模型 ...

waifu2x有使用不同库来实现的项目,其中有2个是waifu2x-caffe,waifu2x-ncnn。caffee模型转换成ncnn模型给waifu2x用不了。
回复

使用道具 举报

     
 楼主| 发表于 2022-2-14 08:42 来自手机 | 显示全部楼层
yufangwen 发表于 2022-2-14 03:10
之前B站ai的官号发了这个的专栏,后来删了不知道为啥

盲猜还是因为没有提供开箱即用用的gui,原Python仓库又需要安装cuda才能运行。不会玩的人太多
回复

使用道具 举报

     
发表于 2022-2-14 09:24 | 显示全部楼层
这些引擎有个问题,修漫画的图,修的越清晰的,网点越干净,最狠的一个把网点全擦没了,全都变成白色区域了
回复

使用道具 举报

     
发表于 2022-2-14 09:44 | 显示全部楼层
所以B站这个有简单易用的GUI客户端吗
回复

使用道具 举报

     
发表于 2022-2-14 10:16 | 显示全部楼层
Nanachi 发表于 2022-2-14 09:44
所以B站这个有简单易用的GUI客户端吗
waifu2x-extension-gui项目已经增加了这个模型,不嫌大可以下载这个  https://github.com/AaronFeng753/Waifu2x-Extension-GUI/

仔细看看主楼呗,没想到这个适配的这么快。
回复

使用道具 举报

     
发表于 2022-2-14 10:42 | 显示全部楼层
waifu2x有网页直接可以用
这个有没有?
回复

使用道具 举报

     
发表于 2022-2-14 12:55 | 显示全部楼层
这个超级缝合怪不太好用。
回复

使用道具 举报

     
 楼主| 发表于 2022-2-14 14:49 来自手机 | 显示全部楼层
fcbjay 发表于 2022-2-14 10:42
waifu2x有网页直接可以用
这个有没有?

显然没有网页,不然肯定更有热度。
这种东西还是开销蛮大的。
回复

使用道具 举报

     
 楼主| 发表于 2022-2-16 09:54 来自手机 | 显示全部楼层
炸裂  nihui大佬已经完成了体积小巧免安装的ncnn版    https://github.com/nihui/realcugan-ncnn-vulkan/releases/     
回复

使用道具 举报

发表于 2022-2-16 11:18 来自手机 | 显示全部楼层
借贴问下现在视频resize用什么还是topaz吗?
回复

使用道具 举报

     
发表于 2022-2-16 12:19 | 显示全部楼层
yufangwen 发表于 2022-2-14 03:10
之前B站ai的官号发了这个的专栏,后来删了不知道为啥

都改到哔哩哔哩技术官方号了
回复

使用道具 举报

发表于 2022-2-16 12:36 | 显示全部楼层
能不能像anime4k那样用于实时视频放大
回复

使用道具 举报

     
发表于 2022-2-16 17:35 | 显示全部楼层
泰坦失足 发表于 2022-2-14 03:52
RealESRGAN是腾讯的啊,我都用RealESRGAN+anime训练集的模型,就不琢磨着换新工具跑超分辨率了 ...

我觉得可以换一换,不仅仅是分辨率的问题
esrgan没法很好的保留条纹或者点阵
回复

使用道具 举报

     
发表于 2022-2-17 16:50 | 显示全部楼层
光CUDA toolkit就超过1GB了
模型部分的backend反正也不是python,转ONNX之类的C++ runtime还是可以的
不过竟然是U-Net,这算伪化生反哺社会吗
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-9-23 05:29 , Processed in 0.046439 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表