win8 发表于 2021-9-29 21:23

图片放大神器Real-ESRGAN,简单的介绍+求助

本帖最后由 win8 于 2022-2-12 23:51 编辑

Real-ESRGAN是一个利用AI放大图片的项目,最近比较火,公众号推荐我都见过好多次了。
原理咱也不懂,复制粘贴没意思,也就不做详细说明了。效果惊艳秒杀waifu2x。与其说是放大,不如说是修复并重建大图。
就放大能力而言,realesrgan预训练的模型是4x,waifu2x顾名思义是2倍缩放。就细节还原能力,realesrgan的纹理同样更胜一筹。
项目地址https://github.com/xinntao/Real-ESRGAN    (提供了Python代码、模型以及编译的 x86 portable版软件)衍生项目https://github.com/X-Lucifer/AI-Lossless-Zoomer(使用上边的包做了gui)

下载地址:
release页面
https://github.com/xinntao/Real-ESRGAN/releases/

Windows x86版当前链接
https://github.com/xinntao/Real- ... 0210901-windows.zip

做了一个加速链接
https://shrill-pond-3e81.hunsh.w ... 0210901-windows.zip
使用方法:
由于坛友反馈有使用难度,随便写了两个bat,解压后bat、需要放大的图片放到程序的同一目录,拖动图片文件到bat上等待即可。


web服务:
colab 白嫖Google的服务


Android版本:
这玩意是个Python项目,有使用ncnn框架预编译的Linux Windows Mac 的x86版本,但是arm CPU的手机用不了。
有感兴趣的坛友可以和我一起解决问题issue:https://github.com/xinntao/Real- ... uecomment-928665075

我基于realsr-ncnn完成了Android版本,最后还是靠自己实现了期望
已经上架酷安:
https://www.coolapk.com/apk/292197
代码仓库:
https://github.com/tumuyan/RealSR-NCNN-Android


效果
这是原项目的效果展示图。


这是与广为人知的waifu2x对比。






这是一张我找的糊极了的图片及放大效果





这是一张本身已经很清晰的cg及放大效果











平井姨夫 发表于 2021-9-29 21:44

x86版本哪里下载?

win8 发表于 2021-9-29 21:50

平井姨夫 发表于 2021-9-29 21:44
x86版本哪里下载?

在release页面
https://github.com/xinntao/Real-ESRGAN/releases/

Windows x86版当前链接
https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.2.4/realesrgan-ncnn-vulkan-20210901-windows.zip

做了一个加速链接
https://shrill-pond-3e81.hunsh.workers.dev/https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.2.4/realesrgan-ncnn-vulkan-20210901-windows.zip

Heliko 发表于 2021-9-29 22:31

手机性能够吗…

暁美ほむら 发表于 2021-9-29 22:51

官方效果图随便看看就行,这种明显的锐度过度以及细节涂抹严重的玩意我是喜欢不起来。

Saikou 发表于 2021-9-29 23:02

感谢推荐,效果真的还不错
https://p.sda1.dev/2/a7bf130eb870789201ba6b94330033c9/1.jpg

https://p.sda1.dev/2/5253b5466d614b0e37f10eef83c38a88/1.1 _Custom_.png

madnesshare 发表于 2021-9-29 23:08

本帖最后由 madnesshare 于 2021-9-29 23:11 编辑

怎么用?双击EXE一闪而过
waifu2X有可执行的文件

看懂了
要玩命令行
没有方便的软件之前,推广不起来的,麻烦的要死,WAIFU2X直接拉一堆文件进去,一点转换完事


樱绰落 发表于 2021-9-29 23:20

感谢推荐,试了下确实不错,不过运行时候感觉好像不能充分利用GPU和CPU

Saker_bobo 发表于 2021-9-29 23:32

madnesshare 发表于 2021-9-29 23:08
怎么用?双击EXE一闪而过
waifu2X有可执行的文件



看了下以前加书签的放大算法超级缝合怪GUI项目 Waifu2x-Extension-GUI 果然有这个算法
项目地址在这:https://github.com/AaronFeng753/Waifu2x-Extension-GUI

madnesshare 发表于 2021-9-29 23:34

Saker_bobo 发表于 2021-9-29 23:32
看了下以前加书签的放大算法超级缝合怪GUI项目 Waifu2x-Extension-GUI 果然有这个算法
项目地址在这:htt ...

谢谢老哥,1。57G,我下载下来试试

madnesshare 发表于 2021-9-29 23:46

Saker_bobo 发表于 2021-9-29 23:32
看了下以前加书签的放大算法超级缝合怪GUI项目 Waifu2x-Extension-GUI 果然有这个算法
项目地址在这:htt ...

感谢老哥推荐,试了下,用了楼主推荐的这个引擎以后确实比WAIFU2X的要好很多,噪点没了,那些涂抹痕迹也更顺滑,看起来观感好了很多,谢谢推荐

win8 发表于 2021-9-29 23:59

Heliko 发表于 2021-9-29 22:31
手机性能够吗…

CPUgpu即使不够用,也能用时间换。有问题的是可能内存不够用。

john 发表于 2021-9-30 00:01

真人涂抹效果太严重,还是漫画好





GALLADE 发表于 2021-9-30 00:42

马克,感觉还是等个图形界面吧

淼霆 发表于 2021-9-30 01:36

感谢分享,马克一下

orecheng 发表于 2021-9-30 01:50

这就是计算光学吗?太强了

伊可费斯 发表于 2021-9-30 03:30

ardito 发表于 2021-9-30 03:35

牛逼

KDN_Observer 发表于 2021-9-30 06:06

锐化过头了,不喜

lwa190212 发表于 2021-9-30 07:55

别说起码比网上流传的模型数据版本的waifu2x强了不止一点两点,对此产生了点兴趣,看了论文了解了下最近的超分辨率做法:

GAN类(SRGAN -> ESRGAN -> Real-ESRGAN)的超分辨率:生成器输入很烂的小图,输出还原的大图,鉴别器拿着一份原图和一份生成器生成的大图,鉴别哪一个是原图(这样训练的结果会偏向特征感知而不是还原图与原图PSNR指标)

一般的超分辨率是模拟了原图经过模糊->加噪声->降分辨率->jpeg压缩损失,原图按流程生成的很烂的小图输入去还原原图
Real-ESRGAN的处理:
模糊:将高斯模糊的卷积核的分布多了一个指数系数,得到更多种类的模糊效果
噪声:高斯噪声(独立的RGB噪声和黑白噪声都有)、泊松噪声(模拟相机的cmos热噪声)
分辨率:不同的缩放算法会带来不同的artifact,随机使用:最近邻插值(但是有misalignment问题就没用它)、area resize(我不知道这是什么算法)、bilinear插值、bicubic插值
JPEG压缩:使用不同quality值
以上为一个流程,为了应付网上反复压缩处理的低清图,Real-ESRGAN会做n次这个流程(论文中是2次流程),并加上其余失真效果:常见的ringing和overshoot失真,使用sinc滤波器模拟
生成器与ESRGAN一致,考虑到鉴别空间可能比ESRGAN的预设目标大很多(因为有n次流程),鉴别器从ESRGAN的VGG换成了U-net+skip connections,提供更精细的像素级反馈
使用更锐利的数据集训练的Real-ESRGAN+版本会得到更锐利的结果(但我看了下很多时候对比Real-ESRGAN版本会有更多的overshoot artifact)
以上

laotoutou 发表于 2021-9-30 08:36

等着老番4k化

laotoutou 发表于 2021-9-30 08:38

galgame高清重置更方便,可以搞起来了

szqasd 发表于 2021-9-30 08:42

小白问一下,这个跟Topaz Gigapixel AI效果比怎么样呢?

汝者 发表于 2021-9-30 09:30

mark一下

Litccc 发表于 2021-9-30 09:37

有点锐化过头了,我现在都用这个,可以自己选算法,免费版也够用
https://github.com/AaronFeng753/Waifu2x-Extension-GUI

bigice 发表于 2021-9-30 09:39

腾讯做的吧,效果不错,就是速度太慢,想用来高清化动画还是洗洗睡吧

liwangli1983 发表于 2021-9-30 10:12

为啥我提示
no vulkan device
invalid gpu device

本是r7000,4800h的vega7核显示+gtx1650

极北天琴 发表于 2021-9-30 10:13

liwangli1983 发表于 2021-9-30 10:12
为啥我提示
no vulkan device
invalid gpu device


装一个vulkanRT看看?

liwangli1983 发表于 2021-9-30 10:16

‭‭‭ 发表于 2021-9-30 10:13
装一个vulkanRT看看?



看了下,不管是vega7还是gtx1650都没有vulkan支持,需要更新驱动?

hein 发表于 2021-9-30 10:16

Litccc 发表于 2021-9-30 09:37
有点锐化过头了,我现在都用这个,可以自己选算法,免费版也够用
https://github.com/AaronFeng753/Waifu2x ...

对比了下,这个自己参数选的适合,出来的要比lz的效果好。

lwa190212 发表于 2021-9-30 10:16

风怒

lwa190212 发表于 2021-9-30 10:16

szqasd 发表于 2021-9-30 08:42
小白问一下,这个跟Topaz Gigapixel AI效果比怎么样呢?

没用过Topaz Gigapixel AI
说说这个模型可能处理不好的地方,首先是论文中出现的例子:

1.猜错线条 2.把砖块还原成其他虚构的图案 3.石碑上的纹理还原不好

看一下我的例子,请斟酌一下:
原图是黑丝质感(带了一些噪声):

超分辨率后是可怕的纹理


另一个例子,是因为低分辨率采样导致字体的横竖有些模糊:

但是还原的结果会更歪一些(薄字中央放大看完全歪了),血条的渐变处理得也不好


总而言之模糊得又像噪点又像图案的,有一定几率把图案还原错,也有一定几率当成噪点抹平
别看我举得处理不好的例子,其实如果你手里的小图也没有这种噪点和纹理并存的区域,预期还原的结果画面应当是比较干净时,使用效果还挺好的

szqasd 发表于 2021-9-30 10:20

lwa190212 发表于 2021-9-30 10:16
没用过Topaz Gigapixel AI
说说这个模型可能处理不好的地方,首先是论文中出现的例子:



感谢说明

Lisylfn 发表于 2021-9-30 10:28

szqasd 发表于 2021-9-30 08:42
小白问一下,这个跟Topaz Gigapixel AI效果比怎么样呢?
刚好测试完这两者, gigapixel那个描边效果更垃圾, 这个效果还是非常棒的
原图:
https://z3.ax1x.com/2021/09/30/4IJjfI.png
gigapixel:
https://z3.ax1x.com/2021/09/30/4IJqTH.png
real-esrgan:
https://z3.ax1x.com/2021/09/30/4IY4EQ.png

综合来讲, 效果还是可以的, 可以替换掉gigapixel了

尼特geek 发表于 2021-9-30 10:40

acg的图片搞起来还行,三次元的话,描边还是不真实。

GJRstone 发表于 2021-9-30 11:19

例图的黑猫警长和灰太狼已经把我看吐了。黑猫警长噪声多,蓝底最终效果有杂色,可以理解;灰太狼那眼睛下边缘真的是曲线吗…右上耳朵描边宽度也不行

霜落xss 发表于 2021-9-30 12:02

有没有超能力者知道他这个release的exe文件是怎么打包的?我用pyinstaller和nuitka打的包只要沾了tensorflow、pytorch之类的库就都是几百M起步,他这个可执行文件居然只有4M,太羡慕了

elxy 发表于 2021-9-30 12:51

霜落xss 发表于 2021-9-30 12:02
有没有超能力者知道他这个release的exe文件是怎么打包的?我用pyinstaller和nuitka打的包只要沾了tensorflo ...

作者这里用的是ncnn进行推理,ncnn最初是用于移动端的推理引擎,也是腾讯的nihui大佬维护的。看起来是用了vulkan的API,相关的驱动系统都自带了。而TensorFlow和PyTorch直接打包包含了太多不需要的库,体积自然就很大了。

暁美ほむら 发表于 2021-9-30 13:15

尼特geek 发表于 2021-9-30 10:40
acg的图片搞起来还行,三次元的话,描边还是不真实。

ACG图片其实也要看类型的,这算法只适合CG图以及不存在任何背景细节的ACG的人物图片,并不适用于我们平时看的Anime

win8 发表于 2021-9-30 14:04

elxy 发表于 2021-9-30 12:51
作者这里用的是ncnn进行推理,ncnn最初是用于移动端的推理引擎,也是腾讯的nihui大佬维护的。看起来是用 ...

所以你对ncnn有所了解对嘛,能不能帮忙康康我那个issue,我到底是出了什么问题?
页: [1] 2 3
查看完整版本: 图片放大神器Real-ESRGAN,简单的介绍+求助