找回密码
 立即注册
搜索
查看: 4859|回复: 41

[软件] [16GB吃满]本地部署manga-image-translator(自动机翻+嵌字)+sakura本地部署

[复制链接]
     
发表于 2024-9-17 14:06 | 显示全部楼层 |阅读模式
本帖最后由 zmw_831110 于 2024-9-23 12:13 编辑

顶头总结一下
就是油猴脚本ComicRead+本地部署manga-image-translator+本地部署sakura
实现在线看日文生肉,manga-image-translator加了--upscaler=waifu2x --upscale-ratio=2 --font-size-minimum=28 启动参数后,低分辨率的漫画也可以足够清晰得观看了.
配合sakura的翻译质量,基本很少遇见看不明白的了.
缺点应该是,显卡显存要求16GB,要么就sakura用小点的模型.
而且显卡如果算力不够强,你得等翻译...我这个卡用着还可以接受,毕竟只要有一页文字量大,后面翻译嵌字的时间就快于我的观看速度了.
但是对于那种,文字量很少的,你就得等....
4080,4090应该要体验好不少.

因为是从零开始,有走弯路,记录的也比较杂乱,大家凑合看吧

本地部署manga-image-translator

起因是我想用这个里的图片翻译(作者说是用Docker更简单,但我想试一试manga-image-translator里的部署方案)
https://sleazyfork.org/zh-CN/scripts/374903-comicread

然后说到这个玩意的本地部署
https://github.com/zyddnys/manga ... b/main/README_CN.md

首先...我从来没有玩过本地部署,也不懂Python,就是安装说明,一步一步操作.
CMD,我也就只是会cd,cd..这里操作而已.

我是CMD管理员下装的 -搜索 CMD,"命令提示符"右键"以管理员身份运行"
不过存在无法修改keys.py文件(输入各种翻译API的密钥等信息)的问题,我现在只能去安全模式修改keys.py
我也懒得再重新弄了...建议先非管理员CMD装这个.
(Update,把manga-image-translator剪切到其他常规分区就可以了,我转移到D盘去了
然后写个bat就可以启动了
  1. @echo on
  2. python -m manga_translator --verbose --mode web --use-gpu --translator=sakura --upscaler=waifu2x --upscale-ratio=2 --font-size-minimum=28
  3. @echo off
复制代码

)

部分相关内容,直连很慢,速度被限制在2Mbps...(比如pytorch)想快得科学+tun模式,这样就很快了.

1.安装Python后(https://www.python.org/ftp/python/3.12.6/python-3.12.6-amd64.exe)

2.在CMD下把Git先装了
  1. winget install --id Git.Git -e --source winget
复制代码
https://git-scm.com/download/win

3.装"Microsoft C++ Build Tools"
https://visualstudio.microsoft.com/visual-cpp-build-tools/
勾选C++的桌面开发(3.XG)安装
QQ20240917-141140.jpg

4.CMD下继续装了一下pytorch(又是2.5个G)
  1. pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
复制代码
https://pytorch.org/get-started/locally/

5.把CUDA重新装一下(3个G)
https://developer.nvidia.com/cud ... rget_type=exe_local

6.然后开始根据Github里写的步骤
在CMD下开始执行部署命令.
  1. git clone https://github.com/zyddnys/manga-image-translator.git
复制代码

cd命令,切换路径到manga-image-translator文件夹的路径
  1. pip install -r requirements.txt
复制代码





回复

使用道具 举报

     
 楼主| 发表于 2024-9-18 20:32 | 显示全部楼层
本帖最后由 zmw_831110 于 2024-9-18 21:16 编辑

成了
  1. python -m manga_translator --verbose --mode web --use-gpu
复制代码

正常启动web后台
http://127.0.0.1:5003
试着翻译了一页
QQ20240918-203144.jpg

Kimino_023.jpg
7db7dd02-d7d5-4d60-8666-7af0da7536e5.webp

试了一下命令行批量翻译
  1. cd manga-image-translator
  2. python -m manga_translator --verbose --mode batch --use-gpu --translator=papago --target-lang=CHS -i C:\Users\xxx\Desktop\新建文件夹\1
复制代码

第1页20:44分~第186页20:51分
8分钟左右翻译完一个单行本,速度还行.
QQ20240918-211602.jpg

回复

使用道具 举报

     
 楼主| 发表于 2024-9-18 22:21 | 显示全部楼层
本帖最后由 zmw_831110 于 2024-9-19 20:36 编辑

开启web模式后
用脚本
https://sleazyfork.org/zh-CN/scripts/374903-comicread

成功机翻
QQ20240918-221821.jpg

Papago
QQ20240918-221751.jpg
百度还是稍微强一点
百度翻译.jpg

不过我还有个问题
C:\Windows\System32\manga-image-translator\manga_translator\translators

路径下的keys.py无法编辑,没办法去填百度翻译开发平台的APP ID和密钥
我重启了电脑,也是无法编辑
总不至于要我去安全模式下修改吧...
最后去安全模式改了...

QQ20240919-203507.jpg

回复

使用道具 举报

     
 楼主| 发表于 2024-9-20 21:28 | 显示全部楼层
本帖最后由 zmw_831110 于 2024-9-21 03:13 编辑

sakura部署好了
傻瓜的一键部署...非常傻瓜
https://github.com/SakuraLLM/SakuraLLM/wiki/llama.cpp%E4%B8%80%E9%94%AE%E5%8C%85%E9%83%A8%E7%BD%B2%E6%95%99%E7%A8%8B


模型用的sakura-13b-lnovel-v0.9b-Q4_K_M.gguf
https://hf-mirror.com/SakuraLLM/Sakura-14B-LNovel-v0.9b-GGUF/tree/main
QQ20240920-212637.jpg

manga-image-translator+sakura把16GB显存吃得干干净净,内存也用了超过32GB了,峰值达到35GB
刚刚够web看在线翻译
QQ20240920-211909.jpg
QQ20240920-231058.jpg

效果,翻译得正常多了.
QQ20240920-212342.jpg
QQ20240920-214608.jpg

PS:
我不懂怎么清翻译时的临时文件,记得过阵子就去删除一下吧
路径:
manga-image-translator\result
QQ20240921-031323.jpg

回复

使用道具 举报

     
发表于 2024-9-17 14:38 来自手机 | 显示全部楼层
既然啥都不会 直接docker不好么 何必折腾这些浪费生命

—— 来自 鹅球 v3.0.86-alpha
回复

使用道具 举报

     
发表于 2024-9-17 15:00 来自手机 | 显示全部楼层
wsl2解千愁

—— 来自 鹅球 v3.2.91
回复

使用道具 举报

发表于 2024-9-17 15:18 | 显示全部楼层
你不会百度搜错误么
error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools": https://visualstudio.microsoft.com/visual-cpp-build-tools/
回复

使用道具 举报

     
发表于 2024-9-17 16:03 | 显示全部楼层
不会python的话那你还是用docker吧,不然配环境都能烦死你
回复

使用道具 举报

     
发表于 2024-9-17 16:13 来自手机 | 显示全部楼层
看 lz 似乎看不懂这个错误日志的话,建议直接上 docker,docker for windows 会帮装 wsl2 应该。
到时候部署了不至于后期出问题,问题非常大,而且现在基本上都让套 venv,如果对虚拟环境不太清楚,很多教程又不适用。
如果 lz 会和 gpt 聊天的话倒不是问题,学的快

—— 来自 鹅球 v3.0.86-alpha
回复

使用道具 举报

     
发表于 2024-9-17 22:57 | 显示全部楼层
build-essential是debian的,windows上就装对应的编译工具。

建议你选第一个,C++的桌面开发,应该是够了,就是可能有点占硬盘

评分

参与人数 1战斗力 +2 收起 理由
zmw_831110 + 2 搞定

查看全部评分

回复

使用道具 举报

     
发表于 2024-9-17 22:58 | 显示全部楼层
Litccc 发表于 2024-9-17 16:03
不会python的话那你还是用docker吧,不然配环境都能烦死你

请问国内现在用docker有啥好办法吗?docker镜像都不小,网络问题严重,我找到的源基本都没法用。
回复

使用道具 举报

     
发表于 2024-9-17 23:06 | 显示全部楼层
windows 直接用 venv 就行了。
给你运行的命令行,venv我设置的是 manga-env,翻译器是sakurallm

  1. .\manga-env\scripts\activate
  2. python -m manga_translator -v --translator=sakura --skip-no-text --ignore-errors --font-size-minimum 28 --use-gpu -l CHS -i "path\path"
复制代码


回复

使用道具 举报

发表于 2024-9-18 07:18 | 显示全部楼层
本帖最后由 生存戰略 于 2024-9-18 07:22 编辑

英文版 Readme 说了,需要装 Microsoft C++ Build Tools 。
https://github.com/zyddnys/manga ... uctions-for-windows

不过按照经验来说,折腾环境问题费时费力还没收获,老老实实docker更简单。

回复

使用道具 举报

     
发表于 2024-9-18 08:29 来自手机 | 显示全部楼层
可以用anaconda?
回复

使用道具 举报

     
 楼主| 发表于 2024-9-18 19:48 | 显示全部楼层
本帖最后由 zmw_831110 于 2024-9-18 20:37 编辑

这次没报错了(装了C++的桌面开发)
  1. Building wheels for collected packages: pydensecrf
  2.   Building wheel for pydensecrf (pyproject.toml) ... done
  3.   Created wheel for pydensecrf: filename=pydensecrf-1.0-cp312-cp312-win_amd64.whl size=193007 sha256=545719a7986a7a4db186ad8a746c28177fcbef6a57f09a3bdf9fc805b6a387fb
  4.   Stored in directory: C:\Users\xxx\AppData\Local\Temp\pip-ephem-wheel-cache-y6qd1hir\wheels\9a\c6\f5\3c132397e37a92e93593422a889f45b692198d6124b141bf3b
  5. Successfully built pydensecrf
  6. Installing collected packages: wcwidth, unidic-lite, sentencepiece, pytz, pyperclip, pydensecrf, pyclipper, mpmath, jaconv, flatbuffers, arabic-reshaper, appdirs, antlr4-python3-runtime, win32-setctime, wheel, websockets, urllib3, tzdata, typing-extensions, torch-summary, termcolor, sympy, sniffio, six, setuptools, safetensors, regex, pyyaml, python-dotenv, pyreadline3, pycparser, psutil, protobuf, pillow, packaging, numpy, networkx, nest-asyncio, multidict, MarkupSafe, kornia-rs, idna, h11, fugashi, ftfy, fsspec, frozenlist, freetype-py, filelock, einops, editdistance, distro, cython, colorama, charset-normalizer, certifi, backports.cached-property, attrs, annotated-types, aioshutil, aiohappyeyeballs, aiofiles, yarl, tqdm, tifffile, tensorboardX, shapely, scipy, requests, PyWavelets, python-dateutil, pydantic-core, py3langid, opencv-python, omegaconf, marshmallow, marisa-trie, loguru, lazy-loader, langdetect, jinja2, imageio, humanfriendly, httpcore, fire, ctranslate2, cffi, anyio, aiosignal, torch, scikit-image, pyhyphen, pydantic, pandas, language-data, ImageHash, huggingface_hub, httpx, deepl, cryptography, coloredlogs, aiohttp, torchvision, tokenizers, openai, onnxruntime, langcodes, kornia, bitsandbytes, accelerate, transformers, timm, open_clip_torch, manga-ocr
  7. Successfully installed ImageHash-4.3.1 MarkupSafe-2.1.5 PyWavelets-1.7.0 accelerate-0.34.2 aiofiles-24.1.0 aiohappyeyeballs-2.4.0 aiohttp-3.10.5 aioshutil-1.5 aiosignal-1.3.1 annotated-types-0.7.0 antlr4-python3-runtime-4.9.3 anyio-4.4.0 appdirs-1.4.4 arabic-reshaper-3.0.0 attrs-24.2.0 backports.cached-property-1.0.2 bitsandbytes-0.43.3 certifi-2024.8.30 cffi-1.17.1 charset-normalizer-3.3.2 colorama-0.4.6 coloredlogs-15.0.1 cryptography-43.0.1 ctranslate2-4.4.0 cython-3.0.11 deepl-1.19.1 distro-1.9.0 editdistance-0.8.1 einops-0.8.0 filelock-3.16.1 fire-0.6.0 flatbuffers-24.3.25 freetype-py-2.5.1 frozenlist-1.4.1 fsspec-2024.9.0 ftfy-6.2.3 fugashi-1.3.2 h11-0.14.0 httpcore-1.0.5 httpx-0.27.2 huggingface_hub-0.25.0 humanfriendly-10.0 idna-3.10 imageio-2.35.1 jaconv-0.4.0 jinja2-3.1.4 kornia-0.7.3 kornia-rs-0.1.5 langcodes-3.4.0 langdetect-1.0.9 language-data-1.2.0 lazy-loader-0.4 loguru-0.7.2 manga-ocr-0.1.12 marisa-trie-1.2.0 marshmallow-3.22.0 mpmath-1.3.0 multidict-6.1.0 nest-asyncio-1.6.0 networkx-3.3 numpy-1.26.4 omegaconf-2.3.0 onnxruntime-1.19.2 open_clip_torch-2.26.1 openai-1.35.9 opencv-python-4.10.0.84 packaging-24.1 pandas-2.2.2 pillow-10.4.0 protobuf-5.28.1 psutil-6.0.0 py3langid-0.2.2 pyclipper-1.3.0.post5 pycparser-2.22 pydantic-2.9.2 pydantic-core-2.23.4 pydensecrf-1.0 pyhyphen-4.0.4 pyperclip-1.9.0 pyreadline3-3.5.3 python-dateutil-2.9.0.post0 python-dotenv-1.0.1 pytz-2024.2 pyyaml-6.0.2 regex-2024.9.11 requests-2.32.3 safetensors-0.4.5 scikit-image-0.24.0 scipy-1.14.1 sentencepiece-0.2.0 setuptools-75.1.0 shapely-2.0.6 six-1.16.0 sniffio-1.3.1 sympy-1.13.2 tensorboardX-2.6.2.2 termcolor-2.4.0 tifffile-2024.8.30 timm-1.0.9 tokenizers-0.19.1 torch-2.4.1 torch-summary-1.4.5 torchvision-0.19.1 tqdm-4.66.5 transformers-4.44.2 typing-extensions-4.12.2 tzdata-2024.1 unidic-lite-1.0.8 urllib3-2.2.3 wcwidth-0.2.13 websockets-13.0.1 wheel-0.44.0 win32-setctime-1.1.0 yarl-1.11.1
复制代码
回复

使用道具 举报

     
发表于 2024-9-18 20:11 | 显示全部楼层
maritimus 发表于 2024-9-17 22:58
请问国内现在用docker有啥好办法吗?docker镜像都不小,网络问题严重,我找到的源基本都没法用。 ...

没什么办法,自备🪜
回复

使用道具 举报

     
发表于 2024-9-18 22:36 | 显示全部楼层
用的翻译源是百度?整点AI翻译吧,不然都对不起你整这么复杂了

—— 来自 S1Fun
回复

使用道具 举报

     
 楼主| 发表于 2024-9-18 22:39 来自手机 | 显示全部楼层
charlespfan 发表于 2024-9-18 22:36
用的翻译源是百度?整点AI翻译吧,不然都对不起你整这么复杂了

—— 来自 S1Fun ...

其实也不怎么用
回复

使用道具 举报

     
发表于 2024-9-18 22:41 | 显示全部楼层
zmw_831110 发表于 2024-9-18 22:21
开启web模式后
用脚本
https://sleazyfork.org/zh-CN/scripts/374903-comicread

我没装过,以下是我的猜测/看法:

首先,不要用管理员账户装这个东西,因为会装到system32里,一般不要这样,很不好。你就用普通账户装,需要的时候提权就行。用管理员账户也导致了你编辑不了keys.py,权限不对。你可以用管理员权限打开记事本/VScode/Visual studio,打开这个文件,就可以编辑了。

评分

参与人数 1战斗力 +2 收起 理由
zmw_831110 + 2 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2024-9-18 22:42 | 显示全部楼层
Litccc 发表于 2024-9-18 20:11
没什么办法,自备🪜

那我还是和docker无缘...
回复

使用道具 举报

     
 楼主| 发表于 2024-9-18 23:04 | 显示全部楼层
maritimus 发表于 2024-9-18 22:41
我没装过,以下是我的猜测/看法:

首先,不要用管理员账户装这个东西,因为会装到system32里,一般不要 ...

好吧...
我已经安全模式改好了

就先这样吧...
回复

使用道具 举报

     
发表于 2024-9-19 08:36 | 显示全部楼层
docker 配置好的在哪下载?
回复

使用道具 举报

     
 楼主| 发表于 2024-9-19 09:32 来自手机 | 显示全部楼层
回复

使用道具 举报

     
发表于 2024-9-19 13:33 | 显示全部楼层
zmw_831110 发表于 2024-9-19 09:32
https://sleazyfork.org/zh-CN/scripts/374903-comicread
这里就有讲

谢谢
回复

使用道具 举报

     
发表于 2024-9-19 13:46 来自手机 | 显示全部楼层
charlespfan 发表于 2024-9-18 22:36
用的翻译源是百度?整点AI翻译吧,不然都对不起你整这么复杂了

—— 来自 S1Fun ...

传统机器翻译日翻中最准的其实就是百度和有道
这两还都有相当可观的免费额度
回复

使用道具 举报

     
发表于 2024-9-19 13:50 来自手机 | 显示全部楼层
啥都不会我建议你用这个
https://github.com/dmMaze/BallonsTranslator
基本上是开箱即用的
回复

使用道具 举报

     
发表于 2024-9-19 13:53 | 显示全部楼层
本帖最后由 charlespfan 于 2024-9-19 14:00 编辑
azbhg1 发表于 2024-9-19 13:46
传统机器翻译日翻中最准的其实就是百度和有道
这两还都有相当可观的免费额度 ...

我拿出本地部署Sakura大模型你该如何应对?还不要钱

还有,日中传统机翻最强是彩云DeepL有道,根本轮不到百度

彩云去年之前还有每月API免费额度的时候,有道和百度不是被彩云吊着打?
回复

使用道具 举报

     
发表于 2024-9-19 13:55 | 显示全部楼层
azbhg1 发表于 2024-9-19 13:50
啥都不会我建议你用这个
https://github.com/dmMaze/BallonsTranslator
基本上是开箱即用的 ...

这玩意嵌字不是一坨?还得自己手动调整

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2024-9-19 14:08 来自手机 | 显示全部楼层
charlespfan 发表于 2024-9-19 13:53
我拿出本地部署Sakura大模型你该如何应对?还不要钱

还有,日中传统机翻最强是彩云DeepL有道,根本轮不 ...

本地部署的的配置就不是钱了是吧,本地同时跑manga-tanslate+sakura,按默认配置运行,大部分人用的60/70甜品卡显存早爆了
deepl日翻中八成是日翻英翻中的,明显一坨狗屎你真的用过?
彩云我还真没试过,不评价了
回复

使用道具 举报

     
发表于 2024-9-19 14:11 来自手机 | 显示全部楼层
charlespfan 发表于 2024-9-19 13:55
这玩意嵌字不是一坨?还得自己手动调整

—— 来自 S1Fun

和manga-tanslate不也是半斤对八两?
对楼主这种小白来说肯定是开箱即用完+有gui就完爆其他
回复

使用道具 举报

     
发表于 2024-9-19 14:15 | 显示全部楼层
本帖最后由 charlespfan 于 2024-9-19 14:17 编辑
azbhg1 发表于 2024-9-19 14:08
本地部署的的配置就不是钱了是吧,本地同时跑manga-tanslate+sakura,按默认配置运行,大部分人用的60/70 ...

谁跟你说我用的是mangatranslate了

我有好东西为啥要跟你们说

有道彩云的缺点就是会漏翻一些重要的东西,deepl虽然看上去机翻味很重,但是他重要的东西基本不缺,片假名理解能力也比那两个强

彩云就更是吊打有道和百度了,你拿他去翻《银河英雄传说》,翻出的人名全都跟译本一样,说明他已经录入了这一堆人名,词汇对应肯定是强很多的

—— 来自 S1Fun
回复

使用道具 举报

     
发表于 2024-9-19 14:24 来自手机 | 显示全部楼层
本帖最后由 azbhg1 于 2024-9-19 14:39 编辑
charlespfan 发表于 2024-9-19 14:15
谁跟你说我用的是mangatranslate了

我有好东西为啥要跟你们说

那您可真行,就喜欢跑小白帖子里面来秀一些没有帮助意义的东西真开心吧那真的没有继续说下去的必要了。
deepl翻的南辕北辙的东西那也真不少。
回复

使用道具 举报

     
 楼主| 发表于 2024-9-20 02:12 | 显示全部楼层
本帖最后由 zmw_831110 于 2024-9-20 21:30 编辑
charlespfan 发表于 2024-9-19 13:53
我拿出本地部署Sakura大模型你该如何应对?还不要钱

还有,日中传统机翻最强是彩云DeepL有道,根本轮不 ...

我是4070TiS 16GB显存
跑本地批量翻译一个单行本的最多用了5909MB显存,剩余10467MB
QQ20240920-021244.jpg

跑Web时,用浏览器看了4话,显存峰值占用是6358MB显存,剩余10028MB
QQ20240920-021034.jpg


还有余量本地部署Saraku大模型么?
我看介绍,说是12GB的显卡就可以跑,因为开机会占用一点显存(看了下会吃掉2GB),所以我这个还剩差不多10GB显存,是不是也够?


update:部署好了,刚刚够,2个模型开起来,16GB显存还剩余1XX~3XXMB显存
回复

使用道具 举报

     
 楼主| 发表于 2024-9-20 21:34 | 显示全部楼层
部署好sakura了,16GB刚刚够(12GB的可以选择小一点的模型),2个模型开起来,16GB显存还剩余1XX~3XXMB显存
效果在第3个置顶
其实部署按照教程一步一步做,几乎是没有什么技术难点的,比之前折腾MPV轻松太多了.
回复

使用道具 举报

     
 楼主| 发表于 2024-9-24 15:09 来自手机 | 显示全部楼层
本帖最后由 zmw_831110 于 2024-9-24 15:11 编辑

最近用了下,看几小时漫画,本地文件几十个G(40+),这玩意还考验SSD的TBW。。。
回复

使用道具 举报

     
发表于 2024-9-24 15:37 | 显示全部楼层
这帖子怎么还有懂哥进来阴阳一通也不说解决办法的
回复

使用道具 举报

     
发表于 2024-9-24 15:39 | 显示全部楼层
技术贴,学习一下
回复

使用道具 举报

头像被屏蔽
发表于 2024-9-24 15:49 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-9-24 16:15 | 显示全部楼层
本帖最后由 Epsilonhomu 于 2024-9-24 16:16 编辑

sakura我用的32B模型,拿来翻轻小说和黄油效果都很好,漫画倒是没有那么通畅
一旦开翻译就占满24G显存,硬控电脑打不了游戏
回复

使用道具 举报

     
发表于 2024-9-24 16:18 来自手机 | 显示全部楼层
本帖最后由 0WHan0 于 2024-9-24 16:23 编辑

是你自己做的功能嘛,还“我有好东西为啥要跟你们说”,笑死

—— 来自 鹅球 v3.2.91
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-11-9 03:58 , Processed in 0.126754 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表