Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

第二张图芯片的那个是怎么跑出来的?我跑不下来这个效果 #111

Open
wang-kangkang opened this issue Apr 25, 2024 · 4 comments

Comments

@wang-kangkang
Copy link

我用的参数是 python -u inference.py --version v2 --task sr --upscale 2 --cfg_scale 4.0 --input inputs/wkkimg --output results/wkkimg --device cuda

顺便再问一下,芯片图里的字能完美清晰化,是不是说这个方法能放大文字了?

@CuddleSabe
Copy link

我用的参数是 python -u inference.py --version v2 --task sr --upscale 2 --cfg_scale 4.0 --input inputs/wkkimg --output results/wkkimg --device cuda

顺便再问一下,芯片图里的字能完美清晰化,是不是说这个方法能放大文字了?

sd没法生成文字的原因在于vae的八倍下采样,所以小文字没法生成,但是大文字一直是可以的。图里的文字是因为文字本身够大

@0x3f3f3f3fun
Copy link
Collaborator

第二张芯片图对应的upscale是4。

@0x3f3f3f3fun
Copy link
Collaborator

我用的参数是 python -u inference.py --version v2 --task sr --upscale 2 --cfg_scale 4.0 --input inputs/wkkimg --output results/wkkimg --device cuda
顺便再问一下,芯片图里的字能完美清晰化,是不是说这个方法能放大文字了?

sd没法生成文字的原因在于vae的八倍下采样,所以小文字没法生成,但是大文字一直是可以的。图里的文字是因为文字本身够大

是的,小文字目前没办法修复。一个可能的办法是把文字区域检测出来放大之后再修复,不过现在还没有做过测试~

@JFrankLee
Copy link

我用的参数是 python -u inference.py --version v2 --task sr --upscale 2 --cfg_scale 4.0 --input inputs/wkkimg --output results/wkkimg --device cuda
顺便再问一下,芯片图里的字能完美清晰化,是不是说这个方法能放大文字了?

sd没法生成文字的原因在于vae的八倍下采样,所以小文字没法生成,但是大文字一直是可以的。图里的文字是因为文字本身够大

请问这是什么意思啊,VAE encoder是下采样导致小文字原本的信息损失了嘛。那为什么小的纹理特征可以恢复,单纯文字不行呢?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants