-
Notifications
You must be signed in to change notification settings - Fork 1.2k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[Bug] [Flink] After K8s Session runs the job, the console is always in the state of executing the job. #3372
Comments
Hello @13535048320, this issue is about K8S, so I assign it to @gaoyan1998 and @zackyoungh. If you have any questions, you can comment and reply. 你好 @13535048320, 这个 issue 是关于 K8S 的,所以我把它分配给了 @gaoyan1998 和 @zackyoungh。如有任何问题,可以评论回复。 |
可以发一下日志吗 |
重启一下dinky,就可以了,这个会在1.0.2修复 |
@gaoyan1998 请问 1.0.2 预计什么时候发布,谢谢 |
重启之后问题依然存在吗 |
是的,重启后问题还是会重现 |
你用的1.0.0吧,我在1.0.1测试没有这问题 |
不固定哪些任务有这个问题,作业少的时候,偶尔会出现几个;现在启动了100多个流作业之后,就反过来了,大部分作业启动都会遇到这个问题,只有偶尔几个,一分钟就启动完成的 |
我用接口来运行的话,也一直没有拿到响应结果 |
重启之后第一次提交是成功的吗 |
重启过后,第一次提交是成功的 |
我看每次提交失败的报错前面都有下面这个错误,有检查过登录状态吗,或者浏览器长时间没有关闭刷新一下页面,dinky会有登录已过期,但是不刷新不会跳转login页面情况
|
这个报错应该是因为我用接口启动 https://dinky.demo.com/api/task/submitTask?id=xxx,没带上 token 导致的,不过作业还是启动了,这个应该算是另一个的问题了。应该不是这个问题导致的,因为我在页面上点运行也会出现。 |
第一次执行成功的控制台日志发一下,注意是web页面上的那个控制台,不是dinky后台日志 |
Start Process:FlinkSubmit/99 |
这是我的日志 1.0.1版本1的
可以确定是最后缺少这个日志导致的,提交进程没有正常结束,你还有其他的操作吗,例如部署环境,nginx之类的东西
|
Dinky 部署环境也是 k8s,镜像是用 github 上面下载 dinky-release-1.17-1.0.1.tar.gz 做成的,Dockerfile 也是用的 github 上面的 docker/Dockerfile,有经过 k8s nginx ingress,nginx 超时 proxy_read_timeout 设置为 300 秒 |
出现问题的确实少了这一部分日志 |
要不试试重装一下dinky呢,我这试了好久没复现 |
删除dinky目录下的 /tmp文件夹 |
link #3410 |
Co-authored-by: gaoyan1998 <[email protected]>
Co-authored-by: gaoyan1998 <[email protected]>
Search before asking
What happened
K8s Session 运行作业后控制台一直处于执行作业的状态,任务提交成功的,Flink UI 里能看到任务正常运行,运维中心看不到对应的实例,或者处于 Unknown 状态,特别是在启动的作业多了之后,会频繁出现这种情况,没有报错日志
版本:
Dinky 1.0.1
Mariadb 10.6.11
Paimon 0.8
Flink 1.17.2
Kafka 3.4
FLINK SQL:
What you expected to happen
作业正常启动,运维中心状态正常
How to reproduce
Anything else
No response
Version
1.0.0
Are you willing to submit PR?
Code of Conduct
The text was updated successfully, but these errors were encountered: