如何解决jmxterm:Docker 容器内“无法创建系统终端”
我有一个 Docker 映像,其中包含 JRE、一些 Java Web 应用程序和 jmxterm
。后者用于运行一些临时管理任务。该映像在装有 Docker 1.13 的 CentOS 7 服务器上使用(它很旧,但它是通过发行版存储库提供的最新版本)来运行 Web 应用程序本身。
一切正常,但在将 jmxterm
从 1.0.0 更新到最新版本 (1.0.2) 后,我在进入正在运行的容器并启动 jmxterm
时收到以下警告:
WARNING: Unable to create a system terminal,creating a dumb terminal (enable debug logging for more information)
此后,jmxterm
不再响应箭头键(尝试浏览命令历史记录时),也不提供自动完成功能。
一些快速调查表明,该问题可能会在 CentOS 7 的干净环境中重现。比如说,这就是我如何用我需要的所有东西引导系统和容器:
$ vagrant init centos/7
$ vagrant up
$ vagrant ssh
[vagrant@localhost ~]$ sudo yum install docker
[vagrant@localhost ~]$ sudo systemctl start docker
[vagrant@localhost ~]$ sudo docker run -it --entrypoint bash openjdk:11
root@0c4c614de0ee:/# wget https://github.com/jiaqi/jmxterm/releases/download/v1.0.2/jmxterm-1.0.2-uber.jar
这就是我进入容器并运行 jmxterm
的方式:
[vagrant@localhost ~]$ sudo docker exec -it 0c4c614de0ee sh
root@0c4c614de0ee:/# java -jar jmxterm-1.0.2-uber.jar
WARNING: Unable to create a system terminal,creating a dumb terminal (enable debug logging for more information)
root@0c4c614de0ee:/# bea<TAB>
<Nothing happens,but autocompletion had to appear>
很少观察:
- 无论我使用哪个图像,旧版
jmxterm
都不会出现此问题; - 无论我使用哪个图像,新的
jmxterm
都会出现问题; - 该问题在我的笔记本电脑(具有较新的内核和 Docker)上无法重现;
- 如果我在 CentOS 7 服务器上使用最新的 Docker(来自外部存储库)而不是 CentOS 7 的本机版本 1.13,则问题不会重现。
会发生什么,为什么错误只能在特定环境中重现?有什么解决方法吗?
解决方法
TLDR:将新的 jmxterm
版本作为 java -jar jmxterm-1.0.2-uber.jar < /dev/tty
运行是一种快速、肮脏和笨拙的解决方法,可让自动完成和其他内容在交互式容器会话中工作。 >
快速检查显示 jmxterm
试图通过运行 tty
实用程序来确定进程使用的终端设备——可能是为了稍后获取终端功能:
root@0c4c614de0ee:/# strace -f -e 'trace=execve,wait4' java -jar jmxterm-1.0.2-uber.jar
execve("/opt/java/openjdk/bin/java",["java","-jar","jmxterm-1.0.2-uber.jar"],0x7ffed3a53210 /* 36 vars */) = 0
...
[pid 432] execve("/usr/bin/tty",["tty"],0x7fff8ea39608 /* 36 vars */) = 0
[pid 433] wait4(432,[{WIFEXITED(s) && WEXITSTATUS(s) == 1}],NULL) = 432
WARNING: Unable to create a system terminal,creating a dumb terminal (enable debug logging for more information)
实用程序失败,状态为 1,这可能是错误消息的原因。为什么?
root@0c4c614de0ee:/# strace -y tty
...
readlink("/proc/self/fd/0","/dev/pts/3",4095) = 10
stat("/dev/pts/3",0x7ffe966f2160) = -1 ENOENT (No such file or directory)
...
write(1</dev/pts/3>,"not a tty\n",10not a tty
) = 10
实用程序说“不是 tty”,而我们肯定有一个。快速检查表明......虽然标准外壳的流连接到一个,但容器中确实没有 PTY 设备!
root@0c4c614de0ee:/# ls -l /proc/self/fd
total 0
lrwx------. 1 root root 64 Jun 3 21:26 0 -> /dev/pts/3
lrwx------. 1 root root 64 Jun 3 21:26 1 -> /dev/pts/3
lrwx------. 1 root root 64 Jun 3 21:26 2 -> /dev/pts/3
lr-x------. 1 root root 64 Jun 3 21:26 3 -> /proc/61/fd
root@0c4c614de0ee:/# ls -l /dev/pts
total 0
crw-rw-rw-. 1 root root 5,2 Jun 3 21:26 ptmx
如果我们使用最新的 Docker 进行检查会怎样?
root@c0ebd608f79a:/# ls -l /proc/self/fd
total 0
lrwx------ 1 root root 64 Jun 3 21:45 0 -> /dev/pts/1
lrwx------ 1 root root 64 Jun 3 21:45 1 -> /dev/pts/1
lrwx------ 1 root root 64 Jun 3 21:45 2 -> /dev/pts/1
lr-x------ 1 root root 64 Jun 3 21:45 3 -> /proc/16/fd
root@c0ebd608f79a:/# ls -l /dev/pts
total 0
crw--w---- 1 root tty 136,0 Jun 3 21:44 0
crw--w---- 1 root tty 136,1 Jun 3 21:45 1
crw-rw-rw- 1 root root 5,2 Jun 3 21:45 ptmx
宾果游戏!现在我们已经将 PTY 放在了应有的位置,因此 jmxterm
可以很好地与最新的 Docker 配合使用。
对于较旧的 Docker,进程连接到一些 PTY 而在 /dev/pts
中没有用于它们的设备似乎很奇怪,但是跟踪 Docker 进程解释了为什么会发生这种情况。较旧的 Docker 在设置其他内容之前为容器分配 PTY(包括输入新的挂载命名空间并将 devpts
挂载到其中,或者在 docker exec -it
的情况下仅输入挂载命名空间):
[vagrant@localhost ~]$ sudo strace -p $(pidof docker-containerd-current) -f -e trace='execve,mount,unshare,openat,ioctl'
...
[pid 3885] openat(AT_FDCWD,"/dev/ptmx",O_RDWR|O_NOCTTY|O_CLOEXEC) = 9
[pid 3885] ioctl(9,TIOCGPTN,[1]) = 0
[pid 3885] ioctl(9,TIOCSPTLCK,[0]) = 0
...
[pid 3898] unshare(CLONE_NEWNS|CLONE_NEWUTS|CLONE_NEWIPC|CLONE_NEWNET|CLONE_NEWPID) = 0
...
[pid 3899] mount("devpts","/var/lib/docker/overlay2/3af250a9f118d637bfba5701f5b0dfc09ed154c6f9d0240ae12523bf252e350c/merged/dev/pts","devpts",MS_NOSUID|MS_NOEXEC,"newinstance,ptmxmode=0666,mode=0"...) = 0
...
[pid 3899] execve("/bin/bash",["bash"],0xc4201626c0 /* 7 vars */ <unfinished ...>
请注意 newinstance
挂载选项,该选项确保 devpts
挂载仅拥有其 PTY,不与其他挂载共享。这导致了一个有趣的效果:容器的 PTY 设备留在主机上并属于主机的 devpts
挂载,而容器化进程仍然可以访问它,因为它刚刚在它生命的开始!
最新的 Docker 首先为容器挂载 devpts
,然后然后分配 PTY,因此 PTY 属于容器的 devpts
挂载并且在容器的文件系统中可见:
$ sudo strace -p $(pidof containerd) -f -e trace='execve,ioctl'
...
[pid 14043] unshare(CLONE_NEWNS|CLONE_NEWUTS|CLONE_NEWIPC|CLONE_NEWPID|CLONE_NEWNET) = 0
...
[pid 14044] mount("devpts","/var/lib/docker/overlay2/b743cf16ab954b9a4b4005bca0aeaa019c4836c7d58d6073044e5b48446c3d62/merged/dev/pts",mode=0"...) = 0
...
[pid 14044] openat(AT_FDCWD,O_RDWR|O_NOCTTY|O_CLOEXEC) = 7
[pid 14044] ioctl(7,[0]) = 0
[pid 14044] ioctl(7,[0]) = 0
...
[pid 14044] execve("/bin/bash",["/bin/bash"],0xc000203530 /* 4 vars */ <unfinished ...>
嗯,问题是由不适当的 Docker 行为引起的,但是旧的 jmxterm
为什么在相同的环境中运行良好?让我们检查一下(注意,这里使用的是 Java 8 映像,因为旧的 jmxterm
不能很好地与 Java 11 配合使用):
root@504a7757e310:/# wget https://github.com/jiaqi/jmxterm/releases/download/v1.0.0/jmxterm-1.0.0-uber.jar
root@504a7757e310:/# strace -f -e 'trace=execve,wait4' java -jar jmxterm-1.0.0-uber.jar
execve("/usr/local/openjdk-8/bin/java","jmxterm-1.0.0-uber.jar"],0x7fffdcaebdd0 /* 10 vars */) = 0
...
[pid 310] execve("/bin/sh",["sh","-c","stty -a < /dev/tty"],0x7fff1f2a1cc8 /* 10 vars */) = 0
因此,较旧的 jmxterm
仅使用 /dev/tty
而不是询问 tty
设备名称,这是有效的,因为此设备存在于容器中:
root@504a7757e310:/# ls -l /dev/tty
crw-rw-rw-. 1 root root 5,0 Jun 3 21:36 /dev/tty
这些版本的 jmxterm
之间的巨大差异在于,较新的工具版本使用更高的 jline
主要版本,它是负责与终端交互的库(类似于 readline
在 C 世界中)。主要 jline
版本之间的差异导致 jmxterm
的行为与当前版本 just rely on tty
的不同。
这一观察使我们找到了一种快速而肮脏的解决方法,它既不需要更新 Docker 也不需要修补 jline
/jmxterm
串联:我们可以将 jmxterm
的标准输入附加到 { {1}} 强行并因此使 /dev/tty
使用此设备(现在由 jline
引用)而不是 /proc/self/fd/0
条目(这在形式上并不总是正确的,但仍然是足够临时使用):
/dev/pts
现在我们有了自动补全、历史记录和其他我们需要的很酷的东西。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。