Docker可以在启动容器的时候通过设置Dockerfile中的CMD条目启动一个进程,但如果要在容器中同时启动多个进程,就需要使用进程管理工具了。supervisord(http://supervisord.org/introduction.html)是一个非常优秀的进程管理工具,使用Python开发。它可以在类UNIX系统的方式让用户来准确地监视和控制后台一定数量的服务进程。并作为一个天使进程让后台进程在当发生内部错误退出、或者进程被意外杀死时自动重启。除此之外,supervisord可以监控TCP端口,让其他主机通过客户端了命令supervisorctl通过HTTP协议直接对Server端进程进行启停,避免让进程/服务器管理者直接接触Shell或root用户。进程之间也有一个优先级和进程组关系,让管理员使用start all和stop all的关系来启动。
安装和配置
在ubuntu下通过apt-get安装supervisor:
1 2 3 |
# apt-get install -y supervisor 通过echo_supervisord_conf可以将配置文件示例打印到控制台: # echo_supervisord_conf > /etc/supervisor/supervisord.conf |
配置文件内容如下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 |
[unix_http_server] file=/var/run/supervisor.sock ; (the path to the socket file) chmod=0700 ; socket file mode (default 0700) chown=nobody:nogroup ; socket file uid:gid owner username=debugo ; (default is no username (open server)) password=debugo ; (default is no password (open server)) [inet_http_server] ; inet (TCP) server disabled by default port=172.17.250.252:9001 ; (ip_address:port specifier, *:port for all iface) username=debugo ; (default is no username (open server)) password=debugo ; (default is no password (open server)) [supervisord] logfile=/var/log/supervisor/supervisord.log ; (main log file;default $CWD/supervisord.log) logfile_maxbytes = 50MB ;当达到多少时进行日志轮滚,0为不受限 logfile_backups=10 ;日志轮滚后保留多少个 loglevel = info ;日志级别 childlogdir=/var/log/supervisor ; ('AUTO' child log dir, default $TEMP) pidfile=/var/run/supervisord.pid ; (supervisord pidfile;default supervisord.pid) nodaemon = false environment = KEY1="value1",KEY2="value2" ;环境变量 minfds = 1024 ;为了保证supervisord进程启动,最小可用的文件描述符数量。 minprocs = 200 ;为了保证supervisord进程启动,最小可用的进程数量。 umask = 022 ;掩码 ;user = debugo ;如果以root用户启动supervisord,那么会切换到user指定的用户执行进程 identifier = supervisor ;supervisor进程的标识字符串,用于RPC接口 directory = /tmp ;当执行进程时,supervisord会先chdir到该目录下 nocleanup = true ;避免supervisord在启动时清除所有"AUTO"的子日志文件(tmpfile),通常用于调试。 strip_ansi = false ;去掉子日志文件中的所有ANSI转义序列。 ; the below section must remain in the config file for RPC ; (supervisorctl/web interface) to work, additional interfaces may be ; added by defining them in separate rpcinterface: sections [rpcinterface:supervisor] supervisor.rpcinterface_factory = supervisor.rpcinterface:make_main_rpcinterface ;Client [supervisorctl] serverurl=unix:///var/run/supervisor.sock ; use a unix:// URL for a unix socket ;serverurl=http://127.0.0.1:9001 ; use an http:// url to specify an inet socket username=debugo ; should be same as http_username if set password=debugo ; should be same as http_password if set prompt=supervisor> ; supervisorctl命令行提示符(default "supervisor") ;history_file=~/.sc_history ; use readline history if available |
启动supervisor
1 2 3 4 5 6 7 8 |
mkdir -p /var/log/supervisor # service supervisor start ##服务状态 # service supervisor status supervisor is running ##监听端口已经打开 # netstat -ntlup | grep 9001 tcp 0 0 172.17.250.252:9001 0.0.0.0:* LISTEN 28545/python |
配置进程
参数文件中,进程的相关配置如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
[program:cat] ;程序名 command=/bin/cat ;命令绝对路径,可以包含参数 process_name=%(program_name)s ;进程名 numprocs=1 ;supervisor启动多少个该程序,如果大于1,那么进程名必须包括%(process_num)s directory=/tmp ;该进程的启动时的工作目录 umask=022 ;掩码 priority=999 ;优先级 autostart=true ;该程序是否在supervisor启动时启动 autorestart=true ;如果为false,那么该程序的相关进程永远不会自动重启。如果为unexpected,该程序的相关进程仅会在退出码为exitcodes中的值时重启;如果为true时 startsecs=10 ;最大启动时间 startretries=3 ;最大启动重试次数。超过这个次数后,该进程会标记为FATAL状态 exitcodes=0,2 ;退出码,关联autorestart=unexpected stopsignal=TERM ;关闭该程序相关进程所发送的信号量。可以为TERM, HUP, INT, QUIT, KILL, USR1, or USR2 stopwaitsecs=10 ;supervisord父进程等待该程序的相关子进程返回SIGCLILD信号量的时间,超时后则发送SIGKILL user=chrism ;启动该程序进程的用户 redirect_stderr=false ;如果为true,则将该程序的进程错误输出到supervisor主日志文件中 stdout_logfile=/tmp ;标准输出 stdout_logfile_maxbytes=1MB ;日志轮滚 stdout_logfile_backups=10 ;日志轮滚 stdout_capture_maxbytes=1MB stderr_logfile=/a/path stderr_logfile_maxbytes=1MB stderr_logfile_backups=10 stderr_capture_maxbytes=1MB environment=A="1",B="2" ;!环境变量信息 serverurl=AUTO ;传送给该子进程的环境变量SUPERVISOR_SERVER_URL ,AUTO则自动提供一个Supervisord的URL。用于该进程可以和内部HTTP Server进行通信,简化进程管理。 |
下面由Supervisord启动redis服务
1 2 3 4 5 |
# vim /etc/redis/redis.conf daemonize no #由于使用supervisord来管理,所以不用启用daemonized Redis服务 pidfile /var/run/redis/redis-server.pid ... bind 127.0.0.1 172.17.250.252 |
配置supervisord.conf,设置redis-server为autostart
和autorestart
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
[program:redis-server] command=/usr/bin/redis-server /etc/redis/redis.conf process_name=%(program_name)s numprocs=1 directory=/tmp umask=022 priority=999 autostart=true autorestart=true 重启supervisord # supervisorctl reload Restarted supervisord. # pstree init-+-acpid ...... |-redis-server---2*[{redis-server}] ...... |
使用supervisorctl
supervisorctl命令行选项:
-c, --configuration
配置文件路径 (default /etc/supervisord.conf)
-h, --help
帮助信息
-i, --interactive
启动一个交互式shell
-s, --serverurl URL
指定supervisor服务监听地址 (默认 “http://localhost:9001”).
-u, --username
用户名
-p, --password
密码
-r, --history-file
如果readline可用,指定一个readline历史文件
如果使用-i选项或者不指定后面的动作(如start,stop,tail等),那么会出现一个交互式页面。
在另一个主机来操作进程:
1 2 3 4 |
# supervisorctl -s http://172.19.17.144:9001 -u debugo -p debugo stop redis-server redis-server: ERROR (not running) # supervisorctl -s http://172.19.17.144:9001 -u debugo -p debugo start redis-server redis-server: started |
Docker中的Supervisor
编辑Dockerfile
1 2 3 4 5 6 7 8 9 10 |
vim Dockerfile FROM ubuntu:14.04 MAINTAINER debugo@sina.com RUN apt-get update RUN apt-get install -y openssh-server supervisor RUN mkdir -p /var/run/sshd RUN mkdir -p /var/log/supervisor COPY supervisord.conf /etc/supervisor/supervisord.conf EXPOSE 22 80 CMD ["/usr/bin/supervisord"] |
其中,在当前目录新建一个supervisord.conf,由于是CMD执行,supervisord不用以daemon的形式启动。
1 2 3 4 5 6 |
[supervisord] nodaemon=true [program:sshd] command=/usr/sbin/sshd -D autorestart=unexpected autostart=true |
下面构建这个image
1 2 |
docker build -t supervisor-test . Successfully built a97936f2da4a |
运行测试:
1 2 3 4 5 6 7 8 |
docker run -it supervisor-test 2015-01-04 06:41:12,010 CRIT Supervisor running as root (no user in config file) 2015-01-04 06:41:12,016 INFO supervisord started with pid 1 2015-01-04 06:41:13,019 INFO spawned: 'sshd' with pid 8 2015-01-04 06:41:14,021 INFO success: sshd entered RUNNING state, process has stayed up for > than 1 seconds (startsecs) ^C2015-01-04 06:41:55,268 WARN received SIGINT indicating exit request 2015-01-04 06:41:55,269 INFO waiting for sshd to die 2015-01-04 06:41:55,270 INFO stopped: sshd (exit status 0) |
参考:
http://supervisord.org/configuration.html
http://yeasy.gitbooks.io/docker_practice/content/cases/supervisor.html
奶茶每天晚上回去对着这么个丑B会不会偷偷抹眼泪