]> git.decadent.org.uk Git - nfs-utils.git/blobdiff - utils/statd/statd.c
statd - delay drop-privs until sockets have been setup.
[nfs-utils.git] / utils / statd / statd.c
index b1e73046c1285f5c64f6ed242a9f95c13c45b9c4..157de853bf5aa4fbab1d6cc655f40beb6b806bca 100644 (file)
@@ -7,18 +7,27 @@
  * NSM for Linux.
  */
 
-#include "config.h"
+#ifdef HAVE_CONFIG_H
+#include <config.h>
+#endif
+
+#include <sys/stat.h>
 #include <limits.h>
 #include <signal.h>
 #include <unistd.h>
 #include <fcntl.h>
+#include <errno.h>
 #include <string.h>
 #include <getopt.h>
 #include <rpc/rpc.h>
 #include <rpc/pmap_clnt.h>
 #include <rpcmisc.h>
+#include <sys/resource.h>
+#include <sys/wait.h>
+#include <grp.h>
 #include "statd.h"
 #include "version.h"
+#include "nfslib.h"
 
 /* Socket operations */
 #include <sys/types.h>
@@ -36,14 +45,18 @@ char *  SM_STAT_PATH = DEFAULT_SM_STAT_PATH;
 
 /* ----- end of state directory path stuff ------- */
 
-short int restart = 0;
 int    run_mode = 0;           /* foreground logging mode */
 
 /* LH - I had these local to main, but it seemed silly to have 
  * two copies of each - one in main(), one static in log.c... 
  * It also eliminates the 256-char static in log.c */
 char *name_p = NULL;
-char *version_p = NULL;
+const char *version_p = NULL;
+
+/* PRC: a high-availability callout program can be specified with -H
+ * When this is done, the program will receive callouts whenever clients
+ * are added or deleted to the notify list */
+char *ha_callout_prog = NULL;
 
 static struct option longopts[] =
 {
@@ -56,11 +69,13 @@ static struct option longopts[] =
        { "name", 1, 0, 'n' },
        { "state-directory-path", 1, 0, 'P' },
        { "notify-mode", 0, 0, 'N' },
+       { "ha-callout", 1, 0, 'H' },
+       { "no-notify", 0, 0, 'L' },
        { NULL, 0, 0, 0 }
 };
 
 extern void sm_prog_1 (struct svc_req *, register SVCXPRT *);
-extern int statd_get_socket(int port);
+extern int statd_get_socket(void);
 
 #ifdef SIMULATIONS
 extern void simulator (int, char **);
@@ -92,11 +107,21 @@ sm_prog_1_wrapper (struct svc_req *rqstp, register SVCXPRT *transp)
 static void 
 killer (int sig)
 {
-       log (L_FATAL, "Caught signal %d, un-registering and exiting.", sig);
+       note (N_FATAL, "Caught signal %d, un-registering and exiting.", sig);
        pmap_unset (SM_PROG, SM_VERS);
+
        exit (0);
 }
 
+static void
+sigusr (int sig)
+{
+       extern void my_svc_exit (void);
+       dprintf (N_DEBUG, "Caught signal %d, re-notifying (state %d).", sig,
+                                                               MY_STATE);
+       my_svc_exit();
+}
+
 /*
  * Startup information.
  */
@@ -114,16 +139,7 @@ static void log_modes(void)
        if (run_mode & MODE_LOG_STDERR)
                strcat(buf,"Log-STDERR ");
 
-       if (run_mode & MODE_NOTIFY_ONLY)
-       {
-               strcat(buf,"Notify-Only ");
-       }
-       log(L_WARNING,buf);
-       /* future: IP aliasing
-       if (run_mode & MODE_NOTIFY_ONLY)
-       {
-               dprintf(L_DEBUG,"Notify IP: %s",svr_addr);
-       } */
+       note(N_WARNING,buf);
 }
 
 /*
@@ -143,8 +159,88 @@ usage()
        fprintf(stderr,"      -n, --name           Specify a local hostname.\n");
        fprintf(stderr,"      -P                   State directory path.\n");
        fprintf(stderr,"      -N                   Run in notify only mode.\n");
+       fprintf(stderr,"      -L, --no-notify      Do not perform any notification.\n");
+       fprintf(stderr,"      -H                   Specify a high-availability callout program.\n");
+}
+
+static const char *pidfile = "/var/run/rpc.statd.pid";
+
+int pidfd = -1;
+static void create_pidfile(void)
+{
+       FILE *fp;
+
+       unlink(pidfile);
+       fp = fopen(pidfile, "w");
+       if (!fp)
+               die("Opening %s failed: %s\n",
+                   pidfile, strerror(errno));
+       fprintf(fp, "%d\n", getpid());
+       pidfd = dup(fileno(fp));
+       if (fclose(fp) < 0)
+               note(N_WARNING, "Flushing pid file failed.\n");
 }
 
+static void truncate_pidfile(void)
+{
+       if (pidfd >= 0)
+               ftruncate(pidfd, 0);
+}
+
+static void drop_privs(void)
+{
+       struct stat st;
+
+       if (stat(SM_DIR, &st) == -1 &&
+           stat(DIR_BASE, &st) == -1) {
+               st.st_uid = 0;
+               st.st_gid = 0;
+       }
+
+       if (st.st_uid == 0) {
+               note(N_WARNING, "statd running as root. chown %s to choose different user\n",
+                   SM_DIR);
+               return;
+       }
+       /* better chown the pid file before dropping, as if it
+        * if over nfs we might loose access
+        */
+       if (pidfd >= 0)
+               fchown(pidfd, st.st_uid, st.st_gid);
+
+       setgroups(0, NULL);
+       if (setgid(st.st_gid) == -1
+           || setuid(st.st_uid) == -1) {
+               note(N_ERROR, "Fail to drop privileges");
+               exit(1);
+       }
+}
+
+static void run_sm_notify(int outport)
+{
+       char op[20];
+       char *av[6];
+       int ac = 0;
+
+       av[ac++] = "/usr/sbin/sm-notify";
+       if (run_mode & MODE_NODAEMON)
+               av[ac++] = "-d";
+       if (outport) {
+               sprintf(op, "-p%d", outport);
+               av[ac++] = op;
+       }
+       if (run_mode & STATIC_HOSTNAME) {
+               av[ac++] = "-N";
+               av[ac++] = MY_NAME;
+       }
+       av[ac] = NULL;
+       fprintf(stderr, "%s: -N deprecated, consider using /usr/sbin/sm-notify directly\n",
+               name_p);
+       execv(av[0], av);
+       fprintf(stderr, "%s: failed to run %s\n", name_p, av[0]);
+       exit(2);
+
+}
 /* 
  * Entry routine/main loop.
  */
@@ -154,6 +250,11 @@ int main (int argc, char **argv)
        int pid;
        int arg;
        int port = 0, out_port = 0;
+       struct rlimit rlim;
+       int once = 1;
+
+       int pipefds[2] = { -1, -1};
+       char status;
 
        /* Default: daemon mode, no other options */
        run_mode = 0;
@@ -176,7 +277,7 @@ int main (int argc, char **argv)
        MY_NAME = NULL;
 
        /* Process command line switches */
-       while ((arg = getopt_long(argc, argv, "h?vVFNdn:p:o:P:", longopts, NULL)) != EOF) {
+       while ((arg = getopt_long(argc, argv, "h?vVFNH:dn:p:o:P:L", longopts, NULL)) != EOF) {
                switch (arg) {
                case 'V':       /* Version */
                case 'v':
@@ -188,6 +289,9 @@ int main (int argc, char **argv)
                case 'N':
                        run_mode |= MODE_NOTIFY_ONLY;
                        break;
+               case 'L': /* Listen only */
+                       run_mode |= MODE_NO_NOTIFY;
+                       break;
                case 'd':       /* No daemon only - log to stderr */
                        run_mode |= MODE_LOG_STDERR;
                        break;
@@ -210,6 +314,7 @@ int main (int argc, char **argv)
                        }
                        break;
                case 'n':       /* Specify local hostname */
+                       run_mode |= STATIC_HOSTNAME;
                        MY_NAME = xstrdup(optarg);
                        break;
                case 'P':
@@ -242,6 +347,13 @@ int main (int argc, char **argv)
                                sprintf(SM_STAT_PATH, "%s/state", DIR_BASE );
                        }
                        break;
+               case 'H': /* PRC: specify the ha-callout program */
+                       if ((ha_callout_prog = xstrdup(optarg)) == NULL) {
+                               fprintf(stderr, "%s: xstrdup(%s) failed!\n",
+                                       argv[0], optarg);
+                               exit(1);
+                       }
+                       break;
                case '?':       /* heeeeeelllllllpppp? heh */
                case 'h':
                        usage();
@@ -257,14 +369,29 @@ int main (int argc, char **argv)
                exit(-1);
        }
 
+       if (run_mode & MODE_NOTIFY_ONLY)
+               run_sm_notify(out_port);
+
+
        if (!(run_mode & MODE_NODAEMON)) {
                run_mode &= ~MODE_LOG_STDERR;   /* Never log to console in
                                                   daemon mode. */
        }
 
-       log_init (name_p,version_p);
-
-       log_modes();
+       if (getrlimit (RLIMIT_NOFILE, &rlim) != 0)
+               fprintf(stderr, "%s: getrlimit (RLIMIT_NOFILE) failed: %s\n",
+                               argv [0], strerror(errno));
+       else {
+               /* glibc sunrpc code dies if getdtablesize > FD_SETSIZE */
+               if (rlim.rlim_cur > FD_SETSIZE) {
+                       rlim.rlim_cur = FD_SETSIZE;
+
+                       if (setrlimit (RLIMIT_NOFILE, &rlim) != 0) {
+                               fprintf(stderr, "%s: setrlimit (RLIMIT_NOFILE) failed: %s\n",
+                                       argv [0], strerror(errno));
+                       }
+               }
+       }
 
 #ifdef SIMULATIONS
        if (argc > 1)
@@ -273,59 +400,123 @@ int main (int argc, char **argv)
 #endif
        
        if (!(run_mode & MODE_NODAEMON)) {
-               int filedes, fdmax, tempfd;
+               int tempfd;
 
+               if (pipe(pipefds)<0) {
+                       perror("statd: unable to create pipe");
+                       exit(1);
+               }
                if ((pid = fork ()) < 0) {
-                       perror ("Could not fork");
+                       perror ("statd: Could not fork");
                        exit (1);
                } else if (pid != 0) {
-                       /* Parent. */
+                       /* Parent.
+                        * Wait for status from child.
+                        */
+                       close(pipefds[1]);
+                       if (read(pipefds[0], &status, 1) != 1)
+                               exit(1);
                        exit (0);
                }
                /* Child.       */
+               close(pipefds[0]);
                setsid ();
-               chdir (DIR_BASE);
+               if (chdir (DIR_BASE) == -1) {
+                       perror("statd: Could not chdir");
+                       exit(1);
+               }
 
-               tempfd = open("/dev/null", O_RDWR);
-               close(0); dup2(tempfd, 0);
-               close(1); dup2(tempfd, 1);
-               close(2); dup2(tempfd, 2);
-               fdmax = sysconf (_SC_OPEN_MAX);
-               for (filedes = 3; filedes < fdmax; filedes++) {
-                       close (filedes);
+               while (pipefds[1] <= 2) {
+                       pipefds[1] = dup(pipefds[1]);
+                       if (pipefds[1]<0) {
+                               perror("statd: dup");
+                               exit(1);
+                       }
                }
+               tempfd = open("/dev/null", O_RDWR);
+               dup2(tempfd, 0);
+               dup2(tempfd, 1);
+               dup2(tempfd, 2);
+               dup2(pipefds[1], 3);
+               pipefds[1] = 3;
+               closeall(4);
        }
 
        /* Child. */
+
+       log_init (name_p,version_p);
+
+       log_modes();
+
        signal (SIGHUP, killer);
        signal (SIGINT, killer);
        signal (SIGTERM, killer);
+       /* PRC: trap SIGUSR1 to re-read notify list from disk */
+       signal(SIGUSR1, sigusr);
        /* WARNING: the following works on Linux and SysV, but not BSD! */
        signal(SIGCHLD, SIG_IGN);
+       /*
+        * Ignore SIGPIPE to avoid statd dying when peers close their
+        * TCP connection while we're trying to reply to them.
+        */
+       signal(SIGPIPE, SIG_IGN);
+
+       create_pidfile();
+       atexit(truncate_pidfile);
+
+       if (! (run_mode & MODE_NO_NOTIFY))
+               switch (pid = fork()) {
+               case 0:
+                       run_sm_notify(out_port);
+                       break;
+               case -1:
+                       break;
+               default:
+                       waitpid(pid, NULL, 0);
+               }
 
-       /* initialize out_port */
-       statd_get_socket(out_port);
 
        for (;;) {
                pmap_unset (SM_PROG, SM_VERS);
-               change_state ();
-               shuffle_dirs ();        /* Move directory names around */
-               notify_hosts ();        /* Send out notify requests */
-               ++restart;
+
+               /* If we got this far, we have successfully started, so notify parent */
+               if (pipefds[1] > 0) {
+                       status = 0;
+                       write(pipefds[1], &status, 1);
+                       close(pipefds[1]);
+                       pipefds[1] = -1;
+               }
 
                /* this registers both UDP and TCP services */
-               if (!(run_mode & MODE_NOTIFY_ONLY)) {
-                       rpc_init("statd", SM_PROG, SM_VERS, sm_prog_1, port);
-               } 
+               rpc_init("statd", SM_PROG, SM_VERS, sm_prog_1, port);
 
+               if (once) {
+                       once = 0;
+                       drop_privs();
+               }
                /*
                 * Handle incoming requests:  SM_NOTIFY socket requests, as
                 * well as callbacks from lockd.
                 */
                my_svc_run();   /* I rolled my own, Olaf made it better... */
 
-               if ((run_mode & MODE_NOTIFY_ONLY))
-                       break;                  
+               /* Only get here when simulating a crash so we should probably
+                * start sm-notify running again.  As we have already dropped
+                * privileges, this might not work, but I don't think
+                * responding to SM_SIMU_CRASH is an important use cases to
+                * get perfect.
+                */
+               if (! (run_mode & MODE_NO_NOTIFY))
+                       switch (pid = fork()) {
+                       case 0:
+                               run_sm_notify(out_port);
+                               break;
+                       case -1:
+                               break;
+                       default:
+                               waitpid(pid, NULL, 0);
+                       }
+
        }
        return 0;
 }