<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 TRANSITIONAL//EN">
<HTML>
<HEAD>
  <META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=UTF-8">
  <META NAME="GENERATOR" CONTENT="GtkHTML/3.3.2">
</HEAD>
<BODY>
On Fri, 2005-11-25 at 10:58 -0500, Mark Belanger wrote:
<BLOCKQUOTE TYPE=CITE>
<PRE>
<FONT COLOR="#000000">Sam Drinkard wrote:</FONT>
<FONT COLOR="#000000">> List,</FONT>
<FONT COLOR="#000000">> </FONT>
<FONT COLOR="#000000">>    I've got a process(s) that have been exiting on a signal 11, but not </FONT>
<FONT COLOR="#000000">> all the time.  I suspect it's memory related, and I was wondering, is </FONT>
<FONT COLOR="#000000">> there any way to tell exactly how much memory a particular process has </FONT>
<FONT COLOR="#000000">> in use at the point it sigsev's ?  I can't sit here and watch top or the </FONT>
<FONT COLOR="#000000">> system monitor, but thought maybe something might be saved somewhere </FONT>
<FONT COLOR="#000000">> after the fact.  The processes are using at the moment, 1.4gb of memory </FONT>
<FONT COLOR="#000000">> and no swap.  I've not seen swap go active during any of this process </FONT>
<FONT COLOR="#000000">> run, and the machine has 2 GB memory installed.  Rather hard to trace </FONT>
<FONT COLOR="#000000">> down the exact activity when it happens.</FONT>

<FONT COLOR="#000000">After the process starts, strace it:</FONT>
<FONT COLOR="#000000">strace -p `ps -ef |grep YourProc |grep -v grep | awk '{print $1}'`</FONT>

<FONT COLOR="#000000">-Mark</FONT>
</PRE>
</BLOCKQUOTE>
<BR>
Not sure if this will be of any use -- sure isn't any use to me as I don't even begin to understand, but here's the output from the strace... It did not attach to the wrf.exe process which I wanted, but it attached to the mpi process which was running the wrf.exe, at least one of the processes.  There are two at runtime.<BR>
<BR>
Sam<BR>
<BR>
[rob@thunder static]$ strace -p `ps -ef|grep wrf.exe|grep -v grep | awk '{print $2}'`<BR>
Process 1503 attached - interrupt to quit<BR>
wait4(-1, [{WIFEXITED(s) && WEXITSTATUS(s) == 0}], 0, NULL) = 1583<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
--- SIGCHLD (Child exited) @ 0 (0) ---<BR>
wait4(-1, 0x7fbfffe5c4, WNOHANG, NULL)  = -1 ECHILD (No child processes)<BR>
rt_sigreturn(0xffffffffffffffff)        = 0<BR>
rt_sigaction(SIGINT, {SIG_DFL}, {0x432b60, [], SA_RESTORER, 0x2a955a6280}, 8) = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
stat("/bin/rm", {st_mode=S_IFREG|0755, st_size=41168, ...}) = 0<BR>
access("/bin/rm", X_OK)                 = 0<BR>
rt_sigprocmask(SIG_BLOCK, [INT CHLD], [], 8) = 0<BR>
fork()                                  = 1672<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0<BR>
rt_sigaction(SIGINT, {0x432b60, [], SA_RESTORER, 0x2a955a6280}, {SIG_DFL}, 8) = 0<BR>
wait4(-1, [{WIFEXITED(s) && WEXITSTATUS(s) == 0}], 0, NULL) = 1672<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
--- SIGCHLD (Child exited) @ 0 (0) ---<BR>
wait4(-1, 0x7fbfffe7a4, WNOHANG, NULL)  = -1 ECHILD (No child processes)<BR>
rt_sigreturn(0xffffffffffffffff)        = 0<BR>
rt_sigaction(SIGINT, {SIG_DFL}, {0x432b60, [], SA_RESTORER, 0x2a955a6280}, 8) = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
rt_sigprocmask(SIG_BLOCK, NULL, [], 8)  = 0<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0<BR>
munmap(0x2a95557000, 4096)              = 0<BR>
exit_group(0)                           = ?<BR>
Process 1503 detached<BR>
<BR>
</BODY>
</HTML>