Out of memory, tasks were killed by the admin./computer.

Any issues with the actual running of the WRF.

Out of memory, tasks were killed by the admin./computer.

Postby yucola » Thu Sep 10, 2020 11:07 am

Dear sir:
I just began to learn WRF-chem. Every time I run ./wrf.exe, my tasks would be killed by the administrator by the reason of being out of memory of a single node. I used 1936 CPUs to run ./wrf.exe.
Here is my namelist.input:

Code: Select all
&time_control           
run_days                 = 15,
run_hours                = 3,
run_minutes              = 0,
run_seconds              = 0,
start_year               = 2016,     2016,     2016,
start_month              = 07,       07,       07,
start_day                = 01,       01,       01,
start_hour               = 00,       00,       00,
start_minute             = 00,       00,       00,
start_second             = 00,       00,       00,
end_year                 = 2016,     2016,     2016,
end_month                = 07,       07,       07,
end_day                  = 16,       16,       16,
end_hour                 = 00,       00,       00,
end_minute               = 00,       00,       00,
end_second               = 00,       00,       00,
interval_seconds         = 3600,
input_from_file          = .true.,   .true.,   .true.,
history_interval         = 180,       60,       60,
frames_per_outfile       = 1000,     1000,     1000,
restart                  = .false.,
restart_interval         = 10000,
io_form_history          = 2,
io_form_restart          = 2,
io_form_input            = 2,
io_form_boundary         = 2,
debug_level              = 0,

io_form_auxinput5        = 2,
auxinput5_inname         = 'wrfchemi_<hr>z_d<domain>'
auxinput5_interval_m     = 1,
/

&domains                 
time_step                = 150,
time_step_fract_num      = 0,
time_step_fract_den      = 1,
max_dom                  = 3,
e_we                     = 66,      116,      176,
e_sn                     = 66,      116,      176,
e_vert                   = 35,       35,       35,
p_top_requested          = 5000,
num_metgrid_levels       = 38,
num_metgrid_soil_levels  = 4,
dx                       = 25000,     5000,     1000,
dy                       = 25000,     5000,     1000,
grid_id                  = 1,        2,        3,
parent_id                = 1,        1,        2,
i_parent_start           = 1,       22,       41,
j_parent_start           = 1,       22,       41,
parent_grid_ratio        = 1,        5,        5,
parent_time_step_ratio   = 1,        5,        5,
feedback                 = 1,
smooth_option            = 0,
/

&physics                 
mp_physics               = 6,        6,        6,
ra_lw_physics            = 4,        4,        4,
ra_sw_physics            = 4,        4,        4,
radt                     = 25,       5,        1,
sf_sfclay_physics        = 2,        2,        2,
sf_surface_physics       = 2,        2,        2,
bl_pbl_physics           = 2,        2,        2,
bldt                     = 0,        0,        0,
cu_physics               = 5,        5,        5,
cu_diag                  = 1,        1,        1,
cudt                     = 5,        5,        5,
isfflx                   = 1,
ifsnow                   = 0,
icloud                   = 1,
surface_input_source     = 1,
num_soil_layers          = 4,
sf_urban_physics         = 0,        0,        0,
maxiens                  = 1,
maxens                   = 3,
maxens2                  = 3,
maxens3                  = 16,
ensdim                   = 144,
/

&fdda                   
/

&dynamics               
w_damping                = 0,
diff_opt                 = 1,
km_opt                   = 4,
diff_6th_opt             = 0,        0,        0,
diff_6th_factor          = 0.12,     0.12,     0.12,
base_temp                = 290.,
damp_opt                 = 0,
zdamp                    = 5000.,    5000.,    5000.,
dampcoef                 = 0.2,      0.2,      0.2,
khdif                    = 0,        0,        0,
kvdif                    = 0,        0,        0,
non_hydrostatic          = .true.,   .true.,   .true.,
moist_adv_opt            = 1,        1,        1,
scalar_adv_opt           = 1,        1,        1,
/

&bdy_control             
spec_bdy_width           = 5,
spec_zone                = 1,
relax_zone               = 4,
specified                = .true.,  .false.,  .false.,
nested                   = .false.,   .true.,   .true.,
/

&grib2                   
/

&chem
kemit              = 11,
chem_opt           = 1, 1, 1,
!chemdt             = 3,
io_style_emissions = 1,
emiss_opt          = 2, 2, 2,
have_bcs_chem      = .false., .false., .false.,
/

&namelist_quilt         
nio_tasks_per_group      = 0,
nio_groups               = 1,
/
                                                                                                                                                     



I wish you can help me to find out the reasons of why a single node would use so much memory. Thanks a lot.
——————————————————————————————————————————————————————————————————

I change my way to run ./wrf.exe, this problem seems to be worked out.
(1)At first, I used "srun -n 1936 ./wrf.exe ", where "1936" was the number of CPUs I used.
(2)Now, I use "srun -N 60 ./wrf.exe", where "60" is the number of nodes I use. In my case, every node contain 40 nodes.

I wonder how does it happen? Why (1) didn't work, but (2) does?
yucola
 
Posts: 1
Joined: Thu Sep 10, 2020 10:56 am

Return to Runtime Problems

Who is online

Users browsing this forum: No registered users and 12 guests