Linux oom Situation

15

Ich habe ununterbrochene oom & Paniksituation ungelöst. Ich bin nicht sicher, ob das System den gesamten RAM (36 GB) füllt. Warum hat dieses System diese Situation ausgelöst? Ich vermute, dass es im Zusammenhang mit Lowmem-Zone in 32-Bit-Linux-Systemen. Wie kann ich die Protokolle von Kernel Panic und Uoom-Killer analysieren?

Freundliche Grüße,

Kernel 3.10.24

Dec 27 09:19:05 2013 kernel: : [277622.359064] squid invoked oom-killer: gfp_mask=0x42d0, order=3, oom_score_adj=0
Dec 27 09:19:05 2013 kernel: : [277622.359069] squid cpuset=/ mems_allowed=0
Dec 27 09:19:05 2013 kernel: : [277622.359074] CPU: 9 PID: 15533 Comm: squid Not tainted 3.10.24-1.lsg #1
Dec 27 09:19:05 2013 kernel: : [277622.359076] Hardware name: Intel Thurley/Greencity, BIOS 080016  10/05/2011
Dec 27 09:19:05 2013 kernel: : [277622.359078]  00000003 e377b280 e03c3c38 c06472d6 e03c3c98 c04d2d96 c0a68f84 e377b580
Dec 27 09:19:05 2013 kernel: : [277622.359089]  000042d0 00000003 00000000 e03c3c64 c04abbda e42bd318 00000000 e03c3cf4
Dec 27 09:19:05 2013 kernel: : [277622.359096]  000042d0 00000001 00000247 00000000 e03c3c94 c04d3d5f 00000001 00000042
Dec 27 09:19:05 2013 kernel: : [277622.359105] Call Trace:
Dec 27 09:19:05 2013 kernel: : [277622.359116]  [<c06472d6>] dump_stack+0x16/0x20
Dec 27 09:19:05 2013 kernel: : [277622.359121]  [<c04d2d96>] dump_header+0x66/0x1c0
Dec 27 09:19:05 2013 kernel: : [277622.359127]  [<c04abbda>] ? __delayacct_freepages_end+0x3a/0x40
Dec 27 09:19:05 2013 kernel: : [277622.359131]  [<c04d3d5f>] ? zone_watermark_ok+0x2f/0x40
Dec 27 09:19:05 2013 kernel: : [277622.359135]  [<c04d2f27>] check_panic_on_oom+0x37/0x60
Dec 27 09:19:05 2013 kernel: : [277622.359138]  [<c04d36d2>] out_of_memory+0x92/0x250
Dec 27 09:19:05 2013 kernel: : [277622.359144]  [<c04dd1fa>] ? wakeup_kswapd+0xda/0x120
Dec 27 09:19:05 2013 kernel: : [277622.359148]  [<c04d6cee>] __alloc_pages_nodemask+0x68e/0x6a0
Dec 27 09:19:05 2013 kernel: : [277622.359155]  [<c0801c1e>] sk_page_frag_refill+0x7e/0x120
Dec 27 09:19:05 2013 kernel: : [277622.359160]  [<c084b8c7>] tcp_sendmsg+0x387/0xbf0
Dec 27 09:19:05 2013 kernel: : [277622.359166]  [<c0469a2f>] ? put_prev_task_fair+0x1f/0x350
Dec 27 09:19:05 2013 kernel: : [277622.359173]  [<c0ba7d8b>] ? longrun_init+0x2b/0x30
Dec 27 09:19:05 2013 kernel: : [277622.359177]  [<c084b540>] ? tcp_tso_segment+0x380/0x380
Dec 27 09:19:05 2013 kernel: : [277622.359182]  [<c086d0da>] inet_sendmsg+0x4a/0xa0
Dec 27 09:19:05 2013 kernel: : [277622.359186]  [<c07ff3a6>] sock_aio_write+0x116/0x130
Dec 27 09:19:05 2013 kernel: : [277622.359191]  [<c0457acc>] ? hrtimer_try_to_cancel+0x3c/0xb0
Dec 27 09:19:05 2013 kernel: : [277622.359197]  [<c050b208>] do_sync_write+0x68/0xa0
Dec 27 09:19:05 2013 kernel: : [277622.359202]  [<c050caa0>] vfs_write+0x190/0x1b0
Dec 27 09:19:05 2013 kernel: : [277622.359206]  [<c050cbb3>] SyS_write+0x53/0x80
Dec 27 09:19:05 2013 kernel: : [277622.359211]  [<c08f72ba>] sysenter_do_call+0x12/0x22
Dec 27 09:19:05 2013 kernel: : [277622.359213] Mem-Info:
Dec 27 09:19:05 2013 kernel: : [277622.359215] DMA per-cpu:
Dec 27 09:19:05 2013 kernel: : [277622.359218] CPU    0: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359220] CPU    1: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359222] CPU    2: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359224] CPU    3: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359226] CPU    4: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359228] CPU    5: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359230] CPU    6: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359232] CPU    7: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359234] CPU    8: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359236] CPU    9: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359238] CPU   10: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359240] CPU   11: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359242] CPU   12: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359244] CPU   13: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359246] CPU   14: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359248] CPU   15: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359250] CPU   16: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359253] CPU   17: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359255] CPU   18: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359258] CPU   19: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359260] CPU   20: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359262] CPU   21: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359264] CPU   22: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359266] CPU   23: hi:    0, btch:   1 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359268] Normal per-cpu:
Dec 27 09:19:05 2013 kernel: : [277622.359270] CPU    0: hi:  186, btch:  31 usd:  34
Dec 27 09:19:05 2013 kernel: : [277622.359272] CPU    1: hi:  186, btch:  31 usd:  72
Dec 27 09:19:05 2013 kernel: : [277622.359274] CPU    2: hi:  186, btch:  31 usd:  40
Dec 27 09:19:05 2013 kernel: : [277622.359276] CPU    3: hi:  186, btch:  31 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359279] CPU    4: hi:  186, btch:  31 usd:  39
Dec 27 09:19:05 2013 kernel: : [277622.359281] CPU    5: hi:  186, btch:  31 usd:  49
Dec 27 09:19:05 2013 kernel: : [277622.359283] CPU    6: hi:  186, btch:  31 usd:  50
Dec 27 09:19:05 2013 kernel: : [277622.359285] CPU    7: hi:  186, btch:  31 usd:  25
Dec 27 09:19:05 2013 kernel: : [277622.359286] CPU    8: hi:  186, btch:  31 usd:  42
Dec 27 09:19:05 2013 kernel: : [277622.359289] CPU    9: hi:  186, btch:  31 usd:  39
Dec 27 09:19:05 2013 kernel: : [277622.359290] CPU   10: hi:  186, btch:  31 usd: 155
Dec 27 09:19:05 2013 kernel: : [277622.359293] CPU   11: hi:  186, btch:  31 usd:  56
Dec 27 09:19:05 2013 kernel: : [277622.359295] CPU   12: hi:  186, btch:  31 usd:   2
Dec 27 09:19:05 2013 kernel: : [277622.359297] CPU   13: hi:  186, btch:  31 usd: 162
Dec 27 09:19:05 2013 kernel: : [277622.359299] CPU   14: hi:  186, btch:  31 usd:  67
Dec 27 09:19:05 2013 kernel: : [277622.359301] CPU   15: hi:  186, btch:  31 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359303] CPU   16: hi:  186, btch:  31 usd:  68
Dec 27 09:19:05 2013 kernel: : [277622.359305] CPU   17: hi:  186, btch:  31 usd:  38
Dec 27 09:19:05 2013 kernel: : [277622.359307] CPU   18: hi:  186, btch:  31 usd:  56
Dec 27 09:19:05 2013 kernel: : [277622.359308] CPU   19: hi:  186, btch:  31 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359310] CPU   20: hi:  186, btch:  31 usd:  54
Dec 27 09:19:05 2013 kernel: : [277622.359312] CPU   21: hi:  186, btch:  31 usd:  35
Dec 27 09:19:05 2013 kernel: : [277622.359314] CPU   22: hi:  186, btch:  31 usd:   2
Dec 27 09:19:05 2013 kernel: : [277622.359316] CPU   23: hi:  186, btch:  31 usd:  60
Dec 27 09:19:05 2013 kernel: : [277622.359318] HighMem per-cpu:
Dec 27 09:19:05 2013 kernel: : [277622.359320] CPU    0: hi:  186, btch:  31 usd:  32
Dec 27 09:19:05 2013 kernel: : [277622.359322] CPU    1: hi:  186, btch:  31 usd:  52
Dec 27 09:19:05 2013 kernel: : [277622.359324] CPU    2: hi:  186, btch:  31 usd:   9
Dec 27 09:19:05 2013 kernel: : [277622.359326] CPU    3: hi:  186, btch:  31 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359328] CPU    4: hi:  186, btch:  31 usd: 125
Dec 27 09:19:05 2013 kernel: : [277622.359330] CPU    5: hi:  186, btch:  31 usd: 116
Dec 27 09:19:05 2013 kernel: : [277622.359332] CPU    6: hi:  186, btch:  31 usd: 126
Dec 27 09:19:05 2013 kernel: : [277622.359333] CPU    7: hi:  186, btch:  31 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359336] CPU    8: hi:  186, btch:  31 usd:  79
Dec 27 09:19:05 2013 kernel: : [277622.359338] CPU    9: hi:  186, btch:  31 usd:  34
Dec 27 09:19:05 2013 kernel: : [277622.359340] CPU   10: hi:  186, btch:  31 usd: 111
Dec 27 09:19:05 2013 kernel: : [277622.359341] CPU   11: hi:  186, btch:  31 usd: 144
Dec 27 09:19:05 2013 kernel: : [277622.359343] CPU   12: hi:  186, btch:  31 usd:  15
Dec 27 09:19:05 2013 kernel: : [277622.359345] CPU   13: hi:  186, btch:  31 usd: 166
Dec 27 09:19:05 2013 kernel: : [277622.359347] CPU   14: hi:  186, btch:  31 usd: 185
Dec 27 09:19:05 2013 kernel: : [277622.359349] CPU   15: hi:  186, btch:  31 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359351] CPU   16: hi:  186, btch:  31 usd:  58
Dec 27 09:19:05 2013 kernel: : [277622.359353] CPU   17: hi:  186, btch:  31 usd: 122
Dec 27 09:19:05 2013 kernel: : [277622.359356] CPU   18: hi:  186, btch:  31 usd: 170
Dec 27 09:19:05 2013 kernel: : [277622.359358] CPU   19: hi:  186, btch:  31 usd:   0
Dec 27 09:19:05 2013 kernel: : [277622.359360] CPU   20: hi:  186, btch:  31 usd:  30
Dec 27 09:19:05 2013 kernel: : [277622.359362] CPU   21: hi:  186, btch:  31 usd:  33
Dec 27 09:19:05 2013 kernel: : [277622.359364] CPU   22: hi:  186, btch:  31 usd:  28
Dec 27 09:19:05 2013 kernel: : [277622.359366] CPU   23: hi:  186, btch:  31 usd:  44
Dec 27 09:19:05 2013 kernel: : [277622.359371] active_anon:658515 inactive_anon:54399 isolated_anon:0
Dec 27 09:19:05 2013 kernel: : [277622.359371]  active_file:1172176 inactive_file:323606 isolated_file:0
Dec 27 09:19:05 2013 kernel: : [277622.359371]  unevictable:0 dirty:0 writeback:0 unstable:0
Dec 27 09:19:05 2013 kernel: : [277622.359371]  free:6911872 slab_reclaimable:29430 slab_unreclaimable:34726
Dec 27 09:19:05 2013 kernel: : [277622.359371]  mapped:45784 shmem:9850 pagetables:107714 bounce:0
Dec 27 09:19:05 2013 kernel: : [277622.359371]  free_cma:0
Dec 27 09:19:05 2013 kernel: : [277622.359382] DMA free:2332kB min:36kB low:44kB high:52kB active_anon:0kB inactive_anon:0kB active_file:0kB inactive_file:0kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:15968kB managed:6960kB mlocked:0kB dirty:0kB writeback:0kB mapped:0kB shmem:0kB slab_reclaimable:8kB slab_unreclaimable:288kB kernel_stack:0kB pagetables:0kB unstable:0kB bounce:0kB free_cma:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? yes
Dec 27 09:19:05 2013 kernel: : [277622.359384] lowmem_reserve[]: 0 573 36539 36539
Dec 27 09:19:05 2013 kernel: : [277622.359393] Normal free:114488kB min:3044kB low:3804kB high:4564kB active_anon:0kB inactive_anon:0kB active_file:252kB inactive_file:256kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:894968kB managed:587540kB mlocked:0kB dirty:0kB writeback:0kB mapped:4kB shmem:0kB slab_reclaimable:117712kB slab_unreclaimable:138616kB kernel_stack:11976kB pagetables:0kB unstable:0kB bounce:0kB free_cma:0kB writeback_tmp:0kB pages_scanned:982 all_unreclaimable? yes
Dec 27 09:19:05 2013 kernel: : [277622.359395] lowmem_reserve[]: 0 0 287725 287725
Dec 27 09:19:05 2013 kernel: : [277622.359404] HighMem free:27530668kB min:512kB low:48272kB high:96036kB active_anon:2634060kB inactive_anon:217596kB active_file:4688452kB inactive_file:1294168kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:36828872kB managed:36828872kB mlocked:0kB dirty:0kB writeback:0kB mapped:183132kB shmem:39400kB slab_reclaimable:0kB slab_unreclaimable:0kB kernel_stack:0kB pagetables:430856kB unstable:0kB bounce:367564104kB free_cma:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? no
Dec 27 09:19:05 2013 kernel: : [277622.359406] lowmem_reserve[]: 0 0 0 0
Dec 27 09:19:05 2013 kernel: : [277622.359410] DMA: 3*4kB (U) 2*8kB (U) 4*16kB (U) 5*32kB (U) 2*64kB (U) 0*128kB 0*256kB 0*512kB 0*1024kB 1*2048kB (R) 0*4096kB = 2428kB
Dec 27 09:19:05 2013 kernel: : [277622.359422] Normal: 5360*4kB (UEM) 3667*8kB (UEM) 3964*16kB (UEMR) 13*32kB (MR) 0*64kB 1*128kB (R) 1*256kB (R) 0*512kB 0*1024kB 0*2048kB 0*4096kB = 115000kB
Dec 27 09:19:05 2013 kernel: : [277622.359435] HighMem: 6672*4kB (M) 74585*8kB (UM) 40828*16kB (UM) 17275*32kB (UM) 3314*64kB (UM) 1126*128kB (UM) 992*256kB (UM) 585*512kB (UM) 225*1024kB (UM) 78*2048kB (UMR) 5957*4096kB (UM) = 27529128kB
Dec 27 09:19:05 2013 kernel: : [277622.359452] Node 0 hugepages_total=0 hugepages_free=0 hugepages_surp=0 hugepages_size=2048kB
Dec 27 09:19:05 2013 kernel: : [277622.359454] 1505509 total pagecache pages
Dec 27 09:19:05 2013 kernel: : [277622.359457] 4 pages in swap cache
Dec 27 09:19:05 2013 kernel: : [277622.359459] Swap cache stats: add 13, delete 9, find 0/0
Dec 27 09:19:05 2013 kernel: : [277622.359460] Free swap  = 35318812kB
Dec 27 09:19:05 2013 kernel: : [277622.359462] Total swap = 35318864kB
Dec 27 09:19:05 2013 kernel: : [277622.450529] 9699327 pages RAM
Dec 27 09:19:05 2013 kernel: : [277622.450532] 9471490 pages HighMem
Dec 27 09:19:05 2013 kernel: : [277622.450533] 342749 pages reserved
Dec 27 09:19:05 2013 kernel: : [277622.450534] 2864256 pages shared
Dec 27 09:19:05 2013 kernel: : [277622.450535] 1501243 pages non-shared
Dec 27 09:19:05 2013 kernel: : [277622.450538] Kernel panic - not syncing: Out of memory: system-wide panic_on_oom is enabled

Dec 27 09:19:05 2013 kernel: : [277622.450538]

und

# cat /proc/meminfo
MemTotal:       37426312 kB
MemFree:        28328992 kB
Buffers:           94728 kB
Cached:          6216068 kB
SwapCached:            0 kB
Active:          6958572 kB
Inactive:        1815380 kB
Active(anon):    2329152 kB
Inactive(anon):   170252 kB
Active(file):    4629420 kB
Inactive(file):  1645128 kB
Unevictable:           0 kB
Mlocked:               0 kB
HighTotal:      36828872 kB
HighFree:       28076144 kB
LowTotal:         597440 kB
LowFree:          252848 kB
SwapTotal:      35318864 kB
SwapFree:       35318860 kB
Dirty:                 0 kB
Writeback:             8 kB
AnonPages:       2463512 kB
Mapped:           162296 kB
Shmem:             36332 kB
Slab:             208676 kB
SReclaimable:     120872 kB
SUnreclaim:        87804 kB
KernelStack:        6320 kB
PageTables:        42280 kB
NFS_Unstable:          0 kB
Bounce:              124 kB
WritebackTmp:          0 kB
CommitLimit:    54032020 kB
Committed_AS:    3191916 kB
VmallocTotal:     122880 kB
VmallocUsed:       27088 kB
VmallocChunk:      29312 kB
HugePages_Total:       0
HugePages_Free:        0
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB
DirectMap4k:       10232 kB
DirectMap2M:      901120 kB

sysctl:

vm.oom_dump_tasks = 0
vm.oom_kill_allocating_task = 1
vm.panic_on_oom = 1

vm.admin_reserve_kbytes = 8192
vm.block_dump = 0
vm.dirty_background_bytes = 0
vm.dirty_background_ratio = 10
vm.dirty_bytes = 0
vm.dirty_expire_centisecs = 3000
vm.dirty_ratio = 20
vm.dirty_writeback_centisecs = 500
vm.drop_caches = 0
vm.highmem_is_dirtyable = 0
vm.hugepages_treat_as_movable = 0
vm.hugetlb_shm_group = 0
vm.laptop_mode = 0
vm.legacy_va_layout = 0
vm.lowmem_reserve_ratio = 256   32      32
vm.max_map_count = 65530
vm.min_free_kbytes = 3084
vm.mmap_min_addr = 4096
vm.nr_hugepages = 0
vm.nr_overcommit_hugepages = 0
vm.nr_pdflush_threads = 0
vm.overcommit_memory = 0
vm.overcommit_ratio = 50
vm.page-cluster = 3
vm.percpu_pagelist_fraction = 0
vm.scan_unevictable_pages = 0
vm.stat_interval = 1
vm.swappiness = 30
vm.user_reserve_kbytes = 131072
vm.vdso_enabled = 1
vm.vfs_cache_pressure = 100

und

# ulimit -a
core file size          (blocks, -c) 0
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 0
file size               (blocks, -f) unlimited
pending signals                 (-i) 292370
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited
open files                      (-n) 36728
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 8192
cpu time               (seconds, -t) unlimited
max user processes              (-u) 292370
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited
Meeresquest
quelle
6
Hey Leute - ich sehe keinen Grund, diese Frage zu schließen. Dies ist ein interessantes OOM-Problem.
Nils
1
Ich habe die Frage umformuliert, um sie wieder zu öffnen.
Seequest
Weiß jemand für die folgende Zeile "CPU 0: hi: 0, btch: 1 usd: 0", was "hi", "btch" und "usd" bedeuten und was ihre Einheiten sind?
Waffleman

Antworten:

52

Ein "Vorschlaghammer" -Ansatz wäre jedoch ein Upgrade auf ein 64-Bit-Betriebssystem (dies ist 32-Bit), da die Anordnung der Zonen anders erfolgt.

OK, also hier werde ich versuchen zu beantworten, warum Sie hier eine OOM erlebt haben. Hier spielen eine Reihe von Faktoren eine Rolle.

  • Die Auftragsgröße der Anfrage und wie der Kernel bestimmte Auftragsgrößen behandelt.
  • Die ausgewählte Zone.
  • Die von dieser Zone verwendeten Wasserzeichen.
  • Fragmentierung in der Zone.

Wenn Sie sich das OOM selbst ansehen, ist eindeutig viel freier Speicher verfügbar, aber OOM-Killer wurde aufgerufen? Warum?


Die Auftragsgröße der Anfrage und wie der Kernel bestimmte Auftragsgrößen behandelt

Der Kernel ordnet den Speicher nach Reihenfolge zu. Ein 'Auftrag' ist ein Bereich des zusammenhängenden RAM, der erfüllt sein muss, damit die Anforderung funktioniert. Die Ordnungen werden nach Größenordnungen (also der Reihenfolge der Namen) unter Verwendung des Algorithmus angeordnet 2^(ORDER + 12). Also, Ordnung 0 ist 4096, Ordnung 1 ist 8192, Ordnung 2 ist 16384 usw. und so weiter.

Der Kernel hat einen hartcodierten Wert von "hoher Ordnung" (> PAGE_ALLOC_COSTLY_ORDER). Dies ist Ordnung 4 und höher (64kb oder höher ist eine hohe Ordnung).

Hohe Aufträge werden für Seitenzuordnungen anders als niedrige Aufträge erfüllt. Eine hohe Ordnungszuordnung, wenn es nicht gelingt, den Speicher zu greifen, wird auf modernen Kerneln.

  • Versuchen Sie, die Komprimierungsroutine auszuführen, um den Speicher zu defragmentieren.
  • Rufen Sie niemals OOM-Killer an, um die Anfrage zu erfüllen.

Ihre Bestellgröße ist hier aufgelistet

Dec 27 09:19:05 2013 kernel: : [277622.359064] squid invoked oom-killer: gfp_mask=0x42d0, order=3, oom_score_adj=0

Ordnung 3 ist die höchste der Anforderungen niedriger Ordnung und ruft (wie Sie sehen) den OOM-Killer auf, um sie zu befriedigen.

Beachten Sie, dass die meisten Benutzerbereichszuordnungen keine Anforderungen höherer Ordnung verwenden. Normalerweise ist es der Kernel, der zusammenhängende Speicherbereiche benötigt. Eine Ausnahme könnte sein, wenn der Userspace riesige Seiten verwendet - aber das ist hier nicht der Fall.

In Ihrem Fall wird die Zuweisung der Reihenfolge 3 vom Kernel aufgerufen, der ein Paket in den Netzwerkstapel einreihen möchte. Hierzu ist eine Zuweisung von 32 KB erforderlich.

Die ausgewählte Zone.

Der Kernel unterteilt Ihre Speicherbereiche in Zonen. Diese Zerlegung erfolgt, weil auf x86 bestimmte Speicherbereiche nur von bestimmter Hardware adressiert werden können. Ältere Hardware kann möglicherweise nur den Speicher in der 'DMA'-Zone adressieren. Wenn wir etwas Speicher zuweisen möchten, wird zuerst eine Zone ausgewählt und nur der freie Speicher dieser Zone wird berücksichtigt, wenn eine Zuweisungsentscheidung getroffen wird.

Obwohl ich mit dem Algorithmus zur Zonenauswahl nicht vollständig vertraut bin, besteht der typische Anwendungsfall darin, niemals eine Zuweisung aus DMA vorzunehmen, sondern in der Regel die Zone mit der niedrigsten Adresse auszuwählen, die die Anforderung erfüllen könnte.

Während des OOM werden viele Zoneninformationen ausgespuckt, die auch abgerufen werden können /proc/zoneinfo.

Dec 27 09:19:05 2013 kernel: : [277622.359382] DMA free:2332kB min:36kB low:44kB high:52kB active_anon:0kB inactive_anon:0kB active_file:0kB inactive_file:0kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:15968kB managed:6960kB mlocked:0kB dirty:0kB writeback:0kB mapped:0kB shmem:0kB slab_reclaimable:8kB slab_unreclaimable:288kB kernel_stack:0kB pagetables:0kB unstable:0kB bounce:0kB free_cma:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? yes
Dec 27 09:19:05 2013 kernel: : [277622.359393] Normal free:114488kB min:3044kB low:3804kB high:4564kB active_anon:0kB inactive_anon:0kB active_file:252kB inactive_file:256kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:894968kB managed:587540kB mlocked:0kB dirty:0kB writeback:0kB mapped:4kB shmem:0kB slab_reclaimable:117712kB slab_unreclaimable:138616kB kernel_stack:11976kB pagetables:0kB unstable:0kB bounce:0kB free_cma:0kB writeback_tmp:0kB pages_scanned:982 all_unreclaimable? yes
Dec 27 09:19:05 2013 kernel: : [277622.359404] HighMem free:27530668kB min:512kB low:48272kB high:96036kB active_anon:2634060kB inactive_anon:217596kB active_file:4688452kB inactive_file:1294168kB unevictable:0kB isolated(anon):0kB isolated(file):0kB present:36828872kB managed:36828872kB mlocked:0kB dirty:0kB writeback:0kB mapped:183132kB shmem:39400kB slab_reclaimable:0kB slab_unreclaimable:0kB kernel_stack:0kB pagetables:430856kB unstable:0kB bounce:367564104kB free_cma:0kB writeback_tmp:0kB pages_scanned:0 all_unreclaimable? no

Die Zonen, die Sie haben, DMA, Normal und HighMem, geben eine 32-Bit-Plattform an, da die HighMem-Zone auf 64-Bit nicht vorhanden ist. Auch auf 64-Bit-Systemen ist Normal auf 4 GB und mehr ausgelegt, wohingegen es auf 32-Bit-Systemen bis zu 896 MB abbildet (obwohl der Kernel in Ihrem Fall nur einen kleineren Teil als diesen verwaltet: - managed:587540kB.)

Wenn Sie sich die erste Zeile noch einmal gfp_mask=0x42d0ansehen, können Sie feststellen, woher diese Zuordnung stammt und welche Art der Zuordnung vorgenommen wurde. Das letzte Byte (0) sagt uns, dass dies eine Zuweisung aus der normalen Zone ist. Die gfp Bedeutungen befinden sich in include / linux / gfp.h .

Die von dieser Zone verwendeten Wasserzeichen.

Wenn der Speicher fast voll ist, werden Aktionen zum Zurückfordern durch das Wasserzeichen angegeben. Sie zeigen sich hier: min:3044kB low:3804kB high:4564kB. Wenn der freie Speicher "niedrig" erreicht, wird getauscht, bis der "hohe" Schwellenwert überschritten ist. Wenn der Speicher 'min' erreicht, müssen wir Sachen töten, um Speicher über den OOM-Killer freizugeben.

Fragmentierung in der Zone.

Um zu sehen, ob eine Anforderung für eine bestimmte Speicherreihenfolge erfüllt werden kann, berücksichtigt der Kernel, wie viele freie Seiten für jede Bestellung verfügbar sind. Dies ist lesbar in /proc/buddyinfo. OOM-Killerberichte spucken zusätzlich die Buddyinfo aus, wie hier zu sehen:

Normal: 5360*4kB (UEM) 3667*8kB (UEM) 3964*16kB (UEMR) 13*32kB (MR) 0*64kB 1*128kB (R) 1*256kB (R) 0*512kB 0*1024kB 0*2048kB 0*4096kB = 115000kB

Damit eine Speicherzuordnung erfüllt werden kann, muss freier Speicher in der angeforderten Auftragsgröße oder eine höhere Zuordnung verfügbar sein. Wenn Sie viele, viele freie Daten in den unteren und keine in den oberen Ordnungen haben, ist Ihr Speicher fragmentiert. Wenn Sie eine sehr hohe Auftragszuordnung erhalten, ist es möglich (auch mit viel freiem Speicher), dass Sie nicht zufrieden sind, da keine Seiten mit hoher Ordnung verfügbar sind. Der Kernel kann den Speicher defragmentieren (dies wird als Speicherkompaktierung bezeichnet), indem er viele Seiten niedriger Ordnung verschiebt, damit keine Lücken im adressierbaren RAM-Bereich verbleiben.

OOM-Killer wurde angerufen? Warum?

Wenn wir also diese Dinge berücksichtigen, können wir Folgendes sagen:

  • Es wurde versucht, eine zusammenhängende Zuweisung von 32 KB durchzuführen. Aus der normalen Zone.
  • In der ausgewählten Zone war genügend freier Speicher vorhanden.
  • Es war Speicherplatz für Reihenfolge 3, 5 und 6 verfügbar 13*32kB (MR) 1*128kB (R) 1*256kB (R)

Wenn es also war freier Speicher, andere Aufträge konnten die Anforderung erfüllen. Was ist passiert?

Das Zuweisen aus einer Bestellung ist mehr als nur das Überprüfen der für diese Bestellung oder höher verfügbaren freien Speicherkapazität. Der Kernel subtrahiert effektiv Speicher von allen niedrigeren Ordnungen von der gesamten freien Zeile und führt dann die Prüfung des Mindestwasserzeichens für die verbleibenden Daten durch.

Was in Ihrem Fall passiert, ist, unseren freien Speicher für die Zone zu überprüfen, die wir tun müssen.

115000 - (5360*4) - (3667*8) - (3964*16) = 800

Diese Menge an freiem Speicher wird anhand des minWasserzeichens 3044 überprüft. Technisch gesehen haben Sie also keinen freien Speicher mehr, um die von Ihnen angeforderte Zuordnung vorzunehmen. Und deshalb haben Sie OOM-Killer aufgerufen.


Festsetzung

Es gibt zwei Fehlerbehebungen. Durch ein Upgrade auf 64-Bit wird Ihre Zonenpartitionierung so geändert, dass "Normal" 4 GB bis 36 GB beträgt, sodass Sie Ihre Speicherzuweisung nicht in eine Zone ändern, die so stark fragmentiert werden kann. Es ist nicht so, dass Sie mehr adressierbaren Speicher haben, der dieses Problem behebt (weil Sie bereits PAE verwenden), sondern nur, dass die Zone, aus der Sie auswählen, mehr adressierbaren Speicher hat.

Die zweite Möglichkeit (die ich noch nie getestet habe) besteht darin, den Kernel dazu zu bringen, Ihren Speicher aggressiver zu komprimieren.

Wenn Sie den Wert vm.extfrag_thresholdvon 500 auf 100 ändern, wird der Speicher mit größerer Wahrscheinlichkeit komprimiert, um eine Zuweisung höherer Ordnung zu berücksichtigen. Obwohl ich noch nie mit diesem Wert rumgespielt habe - es hängt auch davon ab, in welchem ​​Fragmentierungsindex er verfügbar ist /sys/kernel/debug/extfrag/extfrag_index. Ich habe im Moment keine Box mit einem Kernel, der neu genug ist, um zu sehen, was das zu bieten hat.

Alternativ können Sie eine Art Cron-Job ausführen (dies ist schrecklich, schrecklich hässlich), um den Speicher manuell zu komprimieren, indem Sie in ihn schreiben /proc/sys/vm/compact_memory.

Ganz ehrlich, ich glaube nicht, dass es wirklich eine Möglichkeit gibt, das System zu optimieren, um dieses Problem zu vermeiden - es liegt in der Natur des Speicherzuweisers, auf diese Weise zu arbeiten. Das Ändern der Architektur der von Ihnen verwendeten Plattform ist wahrscheinlich die einzige grundlegend auflösbare Lösung.

Matthew Ife
quelle
Es ist im Moment unmöglich, in 64-Bit zu gehen. Ich muss das System abstimmen, um den Fehler nicht zu bekommen.
Seequest
4
Das ist eine großartige Antwort. Habe eine positive Bewertung :)
wzzrd
Hallo Mlfe, ausgezeichnete Antwort. Ich bin gespannt auf diesen Teil Ihres Beitrags. "Der Kernel subtrahiert effektiv Speicher von allen niedrigeren Ordnungen von der gesamten freien Zeile und führt dann die Prüfung des Mindestwasserzeichens für die verbleibenden Daten durch." - Haben Sie den relevanten Quellcode, den ich durchgehen kann? Weil ich viele OOM-Probleme behandelt habe, aber diese Logik in der Quelle nicht gesehen habe. Vielleicht habe ich verpasst. Wo siehst du überhaupt oom_kill.c? Oder sonst noch etwas?
Soham Chakraborty
2
Der Code ist in mm / page_alloc.c und wird in der Funktion __zone_watermark_ok
Matthew Ife
@SohamChakraborty Wenn Sie sich für dieses Zeug interessieren, sollte ich auch darauf hinweisen, dass Sie herausfinden können, was eine OOM im Kernel verursacht, indem Sie die Stapelablaufverfolgung in der OOM-Killer-Ausgabe befolgen, die hier bereitgestellt wird.
Matthew Ife
5

Von Anfang an: Sie sollten sich wirklich für ein 64-Bit-Betriebssystem entscheiden. Haben Sie einen guten Grund, hier bei 32-Bit zu bleiben?

Es ist schwierig, dieses Problem zu diagnostizieren, ohne sich das System genauer anzusehen, vorzugsweise zu einem Zeitpunkt, zu dem es ausfällt. Mein (schneller) Beitrag zielt also mehr oder weniger allgemein auf Speicherprobleme auf 32-Bit-Systemen ab. Habe ich schon erwähnt, dass 64-Bit das alles zum Erliegen bringen würde?

Ihr Problem ist dreifach.

Erstens ist der Adressraum pro Prozess selbst auf einem PAE-Kernel auf 4 GB [1] begrenzt. Dies bedeutet, dass Ihre Squid-Instanz niemals mehr als 4 GB RAM pro Prozess verbrauchen kann. Ich kenne mich mit Squid nicht so gut aus, aber wenn dies Ihr Hauptproxyserver ist, reicht das möglicherweise nicht aus.

Zweitens wird auf einem 32-Bit-System mit sehr viel RAM viel Speicher in der so genannten "ZONE_NORMAL" verwendet, um Datenstrukturen zu speichern, die zur Verwendung des Speichers in ZONE_HIGHMEM erforderlich sind. Diese Datenstruktur kann nicht selbst in ZONE_HIGHMEM verschoben werden, da der Speicher, den der Kernel für seine eigenen Zwecke verwendet, immer in ZONE_NORMAL sein muss (dh im ersten 1GiB-ish). Je mehr Speicher Sie in ZONE_HIGHMEM haben (in Ihrem Fall viel), desto problematischer wird dies, da der Kernel dann immer mehr Speicher von ZONE_NORMAL benötigt, um ZONE_HIGHMEM zu verwalten. Wenn der freie Speicher in ZONE_NORMAL aufgebraucht ist, kann es bei einigen Aufgaben zu Systemausfällen kommen, da in ZONE_NORMAL auf einem 32-Bit-System viele Vorgänge stattfinden . Zum Beispiel alle kernelbezogenen Speicheroperationen;)

Drittens, auch wenn in ZONE_NORMAL noch Speicher vorhanden ist (ich habe Ihre Protokolle nicht detailliert durchgesehen), erfordern einige Speicheroperationen nicht fragmentierten Speicher. Wenn beispielsweise Ihr gesamter Speicher in wirklich kleine Teile fragmentiert ist, schlagen einige Vorgänge fehl, die mehr als das erfordern. [3] Ein kurzer Blick auf Ihre Protokolle zeigt, dass ZONE_DMA und ZONE_NORMAL ziemlich stark fragmentiert sind.

Bearbeiten: Mlfe Antwort oben hat eine hervorragende Erklärung, wie dies im Detail funktioniert.

Nochmals: Auf einem 64-Bit-System befindet sich der gesamte Speicher in ZONE_NORMAL. Auf 64-Bit-Systemen gibt es keine HIGHMEM-Zone. Problem gelöst.

Bearbeiten: Sie können hier [4] nachsehen, ob Sie oom-killer anweisen können, Ihre wichtigen Prozesse in Ruhe zu lassen. Das wird nicht alles (wenn überhaupt etwas) lösen, aber es könnte einen Versuch wert sein.

[1] http://en.wikipedia.org/wiki/Physical_address_extension#Design

[2] http://www.redhat.com/archives/rhelv5-list/2008-September/msg00237.html und https://access.redhat.com/site/documentation/en-US/Red_Hat_Enterprise_Linux/5/html /Tuning_and_Optimizing_Red_Hat_Enterprise_Linux_for_Oracle_9i_and_10g_Databases/sect-Oracle_9i_and_10g_Tuning_Guide_Hardware_Architectures_and_Linux_Kernels_a32_bit_and_emchitect

[3] http://bl0rg.krunch.be/oom-frag.html

[4] http://lwn.net/Articles/317814/

wzzrd
quelle
1
Der Speicher wird von der normalen Zone aus zugewiesen (siehe gfp_mask), obwohl die normale Zone auf den ersten Blick über genügend freien Speicher verfügt, um diese Zuweisung vorzunehmen. Ich habe eine tatsächliche Erklärung dafür, aber es erfordert eine ziemlich lange Bearbeitung meines Beitrags.
Matthew Ife
4

@MIfe lieferte bereits hervorragende Informationen zum Umgang mit Speicherzuweisungen im Kernel und lieferte Ihnen auch eine geeignete Lösung wie den Wechsel zum 64-Bit-Betriebssystem und böse Hack-ähnliche manuelle Speicherkomprimierung über /proc/sys/vm/compact_memoryin cron.

Meine 2 Cent wären eine weitere Umgehung, die Ihnen helfen könnte:
Ich habe festgestellt, dass Sie tcp_tso_segmentin Ihrem Kernel-Backtrace Folgendes haben:

# ethtool -K ethX tso off gso off lro off

kann den Druck verringern, mmindem er zur Verwendung niedrigerer Ordnungen gezwungen wird.

PS . Eine Liste aller Abladungen erhalten Sie über# ethtool -k ethX

SaveTheRbtz
quelle
2
Dies ist ein brillanter Vorschlag. Upvote für dich.
Matthew Ife
Diese Info ist sehr guter Zeiger. Ich werde auch die Wirkung von tso untersuchen.
Seequest
3

Die Panik besteht darin, dass das Sysctl "vm.panic_on_oom = 1" gesetzt ist - die Idee ist, dass ein Neustart des Systems es in einen vernünftigen Zustand zurückversetzt. Sie können dies in sysctl.conf ändern.

Ganz oben lesen wir Tintenfisch beschwor oom Killer. Sie können Ihre Squid-Konfiguration und die maximale Speichernutzung überprüfen (oder einfach auf ein 64-Bit-Betriebssystem wechseln).

In / proc / meminfo wird eine Zone mit hohem Arbeitsspeicher angezeigt, sodass Sie einen 32-Bit-Kernel mit 36 ​​GB Arbeitsspeicher ausführen. Sie können auch sehen, dass der Kernel in der normalen Zone 982 Seiten ohne Erfolg gescannt hat, um den Speicherbedarf von Squid zu decken:

pages_scanned:982 all_unreclaimable? yes
Ramruma
quelle