]> git.hungrycats.org Git - linux/commit
x86, ioremap: Speed up check for RAM pages
authorRoland Dreier <roland@purestorage.com>
Fri, 2 May 2014 18:18:41 +0000 (11:18 -0700)
committerJiri Slaby <jslaby@suse.cz>
Fri, 18 Jul 2014 13:51:30 +0000 (15:51 +0200)
commitd30ab27962dc2280291dc65b8daa3b1459cc3ceb
tree2939381e572dc9c4d5356f30b7e6259ab303e72c
parent8310f53f36bdbe400b8c6bfe6296f024ea9de6e0
x86, ioremap: Speed up check for RAM pages

commit c81c8a1eeede61e92a15103748c23d100880cc8a upstream.

In __ioremap_caller() (the guts of ioremap), we loop over the range of
pfns being remapped and checks each one individually with page_is_ram().
For large ioremaps, this can be very slow.  For example, we have a
device with a 256 GiB PCI BAR, and ioremapping this BAR can take 20+
seconds -- sometimes long enough to trigger the soft lockup detector!

Internally, page_is_ram() calls walk_system_ram_range() on a single
page.  Instead, we can make a single call to walk_system_ram_range()
from __ioremap_caller(), and do our further checks only for any RAM
pages that we find.  For the common case of MMIO, this saves an enormous
amount of work, since the range being ioremapped doesn't intersect
system RAM at all.

With this change, ioremap on our 256 GiB BAR takes less than 1 second.

Signed-off-by: Roland Dreier <roland@purestorage.com>
Link: http://lkml.kernel.org/r/1399054721-1331-1-git-send-email-roland@kernel.org
Signed-off-by: H. Peter Anvin <hpa@linux.intel.com>
Signed-off-by: Jiri Slaby <jslaby@suse.cz>
arch/x86/mm/ioremap.c