php中文网

百万数据量 MySQL 模糊搜索提速:如何在 512M 内存限制下优化查询速度?

php中文网

百万数据量 mysql 模糊搜索提速

在 mysql 中,当数据量达到百万级时,执行模糊查询可能会变得非常缓慢。本文提供的解决方案无需借助第三方中间件,即可在 512m 的 java 堆内存限制下显着提升模糊搜索的速度。

基于索引表的方案

创建一个索引表,包含三列:"当前词"、"下一词"和"原记录主键 id"。其中,"当前词"和"下一词"表示搜索关键词中的连续单词,"原记录主键 id"指向满足条件的原始记录。

索引表结构

当前词 下一词 原记录主键 id
mysql 1
1
1
1
... ... ...
1
1
1
null 1

搜索算法

搜索关键词时,按顺序查询索引表,获得满足每个单词条件的原记录id。然后使用这些 id 在原始表中查找匹配记录。

例:搜索“模糊搜索”

SELECT 原记录主键ID
  FROM (SELECT 原记录主键ID FROM 索引表 WHERE 当前词 = '模' AND 下一词 = '糊')
  JOIN (SELECT 原记录主键ID FROM 索引表 WHERE 当前词 = '糊' AND 下一词 = '搜') USING(原记录主键ID)
  JOIN (SELECT 原记录主键ID FROM 索引表 WHERE 当前词 = '搜' AND 下一词 = '索') USING(原记录主键ID)
  JOIN (SELECT 原记录主键ID FROM 索引表 WHERE 当前词 = '索' AND 下一词 IS NULL) USING(原记录主键ID)

jvm 优化

为了充分利用有限的内存,建议使用如下的jvm 优化技术:

  • 缩小永久代尺寸
  • 设置metaspace 垃圾回收参数(-xx:metaspacesize、-xx:maxmetaspacesize)
  • 使用压缩引用和指针
  • 启用分代垃圾回收

以上就是百万数据量 MySQL 模糊搜索提速:如何在 512M 内存限制下优化查询速度?的详细内容,更多请关注php中文网其它相关文章!