如何在高可搜索性下存储庞大键值对数据?
通常,海量键值对数据需要存储在表格化的关系型数据库中。但是,随着数据量的增加,搜索效率会急剧下降。本文介绍了一种表结构,可以有效地存储和搜索键值对数据。
表结构
主表:
- rel_id (int): 关系记录 ID
- obj_id (int): 对象 ID
- prop_id (int): 属性 ID
- val_type (int): 值类型
对象描述表:
- obj_id (int): 对象 ID
- obj_desc (string): 对象描述
属性描述表:
- prop_id (int): 属性 ID
- prop_desc (string): 属性描述
值类型表:
- rel_id (int): 关系记录 ID
- val_???? (对应类型的字段): 值
例如,值为 42 的长度属性存储为:
- 主表:1,1,1,2
- 属性描述表:1,"长度"
- 值是整数的表:1,42
搜索
通过在主表上创建索引,可以快速查找与给定对象 ID 和属性 ID 关联的键值对。可以通过连接值类型表检索特定类型的值。
优点
- 无限可扩展:可以使用多个值类型表来处理不同类型的值。
- 高搜索效率:索引允许快速查找数据。
- 可随时间变化:属性和值可以随着时间的推移而添加或删除。
缺点
- 单值存储:每个键值对只能存储单个值。
- 复杂性:需要多个表来存储数据。
对比维基数据
维基数据使用 JSON 来存储属性值,这可能会影响搜索效率。相比之下,本文介绍的表结构通过将属性和值存储在独立的表中,优化了搜索性能。
以上就是如何高效存储和搜索海量键值对数据?的详细内容,更多请关注php中文网其它相关文章!
版权声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系 yyfuon@163.com