最终一共产生了8个文件 , 结合 BloomFilter Skipping掉了7 个,效果非常明显 。
后续工作后续关于点查这块工作会重点关注 Bitmap 以及二级索引 。最后总结一下 DataSkipping 中各种优化技术手段的选择方式 。
- Clustering中各种排序方式需要结合 Column statistics 才能达到更好的效果 。
- BloomFilter 适合等值条件点查,不需要数据做排序,但是要选择高基字段,低基字段 BloomFIlter 用处不大;另外超高基也不要选 BloomFilter,产出的 BloomFilter 结果太大 。
【基于 Apache Hudi 极致查询优化的探索实践】
推荐阅读
- 14 基于SqlSugar的开发框架循序渐进介绍-- 基于Vue3+TypeScript的全局对象的注入和使用
- 【Python+C#】手把手搭建基于Hugging Face模型的离线翻译系统,并通过C#代码进行访问
- 基于Qt Designer和PyQt5的桌面软件开发--环境搭建和入门例子
- pr基于当前字幕新建字幕怎么用 PR如何新建视频字幕
- 图片如何水印化 图片如何使用水印
- 大众途锐是基于什么平台打造的 大众途锐是哪个平台
- 宾利添越是基于什么平台打造的 宾利添越是哪个平台打造的
- 宝马五系是什么平台 宝马5系是基于什么平台打造的
- 国产宝马3系是基于什么平台打造的 国产宝马3系是基于什么平台打造的车型
- 国产宝马1系是基于什么平台打造的呢 国产宝马1系是基于什么平台打造的