传统上,我们在Spark中都使用 COUNT(DISTINCT XXX) 来实现去重计数,但最近发现在StarRocks中有利用bitmap来实现更高效去重的方案。
参考:使用 Bitmap 实现精确去重 1. 两种去重计数方法对比在 StarRocks SQL 中,有两种主要的去重计数方法: 方法一:传统 COUNT(DISTINCT)COUNT(DISTINCT if(resource_type = 'Tr***ixContent', orderid, NULL))方法二:Bitmap 去重BITMAP_UNION_COUNT(to_bitmap(if(resource_type = 'Tr***ixConte…。
全国咨询热线
+86 0000 88888
邮箱:admin@admin.com
手机:13988888888
电话:+86 0000 88888
地址:广东省广州市番禺经济开发区
Copyright © 2012-2023 某某博客 版权所有 备案号:青-ICP备93983500号-1|网站地图




