🔥码云GVP开源项目 12k star Uniapp+ElementUI 功能强大 支持多语言、二开方便! 广告
在处理大规模数据集时,在开发和修改查询的阶段,如果能在数据集的一小部分数据上试运行查询,会带来很多方便。 <br/> ```sql # 分桶抽样基本语法 select * from table_name tablesample(bucket x out of y on param) s; -- x:要从第x个分桶开始查询,x <= y; -- y:抽样比例,比如分桶总数为4,y=2,则抽取y=4/2=2个分桶; 如果分桶总数为4,y=8,则抽取y=4/8=1/2个分桶; 注意:y必须是分桶总数的倍数或因子。 -- param:可以是分桶表的一列或多列,或者是一个有返回值的函数,比如随机函数rand() -- s:表的别名 #### #### select * from bucket_4 tablesample(bucket 2 out of 8) s; #### 根据id列查询 ##### select * from bucket_4 tablesample(bucket 2 out of 48 on id) s; #### 根据整行随机抽样 #### select * from bucket_4 tablesample(bucket 2 out of 48 on rand()) s; ```