🔥码云GVP开源项目 12k star Uniapp+ElementUI 功能强大 支持多语言、二开方便! 广告
## 问题 现在有50亿个电话号码,现有10W个电话号码,要快速准确判断这些电话号码是否存在? 1. 通过数据库查询:实现快速有点难; 2. 数据预放在集合中:50亿 * 8字节 ==40GB(内存浪费或不够); 3. hyperloglog:准确有点难; ## 相似的问题还有很多 1. 垃圾邮件过滤 2. 文字处理软件(例如Word)错误单词检测; 3. 网络爬虫重复URL检测; 4. Hbase行过滤;