ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
:-: ![](https://img.kancloud.cn/94/b3/94b3dcb41a0a173c4dc9c44ba9b0b0e4_1150x538.png) 文件存储格式比较 **存储格式选择:** 写:一般写入时间并不是最重要 读: 1、Avro——查询随时间变化的数据集 2、Parquet ——适合在宽表上查询少数列 3、Parquet & ORC以牺牲写性能为代价优化读取性能 4、TextFile读起来很慢 <br/> **Hive 查询(快->慢):** ``` ORC -> Parquet -> Text -> Avro -> SequenceFile ```