눈가락
[IT] Orc vs Parquet 비교
눈가락
2022. 8. 10. 19:35
둘 다 columnar data format 인데
성능적인 면에서 차이가 남
파일 Write 성능 : (Parquet 보다) Orc 가 더 나은 성능
파일 Read 성능 : (Orc 보다) Parquet 이 더 나은 성능
출처: https://brocess.tistory.com/14
parquet 과 orc, json 등의 파일 포맷 간 성능 비교 자료
parquet 과 orc 각 컬럼 스키마에 따라 사이즈가 다르다는 게 눈에 들어옴
https://www.slideshare.net/HadoopSummit/file-format-benchmark-avro-json-orc-parquet