둘 다 columnar data format 인데

성능적인 면에서 차이가 남

 

 

파일 Write 성능 : (Parquet 보다) Orc 가 더 나은 성능

파일 Read 성능  : (Orc 보다) Parquet 이 더 나은 성능
출처: https://brocess.tistory.com/14

 

 

 

parquet 과 orc, json 등의 파일 포맷 간 성능 비교 자료

parquet 과 orc 각 컬럼 스키마에 따라 사이즈가 다르다는 게 눈에 들어옴

https://www.slideshare.net/HadoopSummit/file-format-benchmark-avro-json-orc-parquet

 

 

 

 

+ Recent posts