둘 다 columnar data format 인데
성능적인 면에서 차이가 남
파일 Write 성능 : (Parquet 보다) Orc 가 더 나은 성능
파일 Read 성능 : (Orc 보다) Parquet 이 더 나은 성능
출처: https://brocess.tistory.com/14
parquet 과 orc, json 등의 파일 포맷 간 성능 비교 자료
parquet 과 orc 각 컬럼 스키마에 따라 사이즈가 다르다는 게 눈에 들어옴
https://www.slideshare.net/HadoopSummit/file-format-benchmark-avro-json-orc-parquet

'눈가락' 카테고리의 다른 글
[GIT] The source branch is n commits behind the target branch 경고 해결 방법 (0) | 2022.11.17 |
---|---|
[IT] 빅데이터 필드 기술질문 대비 적어두는 것들 (0) | 2022.08.26 |
[Pig Latin] 데이터 타입 확인 및 변경하는 방법 (0) | 2022.03.08 |
[JAVA] Date Format 설명과 예제 (0) | 2021.09.30 |
[Regex] 정규표현식 연습 예제 (0) | 2021.05.16 |