프로그래밍/Python

[Python] 이진 파일로부터 int array 읽어 들이는 3가지 방법 성능 비교

채윤아빠 2021. 4. 29. 22:30

728x90

앞 글에 이어서 "이진 파일로부터 int array 읽어 들이는 3가지 방법들"간의 성능을 비교해 보도록 하겠습니다.

세 방법간 성능 비교를 위하여 아래와 같은 코드를 작성하였습니다.

"cam-20220503_1255.mp4.idx"에는 int32 정수값이 18,001여개가 들어 있는 이진파일입니다.

# comparision load int array

import timeit

setup = """
import numpy as np
import os
import struct

# index has 18000 int32
video_file_name = 'cam-20220503_1255.mp4'

video_index_file = open(f'{video_file_name}.idx', 'rb')
video_index_file.seek(0, os.SEEK_END)
file_size = video_index_file.tell()
total_frame_count = int(file_size / 4)
"""

result1 = timeit.timeit("""
video_index_file.seek(0, 0)

frame_index_list = list()
frame_count = 0
for index in range(total_frame_count):
    frame_index_bytes = video_index_file.read(4)
    if (frame_index_bytes == None):
        break
    (frame_index, ) = struct.unpack('=i', frame_index_bytes)
    frame_index_list.append(frame_index)
    frame_count += 1
""", setup = setup, number = 3000)


result2 = timeit.timeit("""
video_index_file.seek(0, 0)
data_bytes = video_index_file.read()
frame_list = struct.unpack(f'={total_frame_count}i', data_bytes)
""", setup = setup, number = 3000)


result3 = timeit.timeit("""
video_index_file.seek(0, 0)
data_bytes = video_index_file.read()
frame_list = np.frombuffer(data_bytes, np.int32)
""", setup = setup, number = 3000)

print(f'result1 = {result1}')
print(f'result2 = {result2}')
print(f'result3 = {result3}')

위와 같은 성능비교 예제를 실행한 결과는 다음과 같습니다.

result1 = 11.304136499999998
result2 = 0.5849311000000004
result3 = 0.05164079999999949

당연하게도 첫 번째 방법은 매번 리스트 마지막에 새로 읽어들인 int 값을 추가하기 때문에 가장 성능이 좋지 않습니다.

두 번째 방법은 동일하게 struct.unpack() 함수를 이용하지만, 개수를 지정하여 반환받는 방법인데, 첫 번째 방법보다는 월등하게 빠릅니다.

마지막 세 번째 방법은 numpy.frombuffer() 함수를 이용하는 방법인데, 가장 빠릅니다. 아무래도 배열을 다루는데 최적화된 패키지다보니 최적의 성능을 보여줍니다. 배열 관련해서는 당연하게도 numpy를 애용해야할 것 같습니다.

참고자료

"How can I make a numpy ndarray from bytes?":https://stackoverflow.com/questions/47637758/

저작자표시

'프로그래밍 > Python' 카테고리의 다른 글

[python] str.find()와 str.index() 함수의 차이 (0)	2021.05.13
[python] int를 byte로 변환하는 방법 (how to convert int to bytes) (0)	2021.05.12
[Python] 이진 파일로부터 int array 읽어 들이는 3가지 방법들 (0)	2021.04.28
TypeError: Boolean value of this clause is not defined 해결하기 (0)	2021.04.27
파이썬의 장점 / 단점 (0)	2021.04.21

현재글[Python] 이진 파일로부터 int array 읽어 들이는 3가지 방법 성능 비교

참여 프로젝트, 라즈베리파이, freebsd, 파이썬, 레드마인, delphi, 델파이, 포트폴리오, Redmine, raspberrypi, 서산시, jetson-stats, 따릉이, 엑셀, Python, jtop, wininet, CentOS, javascript, 태그를 입력해 주세요.,

Today :
Yesterday :

채윤이네집

[Python] 이진 파일로부터 int array 읽어 들이는 3가지 방법 성능 비교

참고자료

'프로그래밍 > Python' 카테고리의 다른 글

'프로그래밍/Python'의 다른글

티스토리툴바

« 2024/12 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

[Python] 이진 파일로부터 int array 읽어 들이는 3가지 방법 성능 비교

참고자료

'프로그래밍 > Python' 카테고리의 다른 글

'프로그래밍/Python'의 다른글

관련글

티스토리툴바