파이썬에서 숫자를 출력할 때 콤마(,)를 사용하여 자동으로 천 단위마다 쉼표를 넣고 싶다면 format() 함수를 사용할 수 있다.예를 들어 1234567을 출력할 때 1,234,567과 같이 출력하고 싶다면 다음과 같이 코드를 작성할 수 있다.number = 1234567formatted_number = "{:,}".format(number)print(formatted_number) # 1,234,567 출력 f-string을 사용하여 출력할 수도 있다.사실 이 방법이 좀더 직관적이고 성능이 빠르다고 알려져 있다.number = 1234567formatted_number = f"{number:,}"print(formatted_number) # 1,234,567 출력 메모할 겸 포스팅 남긴다.
이전 포스팅에서 살펴본 것처럼 list comprehension은 기본적으로 for문을 사용하여 리스트를 생성한다.자세한 내용은 아래 글에 나와있다. [Python] List Comprehension의 이해와 예제파이썬의 list comprehension은 리스트를 생성하기 위한 강력하고 간결한 방법을 제공한다.기본적으로 for문을 사용하여 리스트를 한 줄로 생성할 수 있게 해준다.이제 list comprehension의 기본적인 구조dykm.tistory.com파이썬에서는 리스트를 생성하거나 처리할 때 for문을 사용하지 않고도 다양한 방법을 사용할 수 있다.이번 포스팅에서는 for문을 사용하지 않은 list comprehension에 대해 알아보자.1. map 함수map 함수를 사용하여 리스트의 각 ..
파이썬의 list comprehension은 리스트를 생성하기 위한 강력하고 간결한 방법을 제공한다.기본적으로 for문을 사용하여 리스트를 한 줄로 생성할 수 있게 해준다.이제 list comprehension의 기본적인 구조와 예제를 살펴보자.List Comprehension의 기본 구조List comprehension의 기본 구조는 다음과 같다.[표현식 for 항목 in iterable]이 구조에서 각 요소에 대한 설명은 아래와 같다.표현식: 각 항목에 적용되는 계산이나 값을 나타냄항목: iterable(반복 가능한 객체)에서 가져온 요소를 나타내는 변수iterable: 리스트, 튜플, 문자열 등 반복 가능한 객체이제 예제를 통해 list comprehension에 대해 알아보자.예제몇 가지 예제를 ..
.npy 및 ,npz 파일 형식.npynpy파일은 NumPy 어레이를 저장하기 위한 기본 파일 형식이다.바이너리 형식으로 저장되어 읽기와 쓰기가 빠르고 메타데이터를 포함, 어레이를 정확하게 복원할 수 있다..npznpz 파일은 여러 개의 npy 파일을 하나의 압축된 파일로 묶어 저장하는 형식이다.여러 개의 배율을 효율적으로 저장하고 불러올 수 있다..npy및 .npz 파일의 압축 및 해제 방법.npy 파일 저장 및 불러오기.npy 파일 저장import numpy as np# 데이터 생성array = np.arange(10)# NPY 파일로 저장np.save('array.npy', array).npy 파일 불러오기import numpy as np# NPY 파일에서 데이터 로드loaded_array = n..
파일과 디렉토리를 아카이브하고 압축하는데 사용하는 tar와 tar.gz 방법에 대해 알아보자.tar와 tar.gz의 특징 및 차이tar (.tar)tar (Tape Archive는 파일과 디렉토리를 하나의 아카이브 파일로 묶는 데 사용한다.압축 기능은 없지만, 여러 파일과 디렉토리를 하나의 파일로 묶어 백업이나 전송하는데 쓸 수 있다.혹은 소스 코드나 여러 구성 파일을 하나의 파일로 묶어 배포하는 데 사용한다.tar.gz (.tar.gz)tar와 gzip을 결합하여 파일을 아카이브하고 압축하는 방법으로 여러 파일과 디렉토리를 하나의 tar 아카이브로 묶고 gzip으로 압축하는 것이다.즉, 이 방법은 tar로 아카이브한 파일의 용량을 줄이는데 사용한다.1. 압축 해제# tar 파일 해제tar -xvf ar..
gzip (.gz)특징주로 단일 파일 압축에 사용속도가 빠르고 압축률이 좋음원본 파일을 삭제하고 압축 파일로 대체하는 것이 기본 동작사용 방법# 파일 압축 (원본 파일 삭제)gzip filename.txt# 압축 해제gzip -d filename.txt.gz파일을 유지하면서 압축하려면-k 옵션 사용: 원본 파일 유지# 원본 파일 유지하며 압축gzip -k filename.txtbzip2 (.bz)특징gzip보다 더 높은 압축률 제공압축 속도는 gzip보다 느림주로 단일 파일 압축에 사용원본 파일을 삭제하고 압축 파일로 대체하는 것이 기본 동작사용 방법# 파일 압축 (원본 파일 삭제)bzip2 filename.txt# 압축 해제bzip2 -d filename.txt.bz2파일을 유지하면서 압축하려면-k옵션..
데이터 전처리 (Data Preprocessing)데이터 전처리는 머신러닝 모델을 훈련하기 전에 데이터를 준비하는 과정이다.전처리를 거치지 않은 원시(raw) 데이터는 머신러닝 모델 학습에 적합한 형태로 되어 있지 않기 때문에 데이터 전처리 과정이 필요하다.이 과정은 데이터를 분석하고 정제하여 모델이 이해할 수 있는 형태로 변환하는 것을 포함한다.데이터마다 특성이 다르기 때문에 데이터 전처리 과정은 데이터마다 다르지만 보통 다음과 같은 과정을 따른다.데이터 수집 (Data Collection):프로젝트 목적에 맞는 데이터를 수집한다. 이는 주로 데이터베이스, 파일, API, 웹 크롤링 등을 통해 이루어진다.데이터의 양과 품질을 고려하여 데이터를 수집하고 필요한 경우 데이터를 정제한다.데이터 탐색 및 이해..
머신러닝 모델을 학습시키는 과정엔 다양한 하이퍼파라미터가 있다.그 중에서도 배치 사이즈(batch size)는 중요한 역할을 한다.이번 포스팅에서는 배치 사이즈가 무엇이고 배치 사이즈를 작게 하거나 크게 했을 때의 효과를 예시 코드를 통해 알아보자.그리고 배치 사이즈를 어떻게 선택해야하는지도 알아보자.Batch size (배치 사이즈)배치 사이즈는 머신러닝에서 모델을 훈련시킬 때 사용되는 데이터의 묶음 크기를 나타내는 개념이다.훈련 데이터셋을 작은 묶음으로 나누어 모델에 순차적으로 제공하는 방식을 사용하는데, 이때 각 묶음의 크기가 바로 배치 사이즈이다. 배치 사이즈는 주로 확률적 경사 하강법(SGD) 및 미니 배치 경사 하강법과 같은 최적화 알고리즘에서 사용된다.이 방법은 전체 데이터셋을 한 번에 처리..
RecursionError: maximum recursion depth exceeded는 파이썬에서 재귀 호출의 깊이 제한을 초과했을 때 발생하는 에러이다.파이썬은 기본적으로 재귀 호출의 깊이에 제한을 두고 있으며, 이 한계를 초과하면 해당 에러가 발생한다.일반적으로 파이썬은 재귀 호출의 최대 깊이를 1000으로 제한하고 있다.이러한 제한은 스택의 한계를 넘어갔을 때, 스택 오버플로우를 방지하기 위한 것이다.깊은 단계의 재귀 호출이 필요한 경우, 이 한계를 조절할 수 있다.하지만 주의를 기울여야 하는데 이유는 크게 세 가지로 나눌 수 있다.스택 오버플로우재귀 호출은 호출 스택을 사용한다.스택은 제한된 메모리를 사용하며, 깊은 재귀 호출을 하면 스택이 넘치는 스택 오버플로우가 발생할 수 있다.스택 오버플로..
이전 포스팅에서 이항계수를 계산할 때 재귀함수를 사용하는 방법과 약간의 문제점을 살펴봤다. [Python] 재귀 함수와 예제(팩토리얼, 이항계수 계산)재귀 함수 재귀 함수는 함수가 자기 자신을 호출하는 프로그래밍 기법이다. 이는 어떤 문제를 해결할 때 그 문제를 더 작은 부분 문제로 나누고, 각 부분 문제를 해결함으로써 전체 문제를 해결dykm.tistory.com 재귀 함수를 사용한 이항계수를 구하는 코드와 문제점은 다음과 같다.class BinomialCoefficientCalculator: def calculate(self, n, k): # 기저 조건: k가 0이거나 k가 n과 같을 때 if k == 0 or k == n: return 1 ..