배치 크기(Batch Size)
개념
딥러닝 모델이 가중치($W$)와 편향($b$)을 한 번 업데이트(갱신)하기 위해 한꺼번에 “묶어서” 처리하는 훈련 데이터 샘플의 개수
예
만약 배치 크기가 1이라면: 모델은 이미지 1장을 보고, 예측하고, 틀린 정도(오차)를 계산한 뒤, 가중치를 1번 업데이트
만약 배치 크기가 60,000이라면: 모델은 60,000장 전체를 다 보고, 전체의 평균 오차를 계산한 뒤, 가중치를 단 1번만 업데이트