베이즈 정리를 사용한 확률 기반 분류기목적문장 X가 들어왔을 때이 문장이 긍정(1) 일 확률 vs 부정(0) 일 확률을 비교하는 것수식 P(c) = 사전확률(prior)→ 데이터 전체에서 긍정 리뷰가 얼마나 되는가?예)전체 리뷰 10만개 중긍정 7만 → P(긍정) = 0.7부정 3만 → P(부정) = 0.3즉, 원래부터 긍정이 많았는지, 부정이 많았는지 반영하는 값. P(X|c) = 우도(likelihood)→ 문장 X 안의 단어들이 클래스 c에서 등장할 확률예를 들어,긍정 리뷰에서는 “재밌다”가 자주 나오고부정 리뷰에서는 “지루하다”가 자주 나온다는 것.즉,해당 단어(들)가 그 클래스에서 얼마나 잘 나타나는지를 의미.이게 사실상 분류의 핵심. P(X) = 증거(evidence)→ 모든 클래스(긍/부정..