지수함수 갑자기 나와서 어려워졌는데, 이 수식을 꼭 이해해야 하는건지 아니면 걍 쓸줄만 알면 되는건지
이 계산 시각화 덕에 증폭 개념 바로 이해됐어요
소프트맥스 수식은 구현보다 개념만 이해하면 되는 거죠?
지수 함수 거치면 차이가 증폭된다는 게 핵심인데, logit 값이 너무 크면 수치 불안정(numerical instability) 문제가 생기는데 실습에서 이 부분은 다루나요?
확률로 만든다는게 이해는 가는데, 실제 앱에서 이 숫자가 어떻게 쓰이는 거야? 쇼핑몰 별점이 4.2점 이런거잖아, 이런게 다 이렇게 계산되는 건지?
이 히트맵이 진짜 직관적이에요. 어떤 단어가 어떤 클래스를 지지하는지 색상으로 보여주다니, 이게 데이터 시각화의 진수가 아닐까 싶어요
히트맵에서 특정 단어가 특정 별점과 연관되는 패턴이 드러나는 점이 흥미롭습니다. 다만 '지지한다'는 표현에서 이것이 인과적 관계인지 단순 상관인지를 구분하는 것이 중요하지 않을까요
이 히트맵 신기해요 ㅋㅋ
점수 차이가 지수적으로 증폭된다는 게 디자인의 '대비(contrast)' 효과랑 비슷한 원리인것 같아서 재밌었어요
확률값이 가장 높은 클래스를 예측으로 삼는 논리는 명확합니다. 다만 어떤 기준으로 그 확률값을 '충분하다'고 판단하는지, 그 기준의 정당성은 어디서 나오는지가 궁금합니다. 이는 기술적 문제가 아니라 의사결정의 철학적 문제와 연결되는 것 같습니다
점수가 확률로 바뀌는 과정이 신기해요. 의료 AI에서 진단 결과를 퍼센트로 보여줄 때 이런 방식으로 계산하는건지 궁금했는데, 실제로 이렇게 동작하는 건가요?
저도 비슷한 의문이 있었는데, 제 이해로는 선형 회귀랑 본질적으로 비슷한 것 같더라고요. 다만 입력이 숫자 벡터로 변환된 형태라는 차이가 있는 것 같고요. 정확한 이해인지는 모르겠지만 그렇게 연결지어서 이해했어요
선형 모델이라는 단어는 들어봤는데 이렇게 구체적으로 파고드는 건 처음이라 낯설었는데요. 경영통계에서 회귀분석 배웠는데 그거랑 연결되는 건가요?
앞레슨에서 벡터화까지 했으니까 여기서 선형 모델로 이어지는 건 자연스러운데, 선형 모델만으로 별점 5단계 구분이 실제로 가능한건지 좀 의문이 들더라고요
위에 이진값 관련 질문이 있어서 저도 생각해봤는데요. 경제학에서 더미변수(0/1)를 쓸 때랑 비슷한 상황인 것 같더라고요. 빈도 정보를 버리면 "얼마나 자주"라는 정보가 사라지니까 성능에 영향을 줄 것 같긴 한데, 확실하지는 않습니다
0인 단어가 가중치랑 무관하다는 건 이해했는데, 그러면 단어 빈도 대신 등장 여부(이진값)만 써도 결과가 비슷하게 나오는 건가요? 아니면 빈도 자체가 중요한건지
로짓 설명 짧게 정리돼 있어서 좋네요
로짓이라는 용어가 생소해서 따로 검색해봤는데요. 소프트맥스 전에 이 단계가 있다는 걸 모르고 그냥 넘어갔을 것 같아요. 용어 설명 있어서 다행이었어요