50%가 기준이라는게 재밌네. 아무것도 안 하는 수준이랑 같다는 거잖아 ㅋ 정비쪽에선 경험으로 찍어도 이것보다 성공률이 높을거같은데
학습에 몇분 걸린다는데 컴터 사양에 따라 많이 다른건지? GPU 없으면 훨씬 오래걸리나
용어 정리 표가 깔끔해서 좋아요. 이런 레퍼런스 카드 형식이 계속 참고하기 좋더라고요
체크포인트 읽고 훈련 정확도랑 테스트 정확도 차이가 아직 완전히 이해가안돼서 다시 읽어봤어요. 이 개념이 뒤에서 더 나오나요?
저도 처음엔 헷갈렸는데요. 행이 실제값이고 열이 예측값이라는 방향만 기억해두니까 나머지는 자연스럽게 따라오는 것 같더라고요. 완전히 맞는 이해인지는 모르겠지만
혼동 행렬이 처음에는 진짜 복잡해 보여서ㅠㅠ 대각선이 맞은 거고 나머지가 틀린 거라고 외워도 괜찮은 건가요? 아니면 더 깊게 이해해야 하는 건지
혼동 행렬 처음 봤을 때 행이 실제값이고 열이 예측값인지가 계속 헷갈렸는데 설명 보고 이해됬어요
별점을 확률 분포로 예측한다는 게 신기해요😮 이런 방식이 실제 쇼핑몰이나 배달 앱 리뷰 점수 예측에도 쓰이는 건가요?
위에 서열 척도 관련 질문 보고 저도 생각해봤는데요. 계량경제학에서도 순서형 변수를 연속형으로 가정하는 방법이 있는데, 엄밀히는 다르지만 성능이 충분히 나오면 실무에서 그냥 쓰기도 하는 것 같더라고요. 정확한 건 아닙니다
소프트맥스 확률로 별점 분포를 뱉는 구조는 납득이 됐는데, 클래스 5개가 서열 척도인데 그냥 다중분류로 처리하면 1점이랑 5점의 거리가 같아지는 문제가 안 생기나요?
테스트 데이터에 fit을 쓰면 안 된다는 규칙이 생각보다 중요한것 같습니다. 실수하기 쉬운 부분인데 짚어줘서 좋네요
정확도 기준은 태스크마다 달라서 90%라는 숫자보다 베이스라인 대비 개선폭이 더 의미있는 지표예요. 클래스 불균형 있을 땐 F1이나 AUC 같이 봐야 하고
베이스라인 대비 3배 정확도라는 게 인상적인데요. 실무에서 모델 도입할 때 얼마나 정확해야 사용 가능한 수준인지 기준이 있는건가요? 90% 이상이어야 하는 건지