less than 1 minute read

모각코 2회차 목표 🎯

  1. RoBERTa와 같은 encoder 기반 모델이 텍스트의 통계적·구조적 패턴을 어떻게 학습하고, 이를 통해 AI 생성 여부를 판단하는지 이해한다.
  2. Tokenization, Chunking, Decision Logic을 포함한 AI 텍스트 탐지 추론 파이프라인 전체 흐름을 정리한다.
  3. 긴 문서를 처리할 때 발생하는 uncertainty를 줄이기 위한 chunk 기반 판정 및 threshold 전략의 필요성을 정리한다.



Leave a comment