JAPANESE
データ汚染検出
データおせんけんしゅつ
KOREAN
데이터 오염 검출
[テイト オヨム コムチュル]
ハングル読み: 데타오센켄슈츠
解説
LLMの学習データやベンチマークデータにテストデータが混入していないかを検証する技術。評価結果の信頼性を確保するために不可欠なプロセスであり、公正なモデル比較の前提となる。
LLM의 학습 데이터나 벤치마크 데이터에 테스트 데이터가 혼입되어 있지 않은지를 검증하는 기술이다. 평가 결과의 신뢰성을 확보하기 위해 불가결한 프로세스이며 공정한 모델 비교의 전제가 된다.
例文
データ汚染検出を実施して、ベンチマークスコアが過大評価されていないか確認した。
데이터 오염 검출을 실시하여 벤치마크 점수가 과대 평가되고 있지 않은지 확인했다.