JAPANESE
モデルベンチマーク
モデルベンチマーク
KOREAN
모델 벤치마크
[モデル ペンチマク]
ハングル読み: 모데루벤치마쿠
解説
AIモデルの性能を標準化されたタスクやデータセットで客観的に評価する手法。MMLU、HumanEvalなどのベンチマークが広く使用される。
AI 모델의 성능을 표준화된 태스크와 데이터셋으로 객관적으로 평가하는 기법. MMLU, HumanEval 등의 벤치마크가 널리 사용된다.
例文
新モデルの導入前にモデルベンチマークを実施して、既存モデルとの精度差を定量的に比較しましょう。
신규 모델 도입 전에 모델 벤치마크를 실시해서 기존 모델과의 정확도 차이를 정량적으로 비교합시다.