モデルベンチマーク

KOREAN

모델 벤치마크

[モデルペンチマク]

ハングル読み: 모데루벤치마쿠

解説

AIモデルの性能を標準化されたタスクやデータセットで客観的に評価する手法。MMLU、HumanEvalなどのベンチマークが広く使用される。

AI 모델의 성능을 표준화된 태스크와 데이터셋으로 객관적으로 평가하는 기법. MMLU, HumanEval 등의 벤치마크가 널리 사용된다.

新モデルの導入前にモデルベンチマークを実施して、既存モデルとの精度差を定量的に比較しましょう。

신규 모델 도입 전에 모델 벤치마크를 실시해서 기존 모델과의 정확도 차이를 정량적으로 비교합시다.