JAPANESE
Vertex AI チューニング RLHF
バーテックスエーアイ チューニング アールエルエイチエフ
KOREAN
Vertex AI 튜닝 RLHF
[ボテクス エイアイ ティュニン アルエルエイチエプ]
ハングル読み: 바텟쿠스에아이 추닌구 아루에루에이치에후
解説
Vertex AIで人間のフィードバックによる強化学習(RLHF)を使い、基盤モデルの出力を人間の好みに合わせて微調整する機能。報酬モデルの学習とポリシー最適化により、出力品質と安全性を向上させる。
Vertex AI에서 인간 피드백에 의한 강화 학습(RLHF)을 사용하여 기반 모델의 출력을 인간의 선호에 맞게 미세 조정하는 기능이다. 보상 모델 학습과 정책 최적화로 출력 품질과 안전성을 향상시킨다.
例文
RLHFチューニングで社内基準に合った回答スタイルにモデルを最適化し、品質スコアを30%改善した。
RLHF 튜닝으로 사내 기준에 맞는 응답 스타일에 모델을 최적화하여 품질 스코어를 30% 개선했다.