JAPANESE

Vertex AI チューニング RLHF

バーテックスエーアイ チューニング アールエルエイチエフ

KOREAN

Vertex AI 튜닝 RLHF

[ボテクス エイアイ ティュニン アルエルエイチエプ]

ハングル読み: 바텟쿠스에아이 추닌구 아루에루에이치에후

解説

Vertex AIで人間のフィードバックによる強化学習(RLHF)を使い、基盤モデルの出力を人間の好みに合わせて微調整する機能。報酬モデルの学習とポリシー最適化により、出力品質と安全性を向上させる。

Vertex AI에서 인간 피드백에 의한 강화 학습(RLHF)을 사용하여 기반 모델의 출력을 인간의 선호에 맞게 미세 조정하는 기능이다. 보상 모델 학습과 정책 최적화로 출력 품질과 안전성을 향상시킨다.

例文

RLHFチューニングで社内基準に合った回答スタイルにモデルを最適化し、品質スコアを30%改善した。

RLHF 튜닝으로 사내 기준에 맞는 응답 스타일에 모델을 최적화하여 품질 스코어를 30% 개선했다.