Reinforcement learning with human feedback (Q2177)

Training a model using human preferences

Language	Label	Description	Also known as
English	Reinforcement learning with human feedback	Training a model using human preferences	RLHF

Statements

0 references