Configuración y solución de problemas para el proyecto Text2Reward
Guía técnica para Text2Reward
Configuración del entorno
Para iniciar, crea un entorno Conda con Python 3.8:
conda create -n entorno_rl python=3.8
conda activate entorno_rl
Instala las dependencias necesarias, incluyendo PyTorch y las bibliotecas específicas del proyecto:
pip install torch==1.13.1+cu116 --extra-index-url https://download.pytorc ...
Publicado el 6-2 18:24