Para que los grandes modelos se vuelvan más inteligentes, necesitan que las personas enseñen y gestionen: esta es la RL con intervención humana.
Recientemente hice una tarea en @JoinSapien, que consistió en revisar un proceso de razonamiento escrito por IA:
🌱 ¿Cómo piensa la IA? 🌱 ¿Es lógico? 🌱 ¿En qué paso comenzó a torcerse?
Esta tarea se llama evaluación CoT (Chain-of-Thought), yo soy su auditor lógico.
Además, está el Tree of Thoughts (árbol de pensamientos), donde la IA intentará múltiples ramas de ideas, y los humanos filtrarán cuál camino es el mejor.
En realidad, puedes tratarlo como si le estuvieras explicando un problema a un niño, pero este niño es un cerebro futuro de nivel GPT.
Este trabajo, la IA no puede hacerlo sola, la gente debe participar.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Para que los grandes modelos se vuelvan más inteligentes, necesitan que las personas enseñen y gestionen: esta es la RL con intervención humana.
Recientemente hice una tarea en @JoinSapien, que consistió en revisar un proceso de razonamiento escrito por IA:
🌱 ¿Cómo piensa la IA?
🌱 ¿Es lógico?
🌱 ¿En qué paso comenzó a torcerse?
Esta tarea se llama evaluación CoT (Chain-of-Thought), yo soy su auditor lógico.
Además, está el Tree of Thoughts (árbol de pensamientos), donde la IA intentará múltiples ramas de ideas, y los humanos filtrarán cuál camino es el mejor.
En realidad, puedes tratarlo como si le estuvieras explicando un problema a un niño, pero este niño es un cerebro futuro de nivel GPT.
Este trabajo, la IA no puede hacerlo sola, la gente debe participar.
@JoinSapien #sapien @KaitoAI # KaitoAI #SapienProtocol