La inteligencia artificial ya responde mejor que muchos profesores de Derecho cuando los alumnos necesitan ayuda fuera de clase. En casi 3.000 comparaciones a ciegas, los docentes prefirieron a Gemini y NotebookLM el 75% de las veces

La inteligencia artificial ya responde mejor que muchos profesores de Derecho cuando los alumnos necesitan ayuda fuera de clase. En casi 3.000 comparaciones a ciegas, los docentes prefirieron a Gemini y NotebookLM el 75% de las veces

La inteligencia artificial lleva años demostrando que puede aprobar exámenes, resumir sentencias y redactar argumentos jurídicos. Lo que todavía no estaba tan claro era si podía hacer algo mucho más cotidiano: sentarse, metafóricamente, junto a un estudiante confundido y explicarle una cuestión difícil mejor que su propio profesor. Un nuevo estudio de la Facultad de Derecho de Stanford acaba de ofrecer una respuesta incómoda para el mundo académico. En casi 3.000 comparaciones realizadas a ciegas, profesores de Derecho eligieron las respuestas generadas por inteligencia artificial como las más beneficiosas para el aprendizaje en el 75% de los casos.

Según Stanford Law School , el trabajo fue dirigido por el profesor Julian Nyarko y comparó textos producidos por docentes con respuestas de Google Gemini 2.5 Pro y NotebookLM. Los modelos no se limitaron a contestar preguntas sencillas de memoria: debían explicar problemas jurídicos abiertos, con argumentos enfrentados y sin una única solución automática. Cuarenta preguntas reales y casi 3.000 duelos a ciegas El experimento comenzó con profesores de 14 facultades de Derecho estadounidenses. Ellos seleccionaron 40 preguntas representativas de las dudas que suelen plantear los alumnos de primer año durante las tutorías de Derecho contractual y redactaron sus propias respuestas.

Después, los investigadores formularon esas mismas preguntas a Gemini 2.5 Pro y NotebookLM. Las respuestas humanas y las generadas por IA fueron anonimizadas y enviadas a profesores de 16 facultades para que decidieran cuál ayudaría mejor al estudiante. Según Reuters , los evaluadores desconocían en todo momento si estaban leyendo a una persona o a un modelo. En esas comparaciones directas, las respuestas de IA fueron preferidas tres de cada cuatro veces y alcanzaron un rendimiento semejante al del profesor mejor valorado de todo el estudio.

La cifra sorprendió a los propios investigadores. Julian Nyarko explicó a Stanford que no se trataba de preguntas elementales con soluciones obvias, sino de cuestiones que exigían sintetizar doctrinas, reconocer matices y construir una explicación comprensible para alguien que todavía está aprendiendo. Las respuestas humanas fueron consideradas perjudiciales con más frecuencia El resultado más llamativo no estuvo únicamente en qué opción ganaba cada enfrentamiento. Los profesores también debían señalar cuándo una respuesta podía perjudicar el aprendizaje, por ejemplo, por ser confusa, incompleta o inducir a una interpretación equivocada.

De acuerdo con Reuters , menos del 4% de las respuestas generadas por IA recibió esa valoración negativa. Entre las redactadas por profesores, la proporción alcanzó el 12%, tres veces más. Esto no significa necesariamente que los modelos conocieran más Derecho que los docentes. Una posible explicación es que las herramientas produjeran respuestas más estructuradas, completas y adaptadas al tono de una tutoría, mientras algunos profesores contestaron de manera más breve o asumieron conocimientos previos que un alumno de primer curso todavía no tenía.

NotebookLM también contaba con una ventaja metodológica importante: puede responder utilizando materiales seleccionados como fuente, lo que reduce el riesgo de improvisar información ajena al temario. Gemini 2.5 Pro, por su parte, aportaba capacidades generales de razonamiento y redacción. No es una prueba de que los profesores hayan dejado de ser necesarios El titular más fácil sería afirmar que la IA ya enseña Derecho mejor que los humanos. El estudio, sin embargo, no llega tan lejos.

Los investigadores midieron la calidad percibida de respuestas escritas y relativamente cortas. No evaluaron la capacidad de un profesor para seguir el progreso de un alumno, detectar una confusión persistente, organizar una clase, estimular el debate o adaptar durante semanas una estrategia de aprendizaje. Tampoco demuestra que cualquier chatbot jurídico sea fiable. Stanford ha advertido en trabajos anteriores que el uso ingenuo de modelos lingüísticos en consultas legales puede producir alucinaciones y errores graves, especialmente cuando no se controla la documentación utilizada.

Alejandro Salinas, coautor del estudio, sostiene que el valor principal está en ofrecer ayuda bajo demanda y ampliar el acceso a una orientación de calidad. La propuesta no consiste en retirar al profesor, sino en proporcionar un tutor disponible cuando la consulta presencial ha terminado o el docente no puede responder inmediatamente. El debate ya no es si la IA puede responder, sino cómo debe utilizarse Las facultades de Derecho estadounidenses mantienen posturas muy distintas. Algunas están incorporando formación obligatoria en inteligencia artificial desde el primer año, mientras otras, como Berkeley, han endurecido sus reglas para limitar su uso en trabajos académicos.

Según Reuters , esa diferencia refleja el temor a que los estudiantes deleguen el razonamiento y pierdan capacidades que necesitarán en la práctica profesional. El estudio de Stanford no elimina esas preocupaciones. Sí desplaza el centro de la discusión. Si dos herramientas comerciales ya pueden producir tutorías consideradas más útiles que muchas respuestas humanas, prohibirlas por completo empieza a parecer tan problemático como utilizarlas sin supervisión.

La inteligencia artificial todavía no ha sustituido al profesor de Derecho . Pero acaba de demostrar que, para una de las tareas más habituales de la enseñanza (explicar una duda concreta de forma clara y rápida), ya puede sentarse a su lado y competir de igual a igual.