La integración de herramientas basadas en inteligencia artificial (IA), en particular los asistentes de voz, en la enseñanza de la pronunciación de las lenguas extranjeras se ha consolidado en los últimos años como una línea de innovación educativa de notable relevancia. Esta tendencia responde a la necesidad de mejorar una destreza tradicionalmente infravalorada en el aula, pese a su impacto directo en la comunicación oral y en la participación social de las personas aprendientes. El interés por estas herramientas se explica por la expansión de las tecnologías del habla en contextos educativos digitalizados y por la búsqueda de estrategias que permitan ampliar las oportunidades de práctica oral más allá del tiempo lectivo.
Desde el punto de vista curricular, la pronunciación ocupa un lugar reconocido en los principales marcos de referencia para la enseñanza de lenguas. El Marco Común Europeo de Referencia (MCER) incluye la competencia fonológica dentro de la competencia lingüística y describe aspectos como la articulación de los sonidos, el control del acento y la entonación (Consejo de Europa, 2002). De manera complementaria, el Plan Curricular del Instituto Cervantes (PCIC) concreta objetivos progresivos para la fonética y la prosodia en Español como Lengua Extranjera, adaptados a los distintos niveles de dominio (Instituto Cervantes, 2006). Sin embargo, este reconocimiento normativo no siempre se traduce en una práctica sistemática en el aula.
Como diversos estudios han señalado, la pronunciación suele abordarse de forma puntual, mediante ejercicios descontextualizados o correcciones esporádicas, lo que limita el desarrollo de una competencia fonológica sólida (Padilla García, 2007). Entre los factores que explican esta situación se encuentran la complejidad técnica de la fonética, la percepción de que su enseñanza requiere una formación especializada y la tendencia a priorizar contenidos considerados más fácilmente evaluables, como la gramática o el léxico.
Esta atención limitada a la pronunciación tiene consecuencias directas en la experiencia comunicativa del alumnado. Las dificultades persistentes en la articulación de determinados sonidos o en el manejo del ritmo y la entonación afectan a la inteligibilidad del discurso y, por tanto, a la eficacia de la interacción oral. En este contexto, la investigación contemporánea propone redefinir los objetivos de la enseñanza de la pronunciación, desplazando el foco desde la imitación del modelo nativo hacia la inteligibilidad (grado de coincidencia entre lo dicho y lo entendido) y la comprensibilidad (esfuerzo necesario para comprender un mensaje) (Munro & Derwing, 2015).
Este cambio de enfoque permite establecer metas más realistas y pedagógicamente pertinentes, especialmente en contextos plurilingües donde la diversidad de acentos forma parte de la norma comunicativa. La relevancia de este planteamiento se ve reforzada por estudios que muestran cómo la percepción del acento extranjero está mediada por factores sociales y actitudinales. La evaluación de la competencia oral de las personas no nativas puede verse influida por prejuicios y estereotipos, incluso cuando su producción es plenamente inteligible (Kang & Rubin, 2014). En consecuencia, una enseñanza de la pronunciación orientada a la inteligibilidad contribuye no solo a mejorar la comunicación, sino también a promover una concepción más inclusiva del aprendizaje de lenguas, en la que la diversidad lingüística se entiende como un valor y no como un déficit.
En este marco, determinados enfoques metodológicos ofrecen herramientas útiles para abordar la pronunciación de manera más integrada. El método verbo-tonal, por ejemplo, parte de la premisa de que la percepción precede a la producción, de modo que para pronunciar correctamente es necesario aprender primero a percibir los contrastes fonéticos relevantes en la lengua meta (Renard, 1971). Este enfoque prioriza los rasgos suprasegmentales, como el ritmo y la entonación, y propone actividades de sensibilización auditiva que se integran progresivamente en tareas comunicativas. En el ámbito del ELE, este planteamiento resulta especialmente pertinente para abordar dificultades recurrentes derivadas de la interferencia entre la lengua o lenguas de partida y el español, como la realización de las vibrantes o los patrones de entonación interrogativa y declarativa (Padilla García, 2007). Al situar la pronunciación dentro de un marco comunicativo, se favorece una mejora gradual de la inteligibilidad del habla sin recurrir a prácticas mecánicas desvinculadas del uso real de la lengua.
La aparición de herramientas basadas en inteligencia artificial se inserta en este contexto como un recurso potencialmente complementario. En el ámbito de la enseñanza de lenguas, la IA se ha aplicado con especial intensidad a la producción escrita, mediante sistemas de corrección gramatical o generación de textos. En lenguas como el inglés, se han documentado experiencias con asistentes de voz que promueven la práctica oral autónoma y contribuyen a la mejora de la pronunciación, al ofrecer entornos de interacción simulada (Alharti, 2024). En ELE, sin embargo, la integración de estas tecnologías en el trabajo sistemático de la oralidad ha sido más limitada, lo que justifica la pertinencia de explorar su potencial pedagógico (Blanco Pena, 2024).
Las herramientas basadas en reconocimiento automático del habla permiten a los aprendientes interactuar con sistemas que procesan su producción oral y responden en función de su comprensión del mensaje. Aunque esta retroalimentación no equivale a una evaluación fonética detallada, sí ofrece una señal clara de si el discurso ha sido inteligible para el sistema. Desde una perspectiva didáctica, este funcionamiento puede compararse con una situación comunicativa real en la que la persona interlocutora solicita una reformulación cuando no ha entendido completamente el mensaje. De este modo, la tecnología actúa como un mediador que pone de relieve la dimensión comunicativa de la pronunciación y favorece la toma de conciencia sobre la necesidad de ajustar la producción oral al contexto de interacción.
Entre los beneficios pedagógicos asociados al uso de asistentes de voz se encuentra, en primer lugar, la ampliación del tiempo de práctica fuera del aula, un aspecto especialmente relevante en contextos no inmersivos. En segundo lugar, estas herramientas favorecen la personalización del aprendizaje, ya que cada persona puede practicar a su propio ritmo y centrarse en los aspectos que le resultan más problemáticos. En tercer lugar, el entorno de práctica informal puede contribuir a reducir la ansiedad asociada a la producción oral, lo que resulta particularmente relevante para personas que experimentan inseguridad al hablar en una lengua extranjera. A ello se añade el desarrollo de estrategias de autocorrección, ya que la necesidad de reformular el mensaje cuando no es comprendido por el sistema promueve una reflexión metalingüística sobre la propia producción.
No obstante, el potencial de la IA en la enseñanza de la pronunciación debe valorarse teniendo en cuenta sus limitaciones técnicas y pedagógicas: los sistemas actuales presentan dificultades para evaluar con precisión los rasgos suprasegmentales, que son determinantes para la comprensibilidad del discurso. Además, la retroalimentación ofrecida suele ser implícita y no siempre explica las causas de los errores, lo que hace imprescindible la mediación del profesorado para orientar el proceso de aprendizaje (Munro & Derwing, 2015). A estas limitaciones se suman el desigual acceso a la tecnología, ya que la brecha digital puede restringir el uso de estas herramientas en determinados contextos educativos, así como cuestiones relativas a la privacidad y al tratamiento de los datos de voz.
En conclusión, la evidencia disponible demuestra que la integración de este tipo de herramientas, a pesar de sus limitaciones, presentan grandes ventajas para los aprendientes de lenguas extranjeras que pueden paliar las carencias que la enseñanza de la fonética en ELE presenta. Los asistentes de voz amplían las oportunidades de práctica oral y favorecen que la enseñanza se oriente hacia la inteligibilidad. Sin embargo, la implementación de estos recursos en el aula no exime de la presencia de un docente encargado de orientar y potenciar el aprendizaje ya que la IA no debe entenderse como un sustituto, sino como un recurso complementario que, de ser utilizado de manera responsable, puede enriquecer la enseñanza de idiomas y promover una competencia comunicativa eficaz e inclusiva.
Asignatura: Tesis doctoral

