Propiedad de datos y analítica web

Me gustó mucho esta reflexión de David Jennings en el marco de LAK12, el curso de analítica del aprendizaje que estoy haciendo:

What I like about Last.fm is that, notwithstanding the fact that all your data is public visible, it still feels like you own it. You can use your Last.fm id to do useful things like build your profile or your playlists and preferences on other music sites. You can get all sorts of clever and beautiful visualisations of your listening behaviour over time.

Why can’t you do the same with the data that Amazon, Google, Facebook and your VLE/LMS hold about you? Having data about your own learning behaviour would undoubtedly help you improve, enhance and augment that behaviour. Why can’t we do this already?

Uno de los grandes dilemas alrededor de la analítica del aprendizaje es la propiedad de los datos. En los primeros años de la disciplina, los datos estaban en los LMS, es decir, los sistemas de gestión del aprendizaje y estos, a su vez, eran propiedad de las empresas y las instituciones educativas que ofrecían los cursos. Hoy, muchos de los datos relativos al aprendizaje están en plataformas también cerradas pero que ahora son propiedad de empresas como Facebook, Tuenti, Twitter o Delicious.

Podríamos pensar que la solución es nunca tener nada en un servidor que no controlamos —una solución muy buena, por cierto— pero en el campo de la analítica esto no es suficiente porque su valor añadido viene precisamente de la agregación de estos datos que requiere de instalaciones muy distintas a un hosting propio. La pregunta clave parece ser no tanto quién es el propietario de los datos sino quién puede hacer analítica y poner los datos a trabajar.

Minería de datos en educación

Diferenciar entre minería de datos en educación y analítica del aprendizaje es uno de los propósitos del curso del que hablé ayer y que ha recibido el bonito código de LAK12.

Una definición de analítica del aprendizaje con la que me he encontrado en LAK12 es la siguiente:

La medición, recogida, análisis y presentación de datos sobre personas que están aprendiendo y sus contextos, con el propósito de comprender y optimizar el aprendizaje y los entornes en los que sucede.

Mientras que la minería de datos en la educación la definen así quienes la estudian:

La minería de datos en la educación es una disciplina emergente que desarrolla métodos para explorar los datos que vienen de entornos educativos, y los usa para entender mejor a los estudiantes y los entornos en los que aprenden.

En un primer vistazo apenas hay diferencia, ¿no?

En un texto que leí, supe más de la minería de datos en educación. Surgió del análisis de logs de la interacción estudiante-máquina y para sus métodos se inspira, entre otros, en la minería de datos y el aprendizaje automático, la psicometría y otros campos de la estadística, la infografía y los modelos computacionales.

Aplicaciones de la minería de datos en educación

  • Mejorar los modelos del estudiante. La minería de datos se ha usado, por ejemplo, para determinar si un estudiante truca el sistema o si está aburrido o frustrado en un curso online. Una versión más amplia de los modelos del estudiante va más allá del software educativo y se propone determinar, por ejemplo, los factores de los que depende si alguien va a abandonar sus estudios.
  • Descubrir y mejorar la estructura del conocimiento en un dominio.
  • Estudiar el apoyo pedagógico, por ejemplo mediante la descomposición del aprendizaje.
  • Buscar evidencia empírica para refinar o ampliar teorías o fenómenos educativos.

Suena a personotecnia ¿verdad? Me falta estudiar en más detalle las tendencias de los últimos años pero intuyo que de personotecnia habrá más y no menos también en educación. Intuyo que, frente a la minería de datos, la analítica del aprendizaje vaya por el camino de la personalización.

Mi interés en este curso está en cómo obtener y analizar los datos del aprendizaje informal y autodirigido con el fin de hacerlo mejor. En la primera charla que hemos tenido hoy, he creído percibir un interés parecido en muchas personas.

Analítica web en el ámbito del aprendizaje: un curso abierto en la Red

Me he apuntado a tres cursos abiertos en la Red que empezarán en los próximos meses. La primera es sobre analítica web aplicada al aprendizaje, es de una gente que se agrupa bajo el codename SOLAR (Society for Learning Analytics Research) y ha comenzado hoy.

La analítica necesariamente incluye el trabajo con big data. Por eso, me reconforta ver en la programación del curso que hablaremos de ética y privacidad. También me anima mucho que al menos uno de los organizadores, George Siemens, sea un firme defensor de los blogs frente a Facebook y Twitter para la presencia en la Red de las personas.

Siemens explica en el vídeo de introducción que no estaremos encerrados en un LMS (Sistema de Gestión del Aprendizaje): el curso será distribuido, con todos escribiendo en nuestros blogs. Esta insistencia en los espacios propios de cada persona no puede parecerme sino estupenda.

En su conjunto, las metas del curso me parecen sugerentes:

  • Describir qué es la analítica del aprendizaje y qué le diferencia de otros conceptos como la minería de datos aplicada a la educación o la analítica académica.
  • Analizar, planear y hacer un pequeño piloto de analítica del aprendizaje.
  • Desarrollar una matriz de herramientas destacadas de la analítica del aprendizaje y de las estrategias de analítica a las que sirve cada una.
  • Evaluar el estado actual de las tecnologías de analítica del aprendizaje y describir los beneficios y pegas de herramientas libres y herramientas privativas.
  • Evaluar y describir el papel de la web semántica y los datos conectados en los contenidos educativos de nueva generación.

Es posible que este curso me lleve a abrir una cuenta en Twitter y a postear en mi blog, en ocasiones, en inglés. Parece que también habrá interacción síncrona de frecuencia semanal usando Blackboard Collaborate.

Iré contando mis experiencias por aquí.