Nos proponemos analizar sobre un nuevo
entorno virtual de aprendizaje basado en Google Apps que desarrollaron unos
investigadores. Para evaluar la incidencia de la utilización de este nuevo
entorno en las calificaciones de los estudiantes, durante dos años se realiza
un estudio de caso con dos grupos de estudiantes: un grupo de control que
utiliza Moodle y un grupo experimental que utiliza Google Apps.
En la ejecución de esta actividad
realizaremos una introducción al paquete de análisis de datos R. Con el
objetivo de familiarzarnos con la interfaz de RStudio y los comandos de R a
través de un ejemplo en el que realizaremos las siguientes operaciones:
1. Carga de datos
2. Filtrado de datos
3. Análisis de diferencias entre grupos
mediante t-student
1. Carga de Datos:
Descargamos el fichero de datos con el que
vamos a trabajar:
https://www.dropbox.com/s/mz6ezs68i05bimz/Notas-2grupos-v1.csv?dl=0 El fichero es un archivo CSV con una estructura tabulada. Como se observa
en el fichero consta de 40 estudiantes de los cuales 20 utilizan un entorno
Moodle y 20 utilizaron entorno Google Apps durante el año. En estos datos figuran
la calificación final y el tamaño de la red personal de cada estudiante.
Abrimos la interfaz Rstudio y cargamos el
fichero de datos.
Luego se abre una ventana en cuya parte derecha se
muestra, por un lado, el contenido del fichero de texto que deseamos cargar, y
por otro lado, la estructura de datos que se va a cargar en R a partir de dicho
contenido según las opciones indicadas en la parte izquierda de ventana. Para
que la creación de la estructura de datos se realice de forma correcta, debemos
indicar a través de dichas opciones si el contenido del fichero de datos
incluye una cabecera, cuál es el separador utilizado entre variables, cuál es
el carácter utilizado para separar la parte entera de la parte decimal de un
número, etc.
Si el proceso se realiza correctamente, la estructura de
datos debería aparecer representada en una nueva cuadrícula. El entorno queda
compuesto de 4 cuadrículas.
2. Filtrado de datos
Para filtrar los sujetos por tipo grupo, escribimos los
siguientes comandos en la consola R.
> datosMoodle
<-subset(Notas.2grupos.v1, grupo=="Moodle")
>
datosGoogleApps <-subset(Notas.2grupos.v1, grupo=="Google Apps")
Al ejecutar estos dos comandos, se
crearan dos variables: datosMoodle
y datosGoogleApps.
3. Análisis de diferencias entre grupos mediante
t-student
Ejecutamos el comando para
realizar el test de t de student.
> t.test(datosMoodle$nota, datosGoogleApps$nota)
> t.test(datosMoodle$nota, datosGoogleApps$nota)
Y obtenemos los resultados del análisis:
Aquí vemos claramente, P-value=0.007427= 0.7427% por
lo que el riesgo a equivocarnos es menor que 5%. P-value, indica que el riesgo a equivocarnos al afirmar que existe
una diferencia estadísticamente significativa ambos grupos debido al factor
diferenciar es de: 0.007427 lo que sería un 0.7427% de posibilidades. Existe de
un porciento de equivocación.
Por lo tanto, llegamos a la siguiente conclusión, a lo que respecta a la
calificación final de ambos grupos de estudiantes que utilizan GoogleApps y
Moodle.
·
En
el estudio concreto no se percibe una diferencia significativa entre los
valores de las medias de cada grupo.
·
Por lo
tanto, la diferencia entre las calificaciones de los estudiantes de uno y otro grupo
es estadísticamente significativa.
Análisis Año 2
Realizamos el mismo procedimiento que el anterior:
Descargamos el fichero de datos con el que vamos a
trabajar. https://www.dropbox.com/s/vc2lht7wqtshq5p/Notas-2grupos-v2.csv?dl=0.
El fichero es un archivo CSV con una estructura
tabulada. Tal como se observa, este fichero consta con los datos de 40
estudiantes de los cuales 20 utilizaron un entorno Moodle y 20 utilizaron un
entorno Google Apps durante el 2do. Años. Entre los datos figuran el grupo o
entorno y la calificación final de cada estudiante.
Filtrado de datos
Para filtrar los sujetos por tipo grupo, escribimos los
siguientes comandos en la consola R. Nota:
Existe una variación al introducir el archivo suministrado del año 2, nos damos
cuenta que el separador que contiene la columnas es el signo (#), el cual
R-studio no lo contempla en la interfaz inicial del Importa Dataset.
Se procede a modificar el separador por la ejecución de una línea comando.
Ahora procedemos a filtrar los datos.
Procedemos a calcular la media para hacer una idea de la
medida en que dichos indicadores varían de uno a otro grupo.
·
Que se
percibe una diferencia significativa entre los valores de las medidas de cada
grupo.
·
Las calificaciones
entre un grupo y otro no es estadísticamente significativa.
Según los datos presentados, el primer año como el
segundo año se evidenció cierta superioridad en el avance de los aprendizajes en
la utilización del entorno Google Apps, frente
a las notas de Moodle en relación a la media, por tanto, no se puede afirmar
que hubo una diferencia estadísticamente significativa en la continuidad de los
años, para el año 2 Google Apps no presentó las suficientes razones, ya que los
riesgo de equivocarnos superaron el 5%.
Fuentes Bibliográficas:
https://www.dropbox.com/s/mz6ezs68i05bimz/Notas-2grupos-v1.csv?dl=0
https://www.dropbox.com/s/vc2lht7wqtshq5p/Notas-2grupos-v2.csv?dl=0
http://www.mutae.net/2016/02/bt01-bt02-tarea-evaluable-t2.html
http://www.mutae.net/2016/01/bt01-bt02-tarea-evaluable-memoria-del.html