Primera entrega

Presentación del tema, los datos y las preguntas

El objetivo de esta primera entrega es presentar el tema del proyecto que desarrollarás a lo largo del semestre, describir los datos a utilizar y proponer las preguntas que guiarán el análisis. La entrega debe responder los siguientes cinco puntos:

  1. Tema. Presentar el tema que se abordará en el trabajo.
  2. Relevancia. Explicar por qué es relevante analizar datos sobre este tema.
  3. Origen de los datos. Indicar de dónde provienen los datos, es decir, desde dónde se van a obtener. Si están disponibles en línea, se debe incluir el enlace. Si los tienen en un archivo, este debe adjuntarse en la entrega. En caso de que los datos aún no estén disponibles porque están en proceso de recolección, se debe incluir una subsección en en la que se describe el proceso de obtención de los datos. Por ejemplo, si los datos son el resultado de la aplicación de una encuesta, se debe incluir las preguntas que esta incluye.
  4. Descripción de los datos disponibles (formato y variables). Indicar las características de los datos disponibles. Por ejemplo, si se trata de un archivo Excel, csv, etc. Se debe indicar también cuáles son las variables disponibles y su tipo (numéricas o de tipo caracter). Para este último punto, se sugiere utilizar una tabla como la que sigue:
nombre variable tipo comentarios



  1. Preguntas de interés que guiarán la exploración inicial de los datos. Indicar al menos cuatro preguntas diferentes que orientarán el análisis inicial de los datos. Las preguntas deben vincularse a lo que se planteó en la relevancia del tema, deben poder ser respondidas con los datos disponibles y no ser complementarias. Con esto nos referimos, por ejemplo, a que preguntar por el máximo y el mínimo de alguna variable es parte de un mismo fenómeno: el rango. Así que serían parte de una misma pregunta, no dos preguntas distintas.

Formato de entrega

Los trabajos deben entregarse a través de un enlace que será enviado por correo y compartido por Discord.

Ejemplo

A continuación se ofrece un ejemplo de lo que se espera para esta entrega. Case señalar que el método para obtener los datos que se describe es algo que aún no hemos visto aún en el curso, pero que abordaremos más adelante.

  1. Tema. Asesorías externas del Senado

  2. Relevancia. Si bien actualmente los datos sobre asesorías se encuentran disponibles en la sección de Transparencia de la página del Senado, solo es posible ver los gastos por mes, pero no hacer búsquedas por senador/a o por asesor/a para ver cuánto han gastado o quiénes son los asesores que más ingresos han recibido. Hacer este análisis permitirá conocer esa información e identificar patrones en los gastos.

  3. Origen de los datos. Los datos se encuentran disponibles en la página web del Senado, en la sección de transparencia: https://senado.cl/appsenado/index.php?mo=transparencia&ac=informeTransparencia&tipo=16.

  4. Descripción de los datos disponibles (formato y variables). Los datos se encuentran como tablas en el sitio web, por lo que será necesario utilizar la técnica de “web scraping” para extraerlos. Hay datos disponibles desde 2012, pero solo se extraerán a partir de abril de 2018, que es el primer mes en que reportó gastos parte del actual Senado. 

    nombre variable tipo comentarios
    asesor caracter
    materia caracter
    monto numérica Las cifras usan comas como separadores de miles (por ejemplo: 3,146,641)
    observaciones caracter
    consejero regional caracter
    concejal caracter
    otro senador caracter
    contrato/informes caracter
  5. Preguntas de interés que guiarán la exploración inicial de los datos.

  • ¿Cuál es el promedio y el rango de montos que han invertido senadores y senadoras en asesorías externas en en el periodo 2018 - 2022?

  • ¿Cuántos personas distintas han realizado asesorías para el senado en este período?

  • ¿Qué asesores han trabajado con mayor cantidad de senadores en ese periodo?

  • ¿Qué asesores han percibido mayores ingresos por concepto de asesorías al senado en este periodo?

Pauta de evaluación

A continuación se presenta la rúbrica que se utilizará para evaluar esta entrega. Se describe el nivel máximo (un trabajo excelente) y las características de los trabajos de cada uno de los rangos de nota.

rango descripción
7 La entrega con nota 7 es un trabajo excelente. Se plantea un tema acotado y se justifica adecuadamente su relevancia. Se explicita el origen de los datos, estos se adjuntan a la entrega y se describen claramente sus características. Se plantean al menos cuatro preguntas que orientarán la exploración inicial de los datos. Las preguntas pueden ser respondidas con los datos disponibles, se vinculan con la justificación de la relevancia del tema y son distintas entre sí.
En términos de su escritura, la entrega se ajusta a las convenciones de un texto académico: utiliza un registro formal y no presenta problemas locales de escritura que dificulten la lectura.
6 - 6,9 Los trabajos ubicados en este rango son muy buenos. Cumplen con todos los elementos mencionados el nivel superior, pero es necesario clarificar la explicación de la relevancia del tema, la explicación del origen de los datos o la descripción de sus características.
5 - 5,9

Los trabajos ubicados en este rango son buenos informes, que pueden requirir clarificar la explicación en dos de los siguientes puntos: relevancia, origen de los datos, descripción de los datos.

También se encuentran en este nivel trabajos que si bien cumplen con todas las características del nivel superior, incluyen una pregunta que no es posible responder con los datos disponibles.

4 - 4,9

Los trabajos ubicados en este rango son informes mejorables, en los que es necesario describir con mayor claridad la relevancia del análisis, el origen de los datos y la descripción de los mismo.

También se encuentran en este nivel trabajos que si bien cumplen con todas las características del nivel superior, se encuentran en alguna de estas situaciones:

  • incluyen dos preguntas que no es posible responder con los datos disponibles.

  • no incluyen los datos (o el instrumento que se utilizará para recogerlos).

3 - 3,9 Los trabajos que se encuentran en este nivel presentan problemas en la explicación de todas sus secciones. También se encuentran en este nivel trabajos en los que tres o más preguntas no pueden ser respondida con los datos disponibles.
1,1 - 2,9 En este rango se ubican trabajos deficientes, en los que no existe coherencia entre las preguntas planteadas, los datos que se espera utilizar para el análisis y la relevancia del tema elegido.
1 No se entrega el trabajo o este incurre en plagio.