class: front <!--- Para correr en ATOM - open terminal, abrir R (simplemente, R y enter) - rmarkdown::render('static/docpres/07_interacciones/7interacciones.Rmd', 'xaringan::moon_reader') About macros.js: permite escalar las imágenes como [scale 50%](path to image), hay si que grabar ese archivo js en el directorio. ---> .pull-left[ # Metodología I ## **Kevin Carrasco** ## Magister en Ciencias Sociales FACSO - UChile ## 1er Sem 2025 ## [.green[metod1-mcs.netlify.com]](https://metod1-mcs.netlify.com) ] .pull-right[ .right[ <br> ## .yellow[Sesión 5: Análisis descriptivo de datos]  ] ] --- layout: true class: animated, fadeIn --- class: inverse, bottom, right, animated, slideInRight # .red[Sesión 5] <br> Repaso sesión anterior Análisis descriptivo de datos <br> <br> <br> <br> --- class: inverse, bottom, right # .red[Sesión 5] <br> .yellow[Repaso sesión anterior] Análisis descriptivo de datos <br> <br> <br> <br> --- ## Variables en una base de datos - La investigación, usualmente, se centra en definir variables de interés - Usando una perspectiva cuantitativa podemos **describir, resumir y modelar** el comportamiento de estas variables - Para realizar estos procedimientos debemos **cuantificar** los fenómenos sociales - Esto es lo que conocemos como el proceso de **operacionalización** --- ## Variables en una base de datos - ¿Qué hacer después con estas variables? -- - El análisis de datos sociales se basa en establecer **relaciones matemáticas** entre las variables. --- ## Operacionalización * Proceso de definición de la medición de un fenómeno que no se puede medir directamente, aunque su existencia se infiere de otros fenómenos -- - Las variables pueden ser visibles o no visibles/latentes. (Ej: peso / inteligencia) --- ## Operacionalización .center[] --- ## Operacionalización .center[] --- ## Operacionalización .center[] --- ## Operacionalización .center[] --- ## Escalas de medición de variables - NOIR: Nominal, Ordinal, Intervalar, Razón .small[ | Tipo | Características | Propiedad de números | Ejemplo| |------------ |----------------------------------------------|--------------- |----------- | | *Nominal* | Uso de números en lugar de palabras | Identidad | Nacionalidad | | *Ordinal* | Números se usan para ordenar series | + ranking | Nivel educacional | | *Intervalar* | Intervalos iguales entre números | + igualdad | Temperatura | | *Razón* | Cero real | + aditividad | Distancia | ] --- ## Escalas de medición de variables .small[ | Tipo | Operación empírica | Estadísticos permisibles | |------------- |----------------------------------------------|--------------- | | *Nominal* | Determinación de igualdad | Contar; Moda | | *Ordinal* | Determinación de más o menos | Mediana; Percentil | | *Intervalar* | Determinación de igualdad de intervalos | Promedio; Desv. Estand. | | *Razón* | Determinación de igualdad de razones | Coeficientes de variación | ] --- ## Escalas de medición de variables Siempre tenemos que considerar a qué nivel corresponde el constructo que queremos medir - Por ejemplo, si bien es posible medir *estado de ánimo* a un nivel nominal u ordinal, una medición a nivel intervalar es más adecuada - Por lo tanto, esta decisión es teórica. Depende de la operacionalización que hagamos de los fenómenos. - Conocer los niveles de medición permite saber qué tipos de análisis podemos realizar con los datos --- class: inverse, bottom, right # .red[Sesión 5] <br> Repaso sesión anterior .yellow[Análisis descriptivo de datos] <br> <br> <br> <br> --- ## Análisis descriptivo de datos - La estadística es el lenguaje para comunicar información basada en datos cuantitativos - La estadística descriptiva permite sintetizar o resumir los datos obtenidos a partir de un conjunto de observaciones - Eventualmente, con estadística inferencial se pueden realizar procesos que permiten, dentro de ciertos rangos de confianza, determinar el comportamiento de la población que es representada por la muestra --- ## Análisis descriptivo de datos Indicadores que describen distintos aspectos de las observaciones realizadas - Tremendamente importantes para explorar y presentar los resultados de un estudio (describiendo el comportamiento de una muestra) - Son los indicadores sobre los cuales se realiza estadística inferencial (se infiere a la población) --- ## Análisis descriptivo de datos - Los análisis estadísticos son estrategias para traducir la información obtenida a un formato que sea interpretable. - Por mucho que miremos una base de datos, difícilmente vamos a poder entender qué significan esos números. - La estrategia más sencilla es mostrar la información en un formato visual (gráficos) o en un esquema sintetizado (**tablas**) --- ## Tablas y gráficos En general, cualquier tabla puede ser presentada en formato gráfico - ¿Qué elegir? - La decisión decisión depende de la cantidad de información presentada y el uso que vaya a darse a ella - Los gráficos permiten una comprensión global más inmediata, las tablas una revisión más detallada --- ## Tablas de síntesis de resultados - Al reportar los resultados de una investigación, es común construir tablas que resumen el comportamiento de una serie de variables - La idea general es consensar la mayor cantidad de información evitando la redundancia de información - Estas tablas se diseñan a partir de distintos análisis realizados sobre los datos, pero que apuntan a un área temática común. Por ejemplo: descripción demográfica de la muestra --- ## Tablas de síntesis de resultados - Ejemplo:  .small[ .center[Fuente: Salgado, M. (2022) Altruismo y fundamentos morales en adolescentes: Un estudio experimental. Revista de Sociología] ] --- ## Tablas de frecuencia - La forma más sencilla de presentar la información obtenida en un estudio es contabilizar el número de veces que aparece cada respuesta - Este indicador se conoce como la frecuencia de aparición de cada respuesta ( `\(f\)` ) - Cuando presentamos una variable indicando la frecuencia de aparición de cada uno de sus valores, tenemos una tabla de frecuencia --- ## Tablas de frecuencia - Las frecuencias son, sin embargo, datos absolutos. No es fácil comparar los resultados de dos tablas con un N total de respuestas diferente - Para hacer esas comparaciones, se utilizan medidas estandarizadas, esto es, transformaciones de los puntajes originales a escalas que sean las mismas en todas las tablas (y que permitan comparación) --- ## Tabulación de datos Estandarizan los puntajes, permitiendo comparación - Proporción (p) $$p = \frac{f}{N} $$ - Porcentaje (%) $$ \% = p \times 100 $$ --- ## Tabulación de datos Permiten analizar el comportamiento de la variable - Frecuencias acumuladas - Porcentajes acumulados --- ## Tablas de frecuencia y datos acumulados Grado de Felicidad personas evaluadas <table class="table" style="font-size: 18px; color: black; margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> Puntaje </th> <th style="text-align:left;"> f </th> <th style="text-align:left;"> F </th> <th style="text-align:left;"> p </th> <th style="text-align:left;"> % </th> <th style="text-align:left;"> % Ac </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> Muy poco feliz </td> <td style="text-align:left;"> 160 </td> <td style="text-align:left;"> 160 </td> <td style="text-align:left;"> 0.10 </td> <td style="text-align:left;"> 10.31 </td> <td style="text-align:left;"> 10.31 </td> </tr> <tr> <td style="text-align:left;"> Poco feliz </td> <td style="text-align:left;"> 398 </td> <td style="text-align:left;"> 558 </td> <td style="text-align:left;"> 0.26 </td> <td style="text-align:left;"> 25.64 </td> <td style="text-align:left;"> 35.95 </td> </tr> <tr> <td style="text-align:left;"> Relativamente feliz </td> <td style="text-align:left;"> 610 </td> <td style="text-align:left;"> 1168 </td> <td style="text-align:left;"> 0.39 </td> <td style="text-align:left;"> 39.30 </td> <td style="text-align:left;"> 75.26 </td> </tr> <tr> <td style="text-align:left;"> Bastante feliz </td> <td style="text-align:left;"> 310 </td> <td style="text-align:left;"> 1478 </td> <td style="text-align:left;"> 0.20 </td> <td style="text-align:left;"> 19.97 </td> <td style="text-align:left;"> 95.23 </td> </tr> <tr> <td style="text-align:left;"> Muy feliz </td> <td style="text-align:left;"> 74 </td> <td style="text-align:left;"> 1552 </td> <td style="text-align:left;"> 0.05 </td> <td style="text-align:left;"> 4.77 </td> <td style="text-align:left;"> 100 </td> </tr> <tr> <td style="text-align:left;"> Total </td> <td style="text-align:left;"> 1552 </td> <td style="text-align:left;"> </td> <td style="text-align:left;"> 1.00 </td> <td style="text-align:left;"> 100.0% </td> <td style="text-align:left;"> </td> </tr> </tbody> </table> --- ## Tablas de frecuencia ¿La democracia es preferible a cualquier otra forma de gobierno? (1, "completamente en desacuerdo"; a 7, "completamente de acuerdo") <table class="table" style="font-size: 18px; color: black; margin-left: auto; margin-right: auto;"> <thead> <tr> <th style="text-align:left;"> Puntaje </th> <th style="text-align:left;"> f </th> <th style="text-align:left;"> % </th> <th style="text-align:left;"> % asc </th> <th style="text-align:left;"> % des </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> 1 </td> <td style="text-align:left;"> 99 </td> <td style="text-align:left;"> 5.0% </td> <td style="text-align:left;"> 5.0% </td> <td style="text-align:left;"> 100.0% </td> </tr> <tr> <td style="text-align:left;"> 2 </td> <td style="text-align:left;"> 44 </td> <td style="text-align:left;"> 2.2% </td> <td style="text-align:left;"> 7.2% </td> <td style="text-align:left;"> 95.0% </td> </tr> <tr> <td style="text-align:left;"> 3 </td> <td style="text-align:left;"> 94 </td> <td style="text-align:left;"> 4.7% </td> <td style="text-align:left;"> 11.9% </td> <td style="text-align:left;"> 92.8% </td> </tr> <tr> <td style="text-align:left;"> 4 </td> <td style="text-align:left;"> 212 </td> <td style="text-align:left;"> 10.7% </td> <td style="text-align:left;"> 22.6% </td> <td style="text-align:left;"> 88.1% </td> </tr> <tr> <td style="text-align:left;"> 5 </td> <td style="text-align:left;"> 231 </td> <td style="text-align:left;"> 11.6% </td> <td style="text-align:left;"> 34.2% </td> <td style="text-align:left;"> 77.4% </td> </tr> <tr> <td style="text-align:left;"> 6 </td> <td style="text-align:left;"> 415 </td> <td style="text-align:left;"> 20.9% </td> <td style="text-align:left;"> 55.1% </td> <td style="text-align:left;"> 65.8% </td> </tr> <tr> <td style="text-align:left;"> 7 </td> <td style="text-align:left;"> 893 </td> <td style="text-align:left;"> 44.9% </td> <td style="text-align:left;"> 100.0% </td> <td style="text-align:left;"> 44.9% </td> </tr> <tr> <td style="text-align:left;"> Total </td> <td style="text-align:left;"> 1988 </td> <td style="text-align:left;"> 100.0% </td> <td style="text-align:left;"> 100.0% </td> <td style="text-align:left;"> 100.0% </td> </tr> </tbody> </table> --- ## Medidas de tendencia Central * **Moda**: valor que ocurre más frecuentemente -- * **Mediana**: valor medio de la distribución ordenada. Si N es par, entonces es el promedio de los valores medios -- * **Media** o promedio aritmético: suma de los valores dividido por el total de casos --- ## Medidas de tendencia Central ### Dispersión: * **Varianza**: promedio de la suma de las diferencias del promedio al cuadrado .center[] --- .center[] --- .center[] --- .center[] --- * **Desviación Estándar**: - Raiz Cuadrada de la varianza. - Expresada en la mismas unidades que los puntajes de la escala original --- class: middle, center # Más sobre datos, variables y varianza en: ##- [Moore: 1.Comprensión de los datos (1-54)](https://multivariada.netlify.app/docs/lecturas/moore_comprensiondelosdatos.pdf) --- class: front .pull-left[ # Metodología I ## **Kevin Carrasco** ## Magister en Ciencias Sociales FACSO - UChile ## 1er Sem 2025 ## [.green[metod1-mcs.netlify.com]](https://metod1-mcs.netlify.com) ] .pull-right[ .right[ <br> ## .yellow[Sesión 4: Estadística descriptiva]  ] ]