jueves, 28 de mayo de 2020

TEMA 12: CONCORDANCIA Y CORRELACIÓN

FRANCIS GALTON describió el término REGRESIÓN en su libro "Natural inheritance"

  • Su trabajo se centraba en el estudio de los rasgos físicos de los descendientes (una de las variables) a partir de la de sus padres (la otra variable).
  • Hoy en día el sentido de la regresión es de predecir una medida basándonos en el conocimiento de otra.
  • PEARSON hizo un estudio con más de 1000 registros familiares observando relaciones. Ejemplo: sacó en conclusión que la altura de los padres se hereda en parte a sus hijos, que tienden a regresar a la media
Relación entre dos variables cuantitativas

• Una variable cuantitativa toma valores que son cuantificables, por ejemplo
la talla de una persona, el peso, presión arterial, el sueldo que gana, los
gastos que tiene, etc



Estudio conjunto de dos variables

  • En cada fila tenemos los datos de un individuo
  • Cada columna representa los valores que toma una variable.
  • Estas observaciones se pueden representar en un diagrama de dispersión.
  • Nuestro objetivo es averiguar si existe relación entre las variables, de qué tipo y si es posible determinar el valor de una a partir de la otra.

EL PESO AUMENTA CON LA ALTURA.


Relación directa e inversa



Relación entre dos variables cuantitativas


-Dependencia Funcional: puntos exactamente sobre la línea recta o curva.

Pero en estadística no se suele dar este tipo de casos
             -Dependencia Estocástica: no están todos los puntos exactamente sobre el modelo, sino que existe una tendencia.


Regresión lineal simple: correlación y determinación

•Se trata de estudiar la asociación lineal entre dos variables cuantitativas.
•Ejemplo: influencia de la edad en las cifras de Tensión arterial Sistólica.
Regresión lineal simple: una sola variable independiente.
Regresión lineal múltiple: más de una variable independiente.



•Ecuación de la recta: y = a + bx (ej: TAS=a +b· edad)
•Pendiente de la recta → b
•Punto de intersección con el eje de coordenadas → a
“b” expresa la cantidad de cambio que se produce en la variable
dependiente por unidad de cambio de la variable independiente.
“a” expresa cuál es el valor de la variable dependiente (eje y)
cuando la independiente vale cero (eje x).
Si x=0 → y= a




Coeficiente de Correlación de Pearson

Por lo que ya podemos decir que si la “r” es menor que 0, tenemos
una relación lineal inversa. Si la “r” es mayor de 0, la relación es
lineal directa, y si “r” es igual a 0, podemos tener una variables
independientes o por otro lado una relación que no sea lineal.



Coeficiente de correlación de Spearman



martes, 26 de mayo de 2020

TEMA 11: PRUEBAS NO PARAMÉTRICAS MÁS UTILIZADAS EN ENFERMERÍA

Pruebas no paramétricas
Análisis bivariado de variables cualitativas:

Test de hipótesis Chi-cuadrado:

•Para comparar dos variables cualitativas (dependiente e independiente).
•Razonamiento a seguir: suponemos la hipótesis cierta, y estudiamos cómo es de probable que siendo iguales los dos grupos a comparar se obtengan resultados como los obtenidos o haber encontrado diferencias más grandes por grupos.

Tablas de contingencia-Frecuencias absolutas:
se emplean para registrar y analizar la asociación entre dos o más variables de naturaleza cualitativa (nominales u ordinales).
•Ejemplo ¿Existen diferencias en el consumo de tabaco en función del sexo?

Hipótesis:
–Ho=No existe asociación entre el consumo de tabaco y el sexo.
–H1=Existe asociación entre el consumo de tabaco y el sexo.

Porcentajes por fila (genero)

Porcentajes por columna (consumo de tabaco)


La prueba o estadístico Chi cuadrado se utiliza para comprobar si la diferencia en los datos que observamos:
Es debida al azar
•Recordemos que la Ho establece que no hay diferencia, es decir, que hay igualdad. Aceptamos la Ho.
Es debida a algo más, por ejemplo una asociación entre las variables que estudiamos.
•Rechazamos la H0. Aceptamos la H1.
•Las condiciones para aplicarlas son:
1.Las observaciones tienen que ser independientes.
2.Utilizar variables cualitativas.
3.Deben ser más de 50 casos.
4.Las frecuencias teóricas o esperadas en cada casilla de clasificación no deben
ser inferiores a 5. Si son menores que 5, no podemos sacar conclusiones del contraste
de hipótesis con Chi-cuadrado


Si no se cumplen los requisitos: Se usan pruebas paramétricas.



miércoles, 20 de mayo de 2020

TEMA 10: ESTIMACIÓN Y/O SIGNIFICACIÓN ESTADÍSTICA

La significación estadística (p) está relacionada con el resultado del estudio. Así, cuando se dice que la p < 0.05, estamos afirmando que el resultado del estudio se cumple, al menos, en el 95% de los casos.





Contrastes de hipótesis:
El contraste de hipótesis nos permite decidir si los resultados obtenidos son fruto de la causalidad (por una relación causa-efecto) o de la casualidad (por azar).
Permite cuantificar la compatibilidad entre una hipótesis previamente establecida y los resultados obtenidos.


Se utiliza la prueba estadística correspondiente y se mide la probabilidad de error al rechazar la hipótesis nula, asociada al valor de p 
• Según el nivel de significación que hayamos preestablecido (habitualmente un 95%) las soluciones pueden ser:




VAMOS A VOLVER A EXPLICARLO PASO A PASO:






lunes, 18 de mayo de 2020

TEMA 9: INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS

Al conjunto de procedimientos estadísticos que permiten pasar de lo particular, (la muestra) a lo general (la población) le denominamos: inferencia estadística.
Dos formas de inferencia estadística: 
ESTIMACIÓN: Parámetro - - Estimador


  CONTRASTE DE HIPÓTESIS

Para ejemplificar:








Estimaciones:
Proceso de utilizar información de una muestra para extraer conclusiones acerca de toda la población
 • Se utiliza la información recogida para estimar un valor 
• Puede realizarse ESTIMACIÓN PUNTUAL o ESTIMACIÓN POR INTERVALOS mediante el cálculo de INTERVALOS DE CONFIANZA

Estimación puntual:
•Consiste en considerar al valor del estadístico muestral como una estimación del parámetro poblacional 
Por ejemplo, si la TAS media de una muestra es 125 mmHg, una estimación puntual es considerar este valor como una aproximación a la TAS media poblacional.

Estimación por intervalos:
•Consiste en calcular dos valores entre los cuales se encuentra el parámetro poblacional que queremos estimar con una probabilidad determinada, habitualmente el 95%. Se pueden crear para cualquier parámetro de la población
 • Por ejemplo, a partir de lo datos de una muestra hemos calculado que hay un 95% de probabilidad de la TAS media de una población esté comprendida entre 120 y 130 mmHg (120 y 130 son los límites del intervalo de confianza)



Error estándar :
• Es la medida que trata de captar la variabilidad de los valores del estimador (en este caso la media de los días de curación de la úlcera)
 • El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.
 • Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta. 
• Si en lugar de variar el valor de la media en las muestras entre 52 y 64 días, variara entre 20 y 90 días, sería menos probable que al seleccionar una muestra y calcular su media, ésta estuviera cercana a 57,46, que es el valor de la media en la población

¿Cómo se calcula?




Teorema central del límite: 
Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la de la población y desviación típica igual al error estándar del estimador de que se trate.

Intervalos de confianza:
Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio) 
• Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números. 
• Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite
Para construir un intervalo de confianza del 95% o del 99% se aplica la fórmula: 
– Para nivel de confianza 95%:  z=1,96
– Para nivel de confianza 99%: z=2,58 
– Z es un valor que depende del nivel de confianza 1-a con que se quiera dar el intervalo


Contrastes de hipótesis:
• Para controlar los errores aleatorios, además del cálculo de intervalos de confianza, contamos con una segunda herramienta en el proceso de inferencia estadística: los tests o contrastes de hipótesis 
• Con los intervalos nos hacemos una idea de un parámetro de una población dando un par de números entre los que confiamos que esté el valor desconocido 
• Con los contrastes (tests) de hipótesis la estrategia es la siguiente: 
– Establecemos a priori una hipótesis acerca del valor del parámetro 
– Realizamos la recogida de datos 
– Analizamos la coherencia de entre la hipótesis previa y los datos obtenidos



martes, 12 de mayo de 2020

TEMA 8: TEORÍA DE MUESTRAS.


  • Al conjunto de procedimientos que permiten elegir muestras de tal forma que éstas reflejen las características de la población le llamamos técnicas de muestreo.
  • Siempre que trabajamos con muestras hay que asumir un cierto error. 
  •  Si la muestra se elige por un procedimiento de azar, se puede evaluar ese error. La técnica de muestreo en ese caso se denomina muestreo probabilístico o aleatorio y el error asociado a esa muestra elegida al azar se llama error aleatorio (es inevitable pero es evaluable.)    


Procedimiento muestral:
Método tal que al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese pequeño grupo posea las características de la población que estamos estudiando.



Muestreo no probabilístico:

  • Muestreo Consecutivo: El más usado. Se recluta a todos los individuos de una población que son accesibles y que cumplen los criterios de inclusión durante un periodo de reclutamiento fijado. Ejemplo: horas sueño RN. Se toma información de todos los RN que acudan el centro sanitario en un tiempo concreto. 
  • Muestreo de conveniencia o accidental:  Se recluta a los individuos que son mas accesibles para el equipo investigador o que se presentan voluntariamente. Se usa con frecuencia al ser el menos costoso y mas fácil. Ejemplo: Paramos por la calle a la gente que pasa por allí.
  • Muestreo intencional o a criterio: El propio investigador es quien selecciona a los individuos al considerarlo los mas apropiados. Se usa cuando se quiere contar con una muestra de expertos o en estudios cualitativos. Ejemplo: método Delphi o consenso de expertos. 
  • Muestreo bola de nieve, de avalancha o muestreo en cadena: El propio investigador elige a un participante que cumpla los criterios de inclusión y al mismo tiempo se le pide que identifique a otros individuos con sus mismas características para invitarles a participar y así sucesivamente hasta que se tenga recogida la muestra. Muy utilizada en estudios cualitativos
  • Muestreo teórico: la selección de la muestra se hace de forma gradual debido a que el propósito del estudio es la generación de una teoría o porque la integración de la muestra se va diciendo sobre la marcha. Los participantes deben cubrir todas las características, perfiles y patrones que puedan influir de el fenómeno estudiado.
Muestreo probabilístico:
  • Muestreo Aleatorio: En la selección de los sujetos interviene el azar.
    • Simple: seleccionar al azar (tabla numero / pc) la n (muestra). Se usa poblaciones pequeñas.
    • Sistemático: seleccionar individuos según una regla o proceso. Formula: K= N/n.
  • Muestreo Estratificado: Se utiliza cuando la característica objeto de estudio no se distribuye de forma homogénea en la población y puede afectar a los resultados del estudio, pero existen grupos o estratos donde se si presenta de manera homogénea. Ejemplo: nivel de burnout en enfermeros y enfermeras 1000 individuos / 300 enfermeros / 700 enfermeras.
  • Muestreo Conglomerados: Se obtiene de grupos o conglomerados ya establecidos cuando no hay listado de la población. Ejemplo: nivel satisfacción laboral de una unidad de un hospital. Escogemos al azar un hospital (m. aleatorio simple) y después la unidad (m conglomerados).


Tamaño de la muestra:
 va a depender de: El error aleatorio (estándar) ,de la mínima diferencia entre los grupos de comparación que se considera importante en los valores de la variable a estudiar, de la variabilidad de la variable a estudiar (varianza en la población), el tamaño de la población de estudio.
Cálculo del tamaño de una muestra para estimar la media de una población: n= Z 2 x S 2 /e 2


lunes, 4 de mayo de 2020

TEMA 7: TEORÍA DE LA PROBABILIDAD

La probabilidad es una causa de la certidumbre asociada a un suceso o evento futuro y suele expresarse como un número entre 0 y 1 (o entre 0 % y 100 %).
Una forma tradicional de estimar algunas probabilidades sería obtener la frecuencia de un acontecimiento determinado mediante la realización de experimentos aleatorios, de los que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. Un suceso puede ser improbable (con probabilidad cercana a 0), probable (probabilidad intermedia) o seguro (con probabilidad uno).
Posee tres vertientes:


PROBABILIDAD SUBJETIVA O PERSONALÍSTICA
La probabilidad mide la confianza que el individuo tiene sobre la certeza de una proposición determinada.
 Por ejemplo: los epidemiólogos se basan en la experiencia para afirmar que el próximo invierno la epidemia de gripe tendrá una probabilidad del 0,0018 (180 casos por 100.000 habitantes).
 Este concepto de las probabilidades ha dado lugar al enfoque de análisis de datos estadísticos llamado “Estadística Bayesiana”.

PROBABILIDAD CLÁSICA O “A PRIORI”
desarrollada para resolver problemas relacionados con los juegos de azar (dados, monedas, ruletas…) 
Las probabilidades se calculan con un razonamiento abstracto. 
Ejemplo: no hay que lanzar el dado para saber que la probabilidad “a priori” de que salga el 6 es de 1/6=0,16.



LEY DE LOS GRANDES NÚMEROS
La probabilidad a priori de que salga un número en el dado es P(A) = 1/6 = 0,166 = 16,6 % Inicialmente esa probabilidad real puede no cumplirse pero si repetimos muchas veces el experimento, la frecuencia relativa de un suceso A, cualquiera, tiende a estabilizarse en torno al valor “a priori”

PROBABILIDAD RELATIVA O “A POSTERIORI” 


Un ejemplo:




SUCESOS:
  • Sucesos independientes: Lanzar dos dados, tener 20 años y los ojos azules
  • Sucesos dependientes: Ej. Extraer dos cartas de una baraja sin reposición, por ejemplo ser mujer y sufrir cáncer de mama 
  • Sucesos compatibles: tienen algún suceso elemental común. Ej. A=obtener una puntuación par; B=obtener múltiplo de 3 
  • Sucesos incompatibles o excluyentes: ningún suceso elemental común (A y B son contrarios). Eje. A=obtener par y B= obtener impar, A= hombre y B=mujer
  • Unión de sucesos: es el suceso formado por todos los elementos de A y de B 




Reglas básicas: Teoría de la Probabilidad
Las probabilidades de un evento o suceso siempre oscilan entre 0 y 1 
• La probabilidad de que un evento o suceso sea seguro es = a 1.
 • La probabilidad de un suceso o evento imposible es = 0
 • La unión de A y B es: – P(AUB)=P(A)+P(B)-P(A П B)
 • La probabilidad de un suceso contrario o del complemento es igual a 1 menos la probabilidad del suceso – P (A´)= 1-P(A)
 • La probabilidad de que ocurra el suceso A si ha ocurrido el suceso B se denomina probabilidad condicionada I y se define:


Teorema de Bayes
Expresa la probabilidad condicional de un evento aleatorio A dado B en términos de la distribución de probabilidad condicional del evento B dado A y la distribución de probabilidad marginal de sólo A. En términos más generales el teorema de Bayes que vincula la probabilidad de A dado B con la probabilidad de B dado A. Por ejemplo, sabiendo la probabilidad de tener un dolor de cabeza dado que se tiene gripe, se podría saber (si se tiene algún dato más), la probabilidad de tener gripe si se tiene un dolor de cabeza.



Distribución de probabilidad en variables discretas:
1. binominal:
La distribución binomial es un modelo matemático de distribución teórica de (la normal es con variables continuas) variables discretas
 – Cuando se producen situaciones en las que sólo existen dos posibilidades (cara/cruz; sano/enfermo…)
 – El resultado obtenido en cada prueba es independiente de los resultados obtenidos anteriormente. 
– La probabilidad del suceso A es constante, la representamos por p, y no varía de una prueba a otra. La probabilidad de `A es 1- p y la representamos por p . 
– El experimento consta de un número n de pruebas.
Mediante esta distribución se resuelven los problemas que plantean:
 – Si al hacer un experimento hay una probabilidad p de que ocurra un suceso ¿Cuál es la probabilidad de que en N experimentos el suceso ocurra X veces?
 • P: probabilidad de ocurrencia; p de no ocurrencia 
• X: numero sucesos favorables
• N: numero total de ensayos

2.Distribución de Poisson:
Poisson: médico miliar francés que estudia en el s.XIX la probabilidad de que un soldado muera en el campo de batalla por golpes de un caballo (También se llama la distribución de probabilidad de casos raros)