Como seleccionar muestras aleatorias de datos en MS Excel


Tomado de  http://excellentias.com/2010/10/como-seleccionar-muestras-aleatorias-de-datos-en-ms-excel/




Como seleccionar muestras aleatorias de datos en MS Excel

aleatoriedad
Hola! ¿Cómo están?

¿Que harías si tienes que generar un aleatorio de acuerdo a un rango de datos? Imagínate crearlo con mas de 500 filas y tengas que hacerlo manualmente, realmente todo un trabajo engorroso. Por ejemplo tendríamos que introducir en un biombo el total de la población a participar en el proceso aleatorio e ir dejando que el azar determine quienes serían los 500 seleccionados extrayendo uno a uno los resultados.
Afortunadamente a través de una formula de MS Excel® podemos generar procesos pseudoaleatorios de selección de un número cualquiera de individuos de una población, sin necesidad de hacerlo de forma manual. Este enfoque resulta más eficiente e igualmente válido a uno completamente aleatorio de acuerdo con la definición de un número pseudo-aleatorio, que establece:
Son números generados en un proceso que parece producir números al azar, pero no lo hace realmente. Las secuencias de números pseudo-aleatorios no muestran ningún patrón o regularidad aparente desde un punto de vista estadístico, a pesar de haber sido generadas por un algoritmo completamente determinista, en el que las mismas condiciones iniciales producen siempre el mismo resultado
La mayoría de los sistemas informáticos genera números pseudoaleatorios que podemos considerar estadísticamente válidos a pesar de no haber surgido producto del azar. Aprovechando un algoritmo de esta índole que emplea la función ALEATORIO de MS Excel veamos a continuación como generar un aleatorio a partir de un grupo de datos.

¡En Practica!

Para construir la formula vamos a emplear las siguientes  funciones: ALEATORIOBUSCARV, K.ESIMO.MAYOR y FILA.
Supongamos que tenemos el numero de afiliación de 20 clientes y queremos realizarle una encuesta de satisfacción solo a cinco de ellos; en este caso podemos seleccionarlos de forma manual dado que la lista es pequeña, pero imagínate que el numero de filas con datos de afiliación fuese 100 mil. Sería muy engorroso realizar la selección de forma manual.
Nuestro ejemplo a pesar de que emplea solo 20 filas es igualmente aplicable a volumenes mayores de datos con tan solo ampliar el rango de la formulación. Así que partiendo de nuestros números de afiliación de clientes crearemos dos columnas adicionales a la izquierda de estos:
  • La primera columna la vamos a denominar “Auxiliar” y en cada una de las celdas vamos a insertar la función ALEATORIO esto con el fin de generar aleatoriedad para los datos que va a arrastrar la formula.
  • La segunda columna la vamos a denominar “Index” y en cada celda vamos a insertar un numero correlativo de acuerdo a la cantidad de datos que haya, para este ejemplo son 20 (veinte).
  • Nuestra tercera columna van a ser en efecto los 20 números de afiliación de los clientes.
La tabla que construimos quedaría de la siguiente manera:
Solo resta crear nuestros campos claves:
  • Uno donde este la columna “Index” que para este ejemplo son 5 ya que ese es el numero de clientes que se propone para realizar las encuestas de satisfacción.
  • Nuestro ultimo pero mas importante campo va a ser donde vamos a insertar la formula que esta compuesta por las siguientes funciones: BUSCARVK.ESIMO.MAYORFILA, cada una cumpliendo una labor especifica:
Mediante BUSCARV es que vamos a obtener el valor de acuerdo al valor buscado que en este caso lo representa la función K.ESIMO.MAYOR que como matriz se van a tomar los datos de la primera columna “Auxiliar” donde se encuentra los datos con la función ALEATORIO y empleamos como argumento “k” la referencia de la celda que de la función FILA.
La formula que vamos emplear para generar la aleatoriedad queda de la siguiente manera (Esta sería para la primera celda donde se encuentra la formula de aleatoriedad):
=BUSCARV(K.ESIMO.MAYOR($A$6:$A$25;FILA(A1));$A$6:$C$25;3;FALSO)

Resultados

Una vez seguido todos los pasos veamos mediante la siguiente imagen cuales son los resultados de nuestro ejemplo:

Esperamos que les resulte de gran utilidad para manejo de aleatorios con grandes volúmenes de datos.
Te dejamos archivos en formatos MS Excel® 2007 y MS Excel 2003 con el ejemplo citado en esta publicación con el que también podrás trabajar con tus propios datos.
SHARE

Oscar perez

Arquitecto especialista en gestion de proyectos si necesitas desarrollar algun proyecto en Bogota contactame en el 3006825874 o visita mi pagina en www.arquitectobogota.tk

  • Image
  • Image
  • Image
  • Image
  • Image
    Blogger Comment
    Facebook Comment

0 comentarios:

Publicar un comentario