En la predicción como en el Big Data, el tamaño sí importa

La estadística y la minería de datos no son sinónimo de exactitud, a través de estas técnicas no se obtendrá certezas, si son correctamente utilizadas, se obtendrán buenas aproximaciones. Cuando se señala, por ejemplo, que de cada 10 personas 6 aceptarían un nuevo producto, no es lo mismo indicar esta afirmación si se llega a esta conclusión con un estudio realizado sobre 100 personas que realizado sobre 1.000.000.


La estadística y la minería de datos no son sinónimo de exactitud, a través de estas técnicas no se obtendrá certezas, si son correctamente utilizadas, se obtendrán buenas aproximaciones. Cuando se señala, por ejemplo, que de cada 10 personas 6 aceptarían un nuevo producto, no es lo mismo indicar esta afirmación si se llega a esta conclusión con un estudio realizado sobre 100 personas que realizado sobre 1.000.000.

Las posibilidades que una afirmación, como el ejemplo señalado en el párrafo anterior, se repita o sea más aproximada a la realidad, dependerán del tamaño de la muestra del estudio, es decir, que volumen de subconjunto global de datos se está utilizando (tamaño de la muestra). Para cualquier estudio será imposible obtener información de todo un público objetivo, pero si la muestra es lo suficientemente grande,  el denominado “margen de error” o “error de muestreo” será más pequeño.

El margen de error nos señala en que porcentaje podría variar una predicción o estimación si el tamaño de la muestra variaría.  Mientras más datos analicemos, habrá menores posibilidades de encontrar en la realidad datos distintos o no incluidos en nuestro estudio, asumiendo, en todo momento, que los datos han sido recopilados siguiendo pautas adecuadas, por consiguiente son válidos y fiables.

Cuando señalamos que es tiempo de Big Data, no lo señalamos porque está de moda mencionarlo, sino porque hoy, a diferencias de épocas pasadas, se cuenta con la capacidad de incluir en el procesamiento de la información la mayor cantidad de datos posible, indispensable para las tareas análisis como la predicción.

Anuncio publicitario

Autor: anibal goicochea

anibal goicochea mendo Formador y Consultor Informático, especialista en Business Intelligence, Planificación, Presupuestos, Consolidación Financiera y Datawarehousing con soluciones basadas en SAP BW/HANA, SAP BPC y SAP BusinessObjects BI, entre otros productos.

Deja un comentario... Gracias!!!

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

A %d blogueros les gusta esto: