HomeEstadísticas experimentalesGráficos y visualizaciones: Clustering de hoteles

Clustering de hoteles

Ayuda

Información adicional

Este grafico resume parte de los trabajos realizados con los precios diarios de establecimientos hoteleros (hoteles y pensiones) escrapeados desde internet. Para la captación de datos, se ha recurrido a diferentes métodos de web escraping, y, a medida que hemos ido conociendo la estructura del sitio web, la calidad de los datos también ha mejorado. El universo estudiado no es completo dado que no todos los alojamientos ofrecen la opción de realizar reserva a través de internet, actualmente la cobertura de los alojamientos es aproximadamente del 75%. Los datos escrapeados han sido fusionados con la Encuesta de establecimientos turísticos receptores del Eustat, con el fin de obtener información adicional de directorio de los hoteles y pensiones. Entre los trabajos previos se ha realizado la detección de valores atípicos, la imputación de datos faltantes y finalmente varios tipos de clusterings de las series de precios diarios.

Clustering con los precios absolutos: En este clustering, los establecimientos hoteleros han sido agrupados mediante precios absolutos. Se ha recurrido a la distancia euclidea para agrupar las series, entre otros motivos porque resulta sencillo de entender y porque se han obtenido los resultados deseados. Por su parte, se ha empleado el método PAM (Partitioning Around Medoids1 ) para la clasificación de las series, del paquete clúster, basado en el método K-means

Clustering con precios normalizados: En este clustering, los establecimientos hoteleros han sido agrupados mediante precios normalizados. Se ha recurrido al método Min-Max; es decir, los precios de cada uno de los hoteles se han cambiado de escala, entre 0 y 100. Este cambio de escala se realiza para comparar todos los hoteles y pensiones de la misma manera; para que, a continuación, se pueda analizar su tendencia y realizar la clasificación en función de ello. Se ha recurrido a la distancia euclidiana para agrupar las series y el método PAM (Partitioning Around Medoids1 ) para la clasificación de las series, del paquete clúster, basado en el método K-means.

Clustering con volatilidad: Este clustering está basado en la volatilidad, con el objeto de medir los cambios que presentan los precios de un día para otro. El objetivo principal de este agrupamiento consiste en hacer una clasificación de los hoteles y de las pensiones que modifican su precio de manera considerable, poco o nada en el corto plazo. Se ha basado en una medida que se emplea en economía. Close-to-Close Volatility o Close/Close Volatility.

La idea principal de esta medida consiste en analizar la diferencia entre días consecutivos a través del logaritmo, y, a continuación, calcular el desvío estándar de estos valores.

Cuaderno técnico

Su feedback.   Ayúdenos a adaptar nuestra web a sus necesidades

¿Cómo valora usted la información de esta página?
Muy útil
Útil
Poco útil
Nada útil
¿Tiene alguna sugerencia que hacer?
Si, tengo
Enviar
AENOR

Eustat - Euskal Estatistika Erakundea - Instituto Vasco de Estadística

Eustat es el organismo público que desarrolla, produce y difunde información estadística oficial de la C.A. de Euskadi

c/Donostia - San Sebastián, 1
01010 Vitoria-Gasteiz
Tfno: (+34) 945017500
Fax: (+34) 945017501
webmaster_eustat@eustat.eus