大数据分析特点?
500
2024-04-23
旅游类型可分为:国际旅游、国内旅游、团队游、散客旅游、商务和专业访问类等。
国际旅游指跨境旅游活动。包括入境旅游和出境旅游。前者是指外国居民到本国的旅游活动,后者是指本国居民到其他国家的旅游活动。
国内旅游是指一个国家的居民离开常住地前往中国另一个地方的旅行。其特点是对从事这类旅游活动的人没有国籍限制,游客可以是本国公民,也可以是在国内长期居住的外国人。
团体旅游简称G.I.T,又称“集体综合旅游”,游客一般根据旅游批发商制定的行程表、路线、交通工具和收费标准进行选择后提前登记,付款后再进行一次旅游。
散客旅游,又称自助或半自助旅游,在国外被称为自主旅游。它是旅游者自己安排旅游行程,零星支付各种旅游费用的一种旅游形式。
比较典型的商务和专业访问类是研学旅游。
分为地理景观、水景观、生物景观、天文气候景观、遗址遗迹、建筑设施、旅游商品和文化活动这八大类型。
以下是八大类型的分类依据:
1.观光欣赏型:以优美的自然风光、著名的古建筑、遗址园林、现代城市景观、山水田园、宗教寺庙为目的,为揽胜祈福等。
2.知识性:侧重文物古迹、博物馆展览、科技、自然奇观、精美文艺作品等。
3.体验类型:以民俗、社会时尚、节庆活动、风味饮食、宗教仪式为主。
4.娱乐类型:主要是文化体育活动、度假疗养、康复保健、人工公园等。
旅游主要分为八大类:文化庆典旅游、文化娱乐事件旅游、商贸及会展旅游、体育赛事旅游、科学教育事件旅游、休闲事件旅游、政治事件旅游、私人事件旅游。
事件旅游有两个方面的含义 :
一方面, 事件旅游是对事件进行系统规划(plan) 、开发(development) 和营销(marketing) 的过程,其出发点是使事件成为旅游吸引物、促进旅游业发展的动力、旅游形象塑造者、提升旅游吸引物和旅游目的地地位的催化剂, 事件旅游发展战略( eventtourism strategy) 还要对新闻媒介(media) 和不良事件(negative event) 的管理做出规划;
另一方面,事件旅游要对事件市场进行细分(market segment) ,包括分析和确定什么人将进行事件旅行(travel to event) 、哪些人可能会离开家而被吸引前来参与事件。
归纳起来可以按照以下方式进行分类:
(1)从大数据处理的过程来分:包括数据存储、数据挖掘分析、以及为完成高效分析挖掘而设计的计算平台,它们完成数据采集、ETL、存储、结构化处理、挖掘、 分析、预测、应用等功能。
(2)从大数据处理的数据类型来划分:可以分为针对关系型数据、非关系型数据(图数据、文本数据、网络型数据等)、半结构化数据、混合类型数据处理的技术平台。
(3)从大数据处理的方式来划分:可以分为批量处理、实时处理、综合处理。其中批量数据是对成批数据进行一次性处理,而实时处理(流处理)对处理的延时有严格的要求,综合处理是指同时具备批量处理和实时处理两种方式。
(4)从平台对数据的部署方式看:可以分为基于内存的、基于磁盘的。前者在分布式系统内部的数据交换是在内存中进行,后者则是通过磁盘文件的方式
Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型,字符串、boolean值、数字等都能保存在Series中。
Time- Series:以时间为索引的Series。
DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。
Panel :三维的数组,可以理解为DataFrame的容器。
Panel4D:是像Panel一样的4维数据容器。
PanelND:拥有factory集合,可以创建像Panel4D一样N维命名容器的模块。
根据不同的分类方法,可以将统计数据分为以下几种类型:
按计量层次分类
按照数据的计量层次,可以将统计数据分为定类数据、定序数据、定距数据与定比数据。
1.定类数据。这是数据的最低层。它将数据按照类别属性进行分类,各类别之间是平等并列关系。这种数据不带数量信息,并且不能在各类别间进行排序。例如,某商场将顾客所喜爱的服装颜色分为红色、白色、黄色等,红色、白色、黄色即为定类数据。又如,人类按性别分为男性和女性也属于定类数据。虽然定类数据表现为类别,但为了便于统计处理,可以对不同的类别用不同的数字或编码来表示。如1表示女性,2表示男性,但这些数码不代表着这些数字可以区分大小或进行数学运算。不论用何种编码,其所包含的信息都没有任何损失。对定类数据执行的主要数值运算是计算每一类别中的项目的频数和频率。[3]
2.定序数据。这时数据的中间级别。定序数据不仅可以将数据分成不同的类别,而且各类别之间还可以通过排序来比较优劣。也就是说,定序数据与定类数据最主要的区别是定序数据之间还是可以比较顺序的。例如,人的受教育程度就属于定序数据。我们仍可以采用数字编码表示不同的类别:文盲半文盲=1,小学=2,初中-3,高中=4,大学=5,硕士=6,博士=7.通过将编码进行排序,可以明显地表示出受教育程度之间的高低差异。虽然这种差异程度不能通过编码之间的差异进行准确的度量,但是可以确定其高低顺序,即可以通过编码数值进行不等式的运算。[3]
3.定距数据。定距数据是具有一定单位的实际测量值(如摄氏温度、考试成绩等)。此时不仅可以知道两个变量之间存在差异,还可以通过加、减法运算准确的计算出各变量之间的实际差距是多少。可以说,定距数据的精确性比定类数据和定序数据前进了一大步,它可以对事物类别或次序之间的实际距离进行测量。例如,甲的英语成绩为80分,乙的英语成绩为85分,可知乙的英语成绩比甲的高5分。[3]
4.定比数据。这是数据的最高等级。它的数据表现形式同定距数据一样,均为实际的测量值。定比数据与定距数据唯一的区别是:在定比数据中是存在绝对零点的,而定距数据中是不存在绝对零点的(零点是人为制定的)。因此定比数据间不仅可以比较大小,进行加、减运算,还可以进行乘、除运算。[3]
在统计分析中,区分数据的类型十分重要,不同测度类型的数据,扮演的角色是不一样的。[3]
按来源分类
数据的来源主要有两种渠道:一种是通过直接的调查获得的原始数据,一般称为第一手或直接的统计数据;另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称之为第二手或间接的统计数据。[3]
按时间状况分类
1.时间序列数据。它是指在不同的时间上搜集到的数据,反映现象随时间变化的情况。
2.截面型数据。它是指在相同的或近似的时间点上搜集到的数据,描述现象在某一时刻的变化情况。
一、按地理范围分类
按旅游者到达目的地的地理范围划分,旅游活动可以分为国际旅游和国内旅游。
二、按旅游性质和目的分类
按旅游性质和人们出游的目的划分,旅游活动可分为六大类:
1、休闲,娱乐,度假类
2、探亲,访友类
3、商务,专业访问类
4、健康医疗类
5、宗教朝圣类主要是指宗教界人士进行的以朝圣,传经布道为主要目的的旅游活动.
6、其他类
三、按人数分类
1、 团队旅游
2、散客旅游
3、自助旅游
4、互助旅游
两种数据都是用来描述对象特征的数据类型,但它们在统计学和数据分析中具有不同的应用和数学特征。
定性数据,也称为定类数据或分类数据,是一种用于描述对象属性的数据类型,可以用来区分不同的类别或属性。定性数据通常以文字或数字的形式表示,但这些数字并不代表数量的大小或顺序。定性数据的数学特征是“=”或“≠”,它们仅用于表示不同类别的品质。例如,人的性别是一个定性数据,因为它只能分为男性和女性两个类别,这两个类别之间不存在数量上的大小关系。
分类数据是定性数据的一种特殊形式,通常用于描述对象的属性或类别归属。与定性数据不同,分类数据通常以文字或数字的形式表示,但这些数字仅代表不同的类别,并不表示数量的大小或顺序。分类数据的数学特征也是“=”或“≠”,它们仅用于表示不同类别的品质。例如,学生的专业是一个分类数据,因为每个学生只能属于一个专业,不同的专业之间不存在数量上的大小关系。
总的来说,定性数据和分类数据都是描述对象属性的数据类型,但它们的主要区别在于它们的应用和数学特征。定性数据主要用于描述对象的属性或类别,而分类数据则更侧重于描述对象的类别归属。
1.主数据(Master Data): 主数据是关于业务实体的数据,描述组织内的“物”,如:人,地点,客户,产品等。
2.交易数据(事务数据,Transactional Data):交易数据(事务数据、业务数据)描述组织业务运营过程中的内部或外部事件或交易记录。如:销售订单,通话记录等。
3.参考数据(Reference Data):参考数据是用于将其他数据进行分类或目录整编的数据,规定参考数据值是几个允许值之一。如:客户等级分为A,B,C三级。
4.统计分析数据(指标、Analytical Data):统计分析数据是对企业业务活动进行统计分析的数值型数据,即:指标。如:客户到达数、数据接入率等。
5.元数据(Meta Data):元数据是描述数据的数据,帮助理解、获取、使用数据,分为技术元数据和业务元数据等。
统计数据按不同的分类规则可分为不同的类型,这里主要按三种分类规则分类。
(1)按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
(2)按照统计数据的收集方法,可以将其分为观测数据(observational data)和实验数据(experimental data)。
(3)按照被描述的对象与时间的关系,可以将统计数据分为截面数据和时间序列数据。