数据分析中的变量分类

数据分析中的变量分类

数据分析工作每天要面对各种各样的数据,每种数据都有其特定的含义、使用范围和分析方法,同一个数据在不同环境下的意义也不一样,因此我们想要选择正确的分析方法,得出正确的结论,首先要明确分析目的,并准确理解当前的数据类型及含义。统计学中的变量指的是研究对象的特征,我们有时也称为属性,例如身高、性别等。每个变量都有变量值,变量值就是我们分析的内容,它是没有含义的,只是一个参与计算的数字,所以我们主要关注变量的类型,不同的变量类型有不同的分析方法。

变量主要是用来描述事物特征,那么按照描述的粗劣,有以下两种划分方法:

按基本描述划分

【定性变量】:也称为名称变量、品质变量、分类变量,总之就是描述事物特性的变量,目的是将事物区分成互不相容的不同组别,变量值多为文字或符号,在分析时,需要转化为特定含义的数字。

定性变量可以再细分为:

有序分类变量:描述事物等级或顺序,变量值可以是数值型或字符型,可以进而比较优劣,如喜欢的程度:很喜欢、一般、不喜欢

无序分类变量:取值之间没有顺序差别,仅做分类,又可分为二分类变量和多分类变量 二分类变量是指将全部数据分成两个类别,如男、女,对、错,阴、阳等,二分类变量是一种特殊的分类变量,有其特有的分析方法。 多分类变量是指两个以上类别,如血型分为A、B、AB、O

【定量变量】:也称为数值型变量,是描述事物数字信息的变量,变量值就是数字,如长度、重量、产量、人口、速度和温度。

定量变量可以再细分

连续型变量:在一定区间内可以任意取值,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。如身高、绳子的长度等。

离散型变量:值只能用自然数或整数单位计算,其数值是间断的,相邻两个数值之间不再有其他数值,这种变量的取值一般使用计数方法取得。

按照精确描述划分

【定类变量】

测量事物类别或属性,各类支架没有顺序或等级,实际上也就是上面说的无序分类变量,所包含的数据信息很少,只能计算频数和频率,是最低层次的一种变量

【定序变量】

测量事物之间的等级或顺序,就是上述的有序分类变量,由于它的变量值可以是数值型或字符型,并且可以反映等级之间的优劣,除了可以计算频数和频率之外,还可以计算累计频率,因此数据包含的信息多于定类变量。

【定距变量】

测量事物的类别或顺序之间的间距,它不但具有定类和定序变量的特点,还能计算类别之间的差距,可以进行加减运算,数据包含的信息高于前两种

【定比变量】 测量事物类别比值,和定距变量相比,它不但可以进行加减运算,还可以进行乘除运算,包含的数据信息最多,是最高级的变量。

上面这四种变量可以从浅到深精确的描述事物,四种变量级别从低到高,高层次变量可以向低层次转化,代价是损失部分数据信息,但是低层次变量无法向高层次转化,这会得出错误结果。

按照变量的取值划分

前面两种分类方法都是从变量对事物的描述角度出发进行分类,一旦对事物描述确定下来,那么变量的取值也就相应确定下来了,比如定性变量的取值只能是某属性下的计数,比如人数、客户数等,因此只能取特定的值,数值是离散的。而定量变量可以取某属性下的任意值,变量值即可连续也可离散,比如身高、体重、销售额等。连续型数值和离散型数值的分析方法是不同的,因此从统计学角度,又经常划分为连续型变量和定性变量(分类变量)

关于变量的类型及取值方法,可以归纳为下表

以上是小编为大家分享的关于数据分析中的变量分类的相关内容,更多信息可以关注环球青藤分享更多干货



  • 浠涔堟槸鍒嗙被鍙橀噺?
    绛旓細4. 澶鍒嗙被鍙橀噺鍒欏寘鍚笁涓垨鏇村鐨勭被鍒銆備緥濡傦紝琛鍨嬪彲浠ュ垎涓篈鍨嬨丅鍨嬨丄B鍨嬪拰O鍨嬶紝钄彍鍙互鍒嗕负璞嗙被銆佸彾绫诲拰鏍圭被绛夈5. 鐞嗚В鍒嗙被鍙橀噺鐨勬剰涔夊湪浜庯紝鍦ㄨ繘琛鏁版嵁鍒嗘瀽鏃讹紝蹇呴』鏄庣‘鏁版嵁鐨勭被鍨鍜屽惈涔夛紝浠ュ強瀹冧滑閫傜敤鐨勫垎鏋愭柟娉曘備笉鍚岀殑鍒嗘瀽鐩殑鍙兘闇瑕佷笉鍚岀殑鍒嗘瀽鎶鏈紝浠ュ緱鍑哄噯纭殑缁撹銆6. 鍦ㄧ粺璁″涓紝鍙橀噺...
  • 濡備綍杩涜鍙橀噺鐨勫鍒嗙被鍒嗘瀽?
    绛旓細浣嶇疆銆佽喘涔板巻鍙茬瓑銆備互涓婃墍鎻愬強鐨勬柟娉曢兘鏈夊悇鑷殑閫傜敤鍦烘櫙鍜岄檺鍒讹紝閫夋嫨鍝鏂规硶鍙栧喅浜鏁版嵁鐨鎬ц川銆佹牱鏈噺澶у皬銆佽绠楄祫婧愪互鍙婇棶棰樼殑鍏蜂綋鑳屾櫙銆傚湪瀹為檯搴旂敤涓紝閫氬父浼氱粨鍚堜笟鍔$悊瑙e拰鏁版嵁鎺㈢储锛岄夋嫨鏈鍚堥傜殑鏂规硶杩涜澶鍒嗙被鍙橀噺鐨鍒嗘瀽銆傚悓鏃讹紝涔熷彲浠ョ粨鍚堜氦鍙夐獙璇併丄UC銆佹贩娣嗙煩闃电瓑鎸囨爣锛屽妯″瀷鐨勬ц兘杩涜璇勪及鍜屼紭鍖栥
  • 鏈夊簭鍒嗙被鍙橀噺鏈夊摢浜
    绛旓細濡傚叏鑱屽伐浣溿佸吋鑱屽伐浣溿佸け涓氬拰閫浼戠瓑銆5. 瀹跺涵浜哄彛鏁帮細瀹跺涵浜哄彛鏁颁篃鍙互琚涓轰竴涓湁搴鍒嗙被鍙橀噺锛屽畠鍙互鎸夌収瀹跺涵涓垚鍛樼殑鏁伴噺鏉ュ垎绫伙紝濡傚崟韬佷簩浜轰笘鐣屻佷笁鍙d箣瀹跺拰澶氬彛涔嬪绛夈傛湁搴忓垎绫诲彉閲忓湪缁熻瀛︿腑鍏锋湁閲嶈鎰忎箟锛屽洜涓哄畠浠彲浠ュ府鍔╃爺绌惰呮洿濂藉湴鐞嗚В鍜鍒嗘瀽鏁版嵁锛屼粠鑰屽緱鍑烘洿鍑嗙‘鐨勭粨璁恒
  • 鍒嗙被鍙橀噺绌剁珶鍒嗕负鍝嚑绫?
    绛旓細鍒嗙被鍙橀噺鍙垎涓烘棤搴忓彉閲忓拰鏈夊簭鍙橀噺涓ょ被銆備竴銆佹棤搴忓垎绫诲彉閲忔槸鎸囨墍鍒嗙被鍒垨灞炴т箣闂存棤绋嬪害鍜岄『搴忕殑宸埆銆傛棤搴忓垎绫诲張鍙垎涓猴細1銆佷簩椤瑰垎绫伙紝濡傛у埆锛堢敺銆佸コ锛夛紝鑽墿鍙嶅簲锛堥槾鎬у拰闃虫э級绛夛紱2銆佸椤瑰垎绫伙紝濡傝鍨嬶紙O銆丄銆丅銆丄B锛夛紝鑱屼笟锛堝伐銆佸啘銆佸晢銆佸銆佸叺锛夌瓑銆傚浜庢棤搴忓垎绫诲彉閲忕殑鍒嗘瀽锛屽簲鍏堟寜...
  • 绠杩版暟鍊煎彉閲忎笌鍒嗙被鍙橀噺鐨勫尯鍒
    绛旓細瀵逛簬鍒嗙被鍙橀噺锛屽父鐢ㄧ殑缁熻鍒嗘瀽鏂规硶鍖呮嫭棰戞暟鍒嗘瀽銆佸崱鏂规楠岀瓑锛屼互浜嗚В涓嶅悓绫诲埆涔嬮棿鐨勫垎甯冨拰鍏崇郴銆傛荤殑鏉ヨ锛屾暟鍊煎彉閲忓拰鍒嗙被鍙橀噺鍦ㄦц川銆佺敤閫斿拰缁熻鍒嗘瀽鏂规硶涓婃湁鐫鏄捐憲鐨勫尯鍒傛暟鍊煎彉閲忎晶閲嶄簬鏁板艰绠楀拰閲忓寲鍒嗘瀽锛岃屽垎绫诲彉閲忓垯鏇翠晶閲嶄簬鏁版嵁鐨勫垎缁勫拰鍒嗙被銆傚湪瀹為檯搴旂敤涓紝闇瑕佹牴鎹爺绌堕棶棰樺拰鏁版嵁绫诲瀷閫夋嫨鍚堥鐨勫彉...
  • 鍦鏁版嵁鍒嗘瀽涓,鎴戜滑甯稿父濡備綍澶勭悊鏈夊簭鍒嗙被鍙橀噺?
    绛旓細鍦鏁版嵁鍒嗘瀽涓锛屾垜浠粡甯搁亣鍒颁竴绉嶅叿鏈夊浐鏈夐『搴鐨勫垎绫诲彉閲锛岀О涓烘湁搴忓垎绫诲彉閲忋傝繖绫诲彉閲忓寘鎷緥濡傛暀鑲叉按骞筹紙灏忓銆佷腑瀛︺佸ぇ瀛︼級鍜屼骇鍝佹弧鎰忓害锛堥潪甯镐笉婊℃剰銆佷笉婊℃剰銆佷竴鑸佹弧鎰忋侀潪甯告弧鎰忥級銆傚鐞嗘湁搴忓垎绫诲彉閲忕殑甯歌鏂规硶濡備笅锛1. 缂栫爜锛氫负浜嗘暟瀛﹁绠楀拰缁熻鍒嗘瀽鐨勪究鍒╋紝鏈夊簭鍒嗙被鍙橀噺闇瑕佽浆鎹㈡垚鏁板煎瀷鍙橀噺銆傚父鐢ㄧ殑...
  • 绠杩版暟鍊煎彉閲忎笌鍒嗙被鍙橀噺鐨勫尯鍒
    绛旓細鍒嗙被鍙橀噺铏界劧绠鍗曟槗鎳傦紝浣嗗彲鑳芥棤娉曟兜鐩栨墍鏈夌殑淇℃伅锛屼笖鍦ㄦ煇浜涙儏鍐典笅鍙兘瀛樺湪涓昏鎬у拰姝т箟鎬с傚洜姝わ紝鍦ㄩ夋嫨鍙橀噺绫诲瀷鏃讹紝闇瑕佺患鍚堣冭檻鐮旂┒鐩殑銆佹暟鎹壒鐐瑰拰鍒嗘瀽闇姹傘傜患涓婃墍杩帮紝鏁板煎彉閲忓拰鍒嗙被鍙橀噺鍦ㄦ祴閲忓昂搴︺佹暟鎹〃绀烘柟寮忎互鍙婄粺璁″垎鏋愭柟娉曚笂瀛樺湪鐫鏄捐憲鐨勫樊寮傘傚湪鏁版嵁鍒嗘瀽鍜岀爺绌朵腑锛屾纭尯鍒嗗拰閫夋嫨鍚堥鐨勫彉閲忕被鍨...
  • 銆婄粺璁℃硶鍩虹銆嬬煡璇嗙偣:鏁版嵁绫诲瀷
    绛旓細(涓)瀹氭у彉閲(鏁版嵁)涓庡畾閲忓彉閲(鏁版嵁)1銆佸畾鎬у彉閲忥細鍙嶆槧鈥滆亴涓氣濄佲滄暀鑲茬▼搴︹濈瓑鐜拌薄鐨勫睘鎬х壒鐐鐨勫彉閲锛屼笉鑳借鏄庡叿浣撻噺鐨勫ぇ灏忓拰宸紓銆鍒嗙被鍙橀噺锛氭病鏈夐噺鐨勭壒寰侊紝鍙湁鍒嗙被鐗瑰緛銆傝繖绉嶅彧鍙嶆槧鐜拌薄鍒嗙被鐗瑰緛鐨勫彉閲忓張绉板垎绫诲彉閲忋傚垎绫诲彉閲忕殑瑙傛祴缁撴灉灏辨槸鍒嗙被鏁版嵁銆傝鏄庝簨鐗绫诲埆鐨勪竴涓悕绉般傚鈥滄у埆鈥濆氨鏄竴涓...
  • Stata鏁版嵁鍒嗘瀽濡備綍鍒涘缓鍒嗙被鍙橀噺?
    绛旓細鍦 Stata 涓垱寤哄垎绫诲彉閲忓彲浠ラ氳繃浠ヤ笅鏂规硶瀹屾垚锛1銆佺‘淇濅綘鐨鏁版嵁闆嗕腑鍖呭惈涓涓傚悎浣滀负鍒嗙被鍙橀噺鐨勫彉閲銆傝鍙橀噺鍙互鏄暟鍊煎瀷鍙橀噺鎴栧瓧绗︿覆鍨嬪彉閲忋2銆佹墦寮 Stata 杞欢锛屽苟杩涘叆鍛戒护绐楀彛銆3銆佸鏋滀綘鐨勫彉閲忔槸鏁板煎瀷鍙橀噺锛屼綘鍙互浣跨敤 "recode" 鍛戒护灏嗗叾杞崲涓哄垎绫诲彉閲忋傚亣璁句綘鐨勫彉閲忓悕涓 "score"锛屽ぇ浜庣瓑浜70鐨...
  • 鏍规嵁娑夊強鐨勫彉閲澶氬皯涓嶅悓,鍙垎涓篲__銆乢__鍜屽鍙橀噺缁熻鍒嗘瀽?
    绛旓細3銆佸湪鐢甸暅鍗曢绮掑垎鏋愬鐞嗕腑锛屽鍙橀噺缁熻鍒嗘瀽涓昏鍖呮嫭涓绘垚鍒嗗垎鏋愬拰瀵瑰簲鍒嗘瀽銆傚崟鍙橀噺缁熻鍒嗘瀽鐨勫垎绫锛氬崟鍙橀噺缁熻鍒嗘瀽鍙互鍒嗕负涓や釜澶х殑鏂归潰锛屽嵆鎻忚堪缁熻鍜屾帹璁虹粺璁°傛弿杩扮粺璁$殑涓昏鐩殑鍦ㄤ簬鐢ㄦ渶绠鍗曠殑姒傛嫭褰㈠紡鍙嶆槧鍑哄ぇ閲鏁版嵁璧勬枡鎵瀹圭撼鐨勫熀鏈俊鎭傚畠鐨勫熀鏈柟娉曞寘鎷泦涓秼鍔垮垎鏋愩佺鏁h秼鍔垮垎鏋愮瓑銆傝屾帹璁虹粺璁″垯鏄...
  • 扩展阅读:数据分析公式一览表 ... 数据分析柱状图 ... 数据分析报告模板大全 ... 常见数据分析图表 ... 数据分析三大软件 ... 一键生成数据分析图 ... 数据分析的五种方法 ... 质量数据分析图表 ... 怎么做图表数据分析图 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网