请问从事数据分析方面的工作,都需要一些什么基础理论知识。 要做一个数据分析师需要哪些理论基础?

\u6210\u4e3a\u4e00\u540d\u6570\u636e\u5206\u6790\u5e08\uff0c\u9700\u8981\u5177\u5907\u54ea\u4e9b\u57fa\u672c\u77e5\u8bc6\uff1f


\u6570\u636e\u5206\u6790\u5e08\u9700\u8981\u5177\u5907\u7684\u80fd\u529b\uff1a

1\u3001\u4f60\u9700\u8981\u6709\u5e94\u7528\u6570\u5b66\u3001\u7edf\u8ba1\u5b66\u3001\u6570\u91cf\u7ecf\u6d4e\u5b66\u4e13\u4e1a\u672c\u79d1\u6216\u8005\u5de5\u5b66\u7855\u58eb\u5c42\u6b21\u6c34\u5e73\u7684\u6570\u5b66\u77e5\u8bc6\u80cc\u666f\u3002

2\u3001\u81f3\u5c11\u719f\u7ec3SPSS\u3001STATISTIC\u3001Eviews\u3001SAS\u7b49\u6570\u636e\u5206\u6790\u8f6f\u4ef6\u4e2d\u7684\u4e00\u95e8\u3002

3\u3001\u81f3\u5c11\u80fd\u591f\u7528Acess\u7b49\u8fdb\u884c\u6570\u636e\u5e93\u5f00\u53d1\uff1b

4\u3001\u81f3\u5c11\u638c\u63e1\u4e00\u95e8\u6570\u5b66\u8f6f\u4ef6\uff1amatalab\uff0cmathmatics\u8fdb\u884c\u65b0\u6a21\u578b\u7684\u6784\u5efa\u3002

5\u3001\u81f3\u5c11\u638c\u63e1\u4e00\u95e8\u7f16\u7a0b\u8bed\u8a00\uff1b

6\uff0c\u5f53\u7136\u8fd8\u8981\u5176\u4ed6\u5e94\u7528\u9886\u57df\u65b9\u9762\u7684\u77e5\u8bc6\uff0c\u6bd4\u5982\u5e02\u573a\u8425\u9500\u3001\u7ecf\u6d4e\u7edf\u8ba1\u5b66\u7b49\uff0c\u56e0\u4e3a\u8fd9\u662f\u6570\u636e\u5206\u6790\u7684\u4e3b\u8981\u5e94\u7528\u9886\u57df\u3002

结合自身的学习、面试经验做了一个整理,对于新手来说,掌握以下知识/技能,就足以找到一份初阶的数据分析师(注意,不是数据专员,这两者是有区别的,找工作的小伙伴切记仔细分辨)的工作:

1、统计基础;

2、分析理论

3、Excel

4、SQL

5、R

6、Python

仅仅知道要学什么是不够的,还需要知道学到什么程度才是合适的,这其实才是广大新手村小伙伴最大的困惑!按照笔者的看法,以上每项技能/知识应当掌握的程度如下:

我把每个技能的熟练程度划分为5个等级,依次分别是:1、了解基本概念;2、知道基本理论/会简单操作;3、熟知原理/熟练操作;4、数学、逻辑论证/灵活应用;5、精通、专家/能改进、优化。对于入门者来说,上面这几个知识领域大多只需要掌握2-3的熟练程度即可。

统计基础是每个人都必须掌握的,自然是学的越深入越好,不过对于基础比较差的伙伴来说,也不必太过苛求,大约掌握信息图形化、条件概率、贝叶斯公式、相关与独立、几何分布、二项分布、泊松分布、正态分布、统计抽样、估计、置信区间、假设检验这些,就差不多了。《深入浅出统计学》是一本不错的入门书,但是仅有这一本是不够的,请务必找一本更具严谨性和系统性的教材结合使用。

分析理论也是个绕不开的问题,尤其对于很多自学的伙伴来说,这一块可能比较容易疏忽。笔者作为新手,对这部分内容其实也不熟悉,能给出的建议不多。

大多数企业的内部数据存储在传统的关系型数据库中,作为分析师不可避免的要和数据库打交道,那么SQL是数据分析必备的技能了。好在SQL语言本身非常的简单易学。笔者认为只要会写简单的查询、存储过程就可以了,推荐大家买一本《SQL必知必会》放在手边,随时翻看。

R语言和Python语言应该是当前数据分析领域的双雄了,R语言支持者众多,相关库包极为丰富;Python则胜在灵活易用,通用性更加广泛。在网上,关于这两种语言的争论也从未止息。笔者建议初学者要对这两种语言都有所了解,但选择其中一项作为自己的主力语言。对于R语言来说,学会其命令行用法、掌握基本的数据分析库包(tidyr,dplyr,ggplot2)即可;对于Python语言,需要掌握其基本语法、函数和相关库包(numpy, pandas, matplotlib, sklearn)。

可能很多伙伴经过一段时间学习以后,会对Excel这样一个工具不屑一顾,认为这是个非常低端的工具,完全不如R或者Python一般酷炫。但其实完全不该有此想法。笔者曾爬取拉钩网上数据分析这个岗位的信息并做过统计分析,在整个就业市场上,数据分析岗位对Excel技能的需求量非常之大。

除了SQL之外,Excel是数据分析岗位要求频率最高的技能。好在,这个神器其实是非常简单易学的,并且网络上存在海量的各种教程和教材,随处可得。笔者认为只要学会常见函数的使用、各类基础图表的制作以及数据透视就能满足大部分需求。推荐大家买一本《谁说菜鸟不懂数据分析》放在手边,学习疲惫之余拿出来当故事书看看。

机器学习这一块其实应该算是数据分析岗位的加分项,不一定是必须的,看具体岗位。但是现在越来越多公司的数据分析岗要求对机器学习有一定的认知,笔者认为,关于机器学习算法,能够熟悉常见算法的基本原理、了解其用途和优缺点即可。比如:分类算法里的贝叶斯、决策树、随机森林;回归算法里的线性回归、Adaboost回归;聚类算法里的K-means算法等。另外了解一下用于降维的PCA等。

每个人的情况不同,每个岗位的情况需求也不同,大家还是需要根据自己的实际情况来认真思考,安排好自己的学习方向和计划。



基础的应该:财务基础知识、统计基础知识 具备了以上基本知识以后再懂得你从事行业的相关知识

当然是数据方面的

  • 鏁版嵁鍒嗘瀽宸ョ▼甯堥兘鍋氫粈涔宸ヤ綔?
    绛旓細1銆佷换浣曟妧鏈被鐨勫矖浣嶅仛寰楃粡楠屼赴瀵锛岄兘涓嶄細澶樊锛岃嚦灏戦兘鏄湀钖繃涓+锛2銆佸ぇ鏁版嵁鍒嗘瀽宸ョ▼甯堬紝浣犲緱浜嗚Вpython锛岃嚦灏戜細鍐欑偣鑴氭湰锛涘叾娆′篃鍙互浜嗚В涓浜涘垎鏋愬伐鍏 濡俥xcel銆乼ableau鍙鍖栧垎鏋愬伐鍏枫佹暟鎹簱锛坢ysql锛夈佸鏋滈渶瑕佹洿娣卞叆涔熷彲浠ヤ簡瑙d竴涓嬪ぇ鏁版嵁寮鍙戝伐鍏 hadoop銆乻park銆乭ive銆丷銆乻cala銆乯ava銆佷簯璁$畻銆佹満鍣...
  • 瀛︿粈涔堜笓涓氬彲浠ュ皢鏉浠庝簨鏁版嵁鍒嗘瀽鐨勫伐浣?
    绛旓細姝ゅ锛屾暟鎹垎鏋愬笀鐨勮柂璧勬按骞充篃鐩稿杈冮珮锛屼緥濡傚湪鍖椾含锛屽ぇ鏁版嵁搴旂敤鍨嬩汉鎵嶅钩鍧囧伐璧勪负31170鍏/鏈堬紝钖祫鍦30k-50k涔嬮棿鐨勪汉鍗犳讳汉鏁扮殑66.7%銆傜患涓婃墍杩帮紝瀛︿範鏁版嵁鍒嗘瀽銆佺粺璁″銆佽绠楁満绉戝銆佸晢涓氭櫤鑳斤紙BI锛夋垨澶ф暟鎹互鍙婃暟瀛︾瓑涓撲笟閮藉彲浠ヤ负灏嗘潵浠庝簨鏁版嵁鍒嗘瀽宸ヤ綔鎵撲笅鍧氬疄鐨勫熀纭銆傚湪閫夋嫨涓撲笟鏃讹紝鍙互鏍规嵁鑷繁鐨勫叴瓒e拰...
  • 澶鏁版嵁鎵浠庝簨浠涔宸ヤ綔
    绛旓細澶ф暟鎹妧鏈笓涓氬彲浠浠庝簨鐨勫伐浣鏈夎繖浜涳細瑙嗘暟鎹殑鏈烘瀯宸茬粡瓒婃潵瓒婂锛屼笂鍒板浗闃查儴锛屼笅鍒颁簰鑱旂綉鍒涗笟鍏徃銆侀噾铻嶆満鏋勯渶瑕侀氳繃澶ф暟鎹」鐩潵鍋氬垱鏂伴┍鍔紝闇瑕鏁版嵁鍒嗘瀽鎴栧鐞嗗矖浣嶄篃寰堝;甯歌鐨勯鍝佸埗閫犮侀浂鍞數鍟嗐佸尰鐤楀埗閫犮佷氦閫氭娴嬬瓑涔熼渶瑕佹暟鎹垎鏋愪笌澶勭悊锛屽浼樺寲搴撳瓨锛岄檷浣庢垚鏈紝棰勬祴闇姹傜瓑銆備汉鎵嶄富瑕佸垎鎴愪笁澶х被锛氬ぇ鏁版嵁...
  • 鍋氫竴鍚鏁版嵁鍒嗘瀽甯堣鍏峰浠涔堣兘鍔
    绛旓細锛5锛変細鍩烘湰鐨勬暟鎹彲瑙嗗寲鎶鑳斤紝鑳芥挵鍐欐暟鎹姤鍛 锛6锛夌啛鎮夊父鐢ㄧ殑鏁版嵁鎸栨帢绠楁硶锛氬洖褰掑垎鏋愩佸喅绛栨爲銆侀殢鏈烘.鏋椼佹敮鎸佸悜閲忔満绛 涔嬪悗锛屾庝箞瀹夋帓鑷繁鐨勪笟浣欐椂闂村氨鐪嬩釜浜轰簡銆傛讳綋鏉ヨ锛屽厛瀛﹀熀纭锛屽啀瀛︾悊璁猴紝鏈鍚庢槸宸ュ叿銆傚熀鏈笂锛屾瘡涓闂ㄨ瑷鐨勫涔犻兘鏄鎸夌収杩欎釜椤哄簭鏉ョ殑銆1銆佸涔鏁版嵁鍒嗘瀽鍩虹鐭ヨ瘑锛屽寘鎷鐜囪銆...
  • 濡備綍杩涜鏁版嵁鍒嗘瀽宸ヤ綔鍛?
    绛旓細姝ゅ锛屽鏋滆鎯宠蛋鐨勬洿杩滐紝杩樿鑳芥帉鎻′竴浜涚紪绋嬭兘鍔涳紝浠庤屽熶綇涓浜涗笓涓氱殑鏁版嵁鍒嗘瀽宸ュ叿锛屽府鍔╀綘瀹屾垚宸ヤ綔銆傗︹﹀ソ濂藉涔狅紝铏界劧绱紝浣嗘槸瑕佸潥鎸侊紒2銆佽蒋浠剁浉鍏筹細浠庝簨鏁版嵁鍒嗘瀽鏂归潰鐨勫伐浣蹇呭鐨勫伐鍏锋槸浠涔 锛1锛夋暟鎹垎鏋愭姤鍛婄被锛歁icrosoft Office杞欢绛夛紝濡傛灉杩瀍xcel琛ㄦ牸鍩烘湰鐨勫鐞嗘搷浣滈兘涓嶄細锛岃繛PPT鎶ュ憡閮戒笉浼氬仛锛...
  • 鏁版嵁鍒嗘瀽甯堢殑涓昏宸ヤ綔鏈夊摢浜?
    绛旓細鏁版嵁鍒嗘瀽甯堢殑涓昏宸ヤ綔鏈夊摢浜涳紵鏁版嵁鍒嗘瀽甯堢殑涓昏宸ヤ綔鏈夛細1銆佸浼氬熷姪鎶鏈墜娈佃繘琛岄珮鏁堢殑鏁版嵁澶勭悊锛2銆佸湪鏁版嵁鐮旂┒鐨勬柟娉曡鏂归潰杩涜鍒涙柊鍜岀獊鐮达紱3銆佸噯纭佽缁嗗拰鍙婃椂鍦颁簡瑙e彈浼楃姸鍐靛拰鍙樺寲瓒嬪娍锛4銆佸彂鎸ユ秷璐硅鏁版嵁鍒嗘瀽鐨鑱岃兘锛屾敮鎾戝叕鍙告敼鍠勫鎴锋湇鍔★紱鏁版嵁鍒嗘瀽甯堟槸鏁版嵁甯堢殑涓绉嶏紝鎸囩殑鏄笉鍚岃涓氫腑锛屼笓闂浠庝簨琛屼笟...
  • 鏁版嵁鍒嗘瀽甯堣鎺屾彙鍝簺鎶鑳
    绛旓細4銆佽鎵撳ソ鎵庡疄鐨 SQL 鍩虹 SQL 鍩虹涔嬫墍浠ラ噸瑕侊紝鏄洜涓鏁版嵁鍒嗘瀽甯鍒嗘瀽鐨鏁版嵁澶у閮芥槸浠庢暟鎹簱涓彁鍙栬屾潵鐨勩傛湁鑹ソ鐨 SQL 鍔熷簳骞惰兘鐔熸倝浣跨敤锛屼笉浠呰兘鎻愬彇鍒伴渶瑕佺殑鏁版嵁锛岃繕鑳藉ぇ澶ф彁楂宸ヤ綔鏁堢巼銆傛敞鎰忥細1銆佷笌浼犵粺鐨勬暟鎹垎鏋愬笀鐩告瘮锛屼簰鑱旂綉鏃朵唬鐨勬暟鎹垎鏋愬笀闈复鐨勪笉鏄暟鎹尞涔忥紝鑰屾槸鏁版嵁杩囧墿銆傚洜姝わ紝浜掕仈缃戞椂浠...
  • 鏁版嵁鍒嗘瀽甯堝叿浣撴槸鍋氫粈涔宸ヤ綔鐨?
    绛旓細3銆佸浜庢柊闂诲嚭鐗堢瓑鍐呭浜т笟鏉ヨ锛屾洿涓哄叧閿殑鏄紝鏁版嵁鍒嗘瀽甯堝彲浠ュ彂鎸ュ唴瀹规秷璐硅呮暟鎹垎鏋愮殑鑱岃兘锛岃繖鏄敮鎾戞柊闂诲嚭鐗堟満鏋勬敼鍠勫鎴锋湇鍔$殑鍏抽敭鑱岃兘銆傛暟鎹垎鏋愬笀鐨勬妧鑳借姹傦細1銆佹噦涓氬姟锛浠庝簨鏁版嵁鍒嗘瀽宸ヤ綔鐨勫墠鎻愬氨浼氶渶瑕佹噦涓氬姟锛屽嵆鐔熸倝琛屼笟鐭ヨ瘑銆佸叕鍙镐笟鍔″強娴佺▼锛屾渶濂芥湁鑷繁鐙埌鐨勮瑙o紝鑻ヨ劚绂昏涓氳鐭ュ拰鍏徃涓氬姟鑳屾櫙锛...
  • 鏁版嵁鍒嗘瀽甯堥兘鏈夊摢浜涘彂灞曟柟鍚?
    绛旓細鏁版嵁鍒嗘瀽甯堢畻寰椾笂鏄竴涓柊鐨勮亴涓氾紝鏄即闅忕潃澶ф暟鎹殑涓嶆柇鍙戝睍鑰岃癁鐢熺殑涓涓亴涓氥傚仛涓轰竴鍚嶆暟鎹垎鏋愬笀锛屼富瑕鐨勫伐浣鍐呭灏辨槸瀵瑰ぇ閲忔暟鎹繘琛屽強鏃跺噯纭殑鍒嗘瀽鍜屾暣鐞嗭紝鐒跺悗寰楀嚭缁撹锛岃繘鑰屽鍏徃浼佷笟鐨勫彂灞曚互鍙婂喅绛栨彁渚涘府鍔╋紝涓嶄粎楂樿柂锛屽悓鏃惰繕姣旇緝鐨勯珮绔紝灞炰簬浜掕仈缃戦珮绉戞妧琛屼笟銆傞偅涔锛屾暟鎹垎鏋甯堥兘鏈夊摢浜涘彂灞曟柟鍚戝憿锛
  • 鏁版嵁鍒嗘瀽涓庡ぇ鏁版嵁涓撲笟鐨勫氨涓氭柟鍚戞湁鍝簺?
    绛旓細3銆佸ぇ鏁版嵁鍒嗘瀽甯堬細姝ょ被浜烘墠涓昏浠庝簨鏁版嵁鎸栨帢宸ヤ綔锛杩愮敤绠楁硶鏉ヨВ鍐冲拰鍒嗘瀽闂锛岃鏁版嵁鏄鹃湶鍑虹湡鐩革紝鍚屾椂锛屼粬浠繕鎺ㄥ姩鏁版嵁瑙e喅鏂规鐨勪笉鏂洿鏂般傞殢鐫鏁版嵁闆嗚妯′笉鏂澶э紝浼佷笟瀵笻adoop鍙婄浉鍏崇殑寤変环鏁版嵁澶勭悊鎶鏈Hive銆丠Base銆丮apReduce銆丳ig绛夌殑闇姹傚皢鎸佺画澧為暱锛屽叿澶嘓adoop妗嗘灦缁忛獙鐨勬妧鏈汉鍛樻槸寰堟姠鎵嬬殑澶ф暟鎹汉鎵...
  • 扩展阅读:数据分析师有前途吗 ... 数据分析报告模板大全 ... 数据分析师十大证书 ... 想找一份怎样的工作 ... 数据分析师有多可怕 ... 数据分析师是青春饭吗 ... 数据分析的五个步骤 ... 十大常用数据分析软件 ... 数据分析师要学什么 ...

    本站交流只代表网友个人观点,与本站立场无关
    欢迎反馈与建议,请联系电邮
    2024© 车视网