新闻资讯

新闻资讯 媒体报道

如何在业余时学数据分析?

编辑:011     时间:2021-09-06
专题收录
等 2 项收录

反对高票答案。


一上来便是各种教程,二话不说给出一批书单,各种数据处理的方式,讲怎么样用Python挖掘数据,怎么用R进行数据可视化,讲AB测试。

他们给的教程都很好,数据处理的方式也很有借鉴意义。

且不说,有多少人是光收藏,而不去认真学习的,就算是认真去学习的,他们也会遇到这样的问题

为什么这么用,为什么这么做。

比如,前两天在我的这个回答中,零基础如何学爬虫技术? - 知乎

有很多人都有这样的评论

一开始我是无语,后来想了想,这应该是一个普遍问题


这就是数据分析中最大问题,很多人学习数据分析,更多的是为了数据分析而数据分析,实际上根本不知道自己在做什么,为什么这么做。

或者仅仅是为了在简历上增加一行

鄙人精通数据分析。

估计HR看了是要微笑着,然后把简历放入不予录用的文件夹中。


数据分析,不论使用什么样的工具,使用什么样的方法,不论是Excel,还是Python,还是MySQL,都是工具,目的只有一个——

解决一个问题,或者给一个决策提供依据。

所以,学习数据分析的第一步,是要考虑,我要用数据,解决一个什么样的问题?

这点如果没有考虑清楚,只是跟着网上的教程学习爬虫,学习数据清洗,然后把那些公有的统计数据做成绚烂的图表,又有什么用呢?


这里我给大家推荐一个「腾讯教育」联合出品的免费的商业数据分析入门训练营。这里不仅仅只是学习数据分析,更是通过5天的学习,让你接触真正的数据分析思维与方法,体验用数据分析解决真实的商业问题。体验之后你就知道数据分析是怎么在商业中运用。
点击下面的链接就可以免费获得~
腾讯大数据专家,带您实战数据分析!

1.哪里开店

比如,有这样一个现实的例子,你表嫂跟你说,小明啊,你最喜欢吃我煮的麻辣烫了,我想开麻辣烫店,就在大学城附近,你说哪里好呢?

你是不是会想到以下几个问题呢?

表嫂的麻辣烫真好吃,想想就流下了口水

咳咳,正事要紧,到底应该在哪里开店呢?

所以,你有考虑到了这些可以量化的数据并且对应的你找到了这些数据的获取方式

问题来了,虽然写出来了大致的数据获取方式,但是具体怎么操作?

  • 招生计划怎么获得,学校官网还是相关报道?
  • 如何通过在线地图分析学校面积及相关建筑分布的合理性,最小路径还是顺路路径?
  • 如何获学校食堂评价,爬取微博数据,获得地理位置,并且对提及“食堂”的微博进行词义褒贬分析?或者直接拦路问询?
  • 人流量怎么获得,实地考察的时候,用本子画正字吗?


很好,这些问题你都想到了相应的解决方式,并且很顺利的获得这些数据,尽管有可能不太准确,但是你确确实实比以前更加了解了大学城附近大致的餐饮市场环境,不是么?

这也就是,

数据分析必须紧贴业务本身

获得数据之后,如何分析,人流量/商贩个数?但是每个商贩的服务能力又不一样,是不是得加权,如何加权?

于是你考虑了很多情况,写下来一个公式:

建议推荐开店系数=(人流量*XX/(YY*0.4)+租金*0.5)/ZZ

根据系数,你得出一个结论,建议开店的位置的前三家分别是

  • A大东门
  • A大小西门
  • B大女生宿舍小南门

你表嫂想了下,说,我知道你最喜欢B大的小姑娘们,胸大貌美腿子长。

于是麻辣烫店就开在了B大女生宿舍的小南门。


这个过程中,你有可能学会的或者仅仅了解(不一定掌握)数据分析的相关技能包括不限于以下:

  • Excel加减乘除,基础函数;
  • 爬虫的基本原理,及操作方式;
  • 正则表达式与数据清洗;
  • 语义分析的一般实现方式;
  • 在线地图API可以获取的数据有哪些;


2.优化数据的应用


一阵时间的忙碌,店终于开起来了,你表嫂的手艺真的很不错,每天都有很多小姑娘过来吃麻辣烫,中午晚上的时候,都忙不过来。

你表嫂感觉很可惜,很多客户就这样被浪费掉了:我多卖一份,少卖一份都无所谓,但是小姑娘本来想吃咱们家的麻辣烫,结果爬不上队饿着肚子走掉了,到别家说不定还要等,看见我都觉得挺过意不去的。

这时候聪明的你,有可能想到了通过获取以下数据,并且进行相关的分析来优化当前这个问题

你连续跟踪了三天这样的数据,运用了相关的统计学的相关知识

等待时间>=13分钟的时候,用户放弃继续等待的概率是78%!,然后你表嫂并不能理解,这78%到底是什么意思

所以你画了一张图,说山峰越高,走的人就越多。


问题找到了,只要将最长等待时间优化到13分钟之内,用户放弃等待的几率有可能下降。

这时候聪明的你,想到了如下的解决方式:

  • 用户抵店之后,才开始点餐,然后烹饪,是不是可以通过互联网的方式进行预点餐呢,所以你给表嫂申请了一个微信号,日经贴就是:“今天你想吃什么”,回复留言及预计到店时间,即可预订。
  • 你发现,用户选完菜之后总是喜欢把菜夹放到最远的地方,每次表嫂都需要把菜夹整理一次,拿到开始的地方。你考虑了一下,将菜筐的布局进行更改,刚好菜夹能够完成一次循环;或者你使用专菜专夹的方式。
  • 优化了店内桌椅布局,行走了最短的距离到达全店
  • ……

数据分析必须落地才是有效的,不是提交统计结果,而且获得统计结论


这个过程中,你有可能学会的或者仅仅了解(不一定掌握)数据分析的相关技能包括不限于以下:

  • 数据清洗的一般方式,时间函数计算
  • 统计学中分布的相关知识,这里应该是泊松分布
  • 数据可视化,包括不限于Excel 图表,js图表库,或者在线图表工具


3.大数据的处理

生意越做越大,扩充了店面之后,又开了分店,这时候你表嫂已经不亲自上一线熬煮麻辣烫了,但是又不放心那些雇来的人是否认真的在服务,于是制定了相应的店规,动不动还来一个突击检查。感觉比以前还要累了。

这时候,聪明的你,看在眼里,疼在心里,所以,你建议嫂嫂购买专业的餐饮管理软件,来获得相应的店铺运营数据。

在餐饮软件的后台,会有这么些个大致的运营数据,

当前订单量,成交量,客流量,客单价,等等等等,一切看起来那么完美。


等等,不对,为什么这个月以来,C分店的客单价总是这么低呢?事出有异,必定有妖!

还好,这个系统功能还算完善,能够导出一天所有的订单明细,包含以下字段,

下单时间,下单菜品,下单客户,联系电话,消费金额,配餐人,操作人,收银员,等等等


但是,你还是快掀桌子了,一个月,让我导出30次数据,然后在合并么?这个方法简直太土鳖了

你想着,要是能直接读取数据库不就好了么?一看产品介绍,数据库使用MySQL,于是你Google了一下,SQL入门,你发现,WHERE 和SELECT 基本上都满足你的需求了

很顺利的,你把这些数据导出了。

你把这个20W条记录的CSV用Excel打开,风扇疯狂的转了起来,不一会,你表嫂孱弱的笔记本就卡死了。

你感叹,Excel分析小一点的数据还行,数据量稍微大点,就显得力不从心。所以,你拿起了一本书,名字叫《21天学习Python,从入门到放弃》,这不坑爹呢吗?


你想着,反正我是为了处理这批很大的数据,没必要全部了解Python的功能,只需要找到相关的操作方法就好了。


你在Google上分别搜索了以下关键字

  • Python mysql
  • Python 数据分析库


你还找到了一本,用Python进行数据分析的pdf,感觉这本书写的通俗易懂,而且还有元数据示例。

在搜索的过程中,你发现了有好多数据分析是代码示例,有的甚至,只需要改一下文件路径,搬过来就能用。

你会感叹,原来,写程序也是Ctrl+C,Ctrl+V啊


这个过程中,你有可能学会的或者仅仅了解(不一定掌握)数据分析的相关技能包括不限于以下:

  • SQL基础语句
  • Python常见的数据分析库
  • Python数据可视化

聪明的你,捣鼓了三两天,就发现了问题的所在?


那么问题究竟在哪呢

我实在是写不动了,明天再更


相关Live

* 培养数据分析的思维方式


相关回答

* 怎么培养数据分析的能力? - 知乎

* 业余时间如何学数据分析? - 知乎

* 零基础如何学爬虫技术? - 知乎

* 如何用一个循环语句输出九九乘法表? - 知乎

* Excel 有什么神奇用途? - 知乎

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

回复列表

相关推荐