bob投注

Python数据集探索与可视化实例指南

by wtfmetro.com -

字幕组双语原文:Python 数据集探索与可视化实例指南

翻译:AI研习社(Suen)

仍然有一些订单已分配多餐。 当同时有两个订单和两餐时,可能会发生这种情况。 然后,两餐将分配给两个订单线索。 要删除这些重复项,我们仅使餐点最接近该订单。

“订购前用餐天数”为负数表示用餐是在订单线索输入之后进行的。我们可以看到,如果膳食在订单线索进入之前发生,则对转化率似乎有积极影响。 订单的先验知识似乎在这里给我们的销售代表带来了优势。 

如果我们回顾sales_team数据,我们会记住并非所有的销售代表都拥有相同数量的客户,这肯定会产生影响! 让我们检查。

现在,我们合并数据。 为此,我们首先将公司ID上的所有发票左连接到order_leads。 但是,合并数据会导致所有餐点都加入所有订单。 也有古老的饭菜,以最近的订单。 为了缓解这种情况,我们计算了进餐和点餐之间的时间差,并且仅考虑订单周围五天的进餐。

热图可在一幅图中可视化四个维度

用餐时间:订购后,订购前后,订购前(外排) 用餐类型:早餐,晚餐,午餐(外栏) 餐单价格:最低价格,最低价格,比例价格,最高价格,最高价格(内排) 参加人数:1,2,3,4,5(内栏)

就所使用的功能而言,这里没有太多新内容。 但是请注意我们如何使用sns.distplot将数据绘制到轴上。

当然,图表底部的颜色似乎更深/更高,这表明:

然后,我们使用一些最终数据进行争辩,以额外考虑餐食价格与订单价值的关系,并将交货时间分配到“订购前”,“订购前后”,“订购后”,而不是从负4到正4的天数,因为这在解释方面有些繁琐。

各销售代表的转化率:

明朗少女嘟仔则是被下一个是我 星主播OFFER赛的名字吸引,称来参加比赛是为了拿到一份OFFER。继前段时间主播练习生与偶像贾乃亮同屏直播后,嘟仔是否能在成团之际合作爱豆彭昱畅值得期待。

各个销售代表之间似乎存在很大的差异。 让我们对此进行更多调查。

要解决可能出现的格式错误,可以先卸载(然后在终端中必须这样做),然后运行以下命令,将matplotlib降级到3.1.0版:

我们可以看到,转换率数字似乎与分配给销售代表的帐户数量成反比。 那些降低的转化率是有道理的。 毕竟,代表拥有的帐户越多,他可以花在每个人身上的时间就越少。

经常处理数据的人 对Python和Pandas有基本了解的人

提到来参加比赛的初心,30强选手交友、追爱豆、拿OFFER理由各有不同。主播练习生陈剑鑫本身是从事主持方面的工作,此次参与比赛是为了再提升自身技能的基础上,结交更多志同道合的朋友。

我们使用下划线_作为临时变量。对于以后不再使用的一次性变量,我通常会这样做。   我们在order_leads.Date上使用了pd.DateTimeIndex并将结果设置为索引,这使我们能够 使用pd.Grouped(freq =’D’)按天对数据进行分组。 或者,您可以将频率更改为W,M,Q或Y(每周,每月,每季度或每年)  我们计算每天“转换”的平均值,这将给出当天订单的换算率。  我们使用.roll(60)和.mean()来获得60天的滚动平均值。  然后我们格式化yticklables,使它们显示一个百分号。

 对于分析,您可以访问以下三个数据源: 

你的任务是提高销售团队的绩效。在我们假设的情况下,潜在客户有相当自发的需求。当这种情况发生时,您的销售团队会在系统中放置一个订单线索。然后,您的销售代表会设法安排一次会议,会议将在订单线索被注意到的时候举行。有时在前,有时在后。你的销售代表有一个把会议和餐费结合起来的开支预算。销售代表花费他们的成本,并将发票交给会计团队处理。在潜在客户决定是否接受您的报价后,销售代表会跟踪订单线索是否转化为销售。 

需要安装标准库,此外,通过使用以下命令,在你的Notebook上安装seaborn.

如何合并和整理数据, 如何探索和分析数据, 如何创建漂亮的图形以可视化您的发现

时间的影响(即进餐之前或之后进餐):

南京赛区的选手们在首日直播后率先回应导师贾乃亮:“成团见!”10月31日,最终成团的九强选手们将与众星共同登上苏宁易购超级秀舞台,与苏宁易购代言人共同隔空带货,后期更将有深度联合的带货直播。

在这里,我们首先创建一个辅助函数,该函数将垂直线映射到每个子图中,并用数据的均值和标准差注释该线。然后我们设置一些seaborn绘图默认值,例如较大的font_scale和whitegrid设置为样式。

从初赛到决赛,此次比赛发挥了苏宁易购的全场景优势,全程线上与线下联动。在第三赛段,主播练习生们来到南京、上海、北京、成都、深圳五个城市的苏宁易购门店每日进行直播带货PK。门店的金牌销售则作为“金牌导师”现场指导星主播练习生销售技巧。而在总决赛阶段,30强选手将来到苏宁易购南京易逛城进行巅峰PK。

所谓细节决定成败,成功不是偶然的。金牌主播李佳琦在屡创销售新高的同时,也在广受观众的赞誉。无论是直播的节奏、产品的摆放李佳琦直播间都能做到最有效率、最直接的将产品、价格展现在观众面前。

 订单线索(包含所有订单线索和转换信息)   销售团队(包括公司和负责的销售代表)   发票(提供发票和参与者的信息)

比赛目前正处于总决赛阶段,比赛将采用双人搭档带货的形式,30名晋级选手,被随机指派2人结成联盟,进行总决赛PK。比赛评分将结合带货订单量、直播间人气、评委打分、粉丝投票四项指标,最终决出9强选手。

 事情似乎在2017年初走下坡路。经过与首席销售官核实,发现大约在那个时候有一个竞争对手进入了这个市场。很高兴知道,但我们现在无能为力。

另外,请注意我们如何使用.dt.hour,我们只能这样做,因为我们将

运行以下代码片段将产生多维热图。

哇! 用餐相关的订单与不用餐相关的订单之间的转换率差异非常大。 不过,看起来午餐的转化率略低于晚餐或早餐。 

我创建了一个绘图栏功能,其中已经包含一些样式。 通过该功能进行绘图可以使目视检查更快。 我们将在一秒钟内使用它。

注意,这里我们是如何使用pd.cut为数字数据分配类别的,这很有意义,因为毕竟,早餐是在8点还是9点开始,都没有关系。

现在,我们将使用热图同时可视化数据的多个维度。 为此,首先创建一个辅助函数。

该热图当然很漂亮,尽管起初有点难读。 因此,让我们来看一下。 图表总结了4个不同维度的影响:

主播练习生陈剑鑫在100进30的赛场上也是表现得可圈可点。在遇到选品售空等情况,陈剑鑫提前做好风险预案,在开播之前反复与主办方核对商品与价格,并自己提前准备好了商品清单与图片以备不时之需。

看来我们已经确定了用餐的日期和时间,让我们快速了解一下时间分布:

在今天的文章中,您将学习:

  转化率随时间的变化 

您可以按照上周的说明下载并合并数据,也可以从此处下载文件并将其加载到 Notebook中。

invoices[‘Date of Meal’]转换为之前的日期时间。 .dt是所谓的访问器,其中有三个cat,str和dt。 如果您的数据类型正确,则可以使用这些访问器及其方法进行直接操作(计算有效且简洁)。不幸的是,invoices [‘Participants’]是一个字符串,我们必须首先将其转换为合法的JSON,以便我们 可以提取参与者的数量。

在点餐之前用餐时,转化率会更高 当只有一名参与者时,晚餐转化率似乎更高 与订单价值相比,看起来更昂贵的餐食对转化率有积极影响 

按分配的帐户数分配的转换率

销售代表的帐户不要超过9个(转化率会迅速下降) 确保每个订单线索都伴随有会议/进餐(因为这会使转换率翻倍当只有一位员工来访时,晚餐最有效 您的销售代表应支付的餐费约为订单金额的8%至10% 时间是关键,理想情况下,您的销售代表应尽早知道即将达成交易。

Previous Article

Next Article

About The Author

wtfmetro.com

Related Posts

No image

拉美新冠确诊病例超83万巴西卫生部长被解职

No image

厦门启动体育消费节拉动线上线下消费需求

No image

中方谈中德欧领导人视频会晤期待进一步发出共同捍卫多边主义和自由贸易的信号