shopify123.cn--一个shopify自学开店、赚美金的网站!
当前位置:shopify > shopify视频教程 > 正文

大数据分析Java条目采用教程

条目是大统算数据分析Python中最强大的统计正则表达式之一。在此大统算数据分析Python条目教程中,您将学习怎样在分析有关终端插件的统算数据时采用条目。

在大统算数据分析Python条目采用教程中,他们假定您了解大统算数据分析Python的基本技能,包括采用数组,有理数和浮点数。如果您不熟悉这些内容,则能试著完全免费的大统算数据分析Python基本知识专业课程。

他们将采用来自终端应用零售店统算数据集(Ramanathan Perumal)的下列统算状态参数:

附注的每一值都是两个统算数据点。比如,第二行(列副标题后)具备四个统算数据点:

1)Facebook

2)0.0

3)USD

4)

5)3.5

统算数据点的子集构成两个统算数据集。他们能将下面的整座表认知为统算数据点的子集,因而他们将整座表称作统算数据集。他们能看到他们的统算数据集是四象三列。

采用对大统算数据分析Python类型的认知,他们可能认为他们能将每一统算数据点储存在其自己的表达式中-比如,这就是他们能储存第二行的统算数据点的形式:

下面,他们储存了:

1)文字“ Facebook”做为数组

2)价格为0.0的自由浮动

3)文档“ USD”做为数组

4)打分算数2,974,676做为有理数

5)用户评级3.5为自由浮动

为统算数据分散的每一统算数据点建立表达式将是两个繁杂的过程。幸运地的是,他们能采用list更有效地储存统算数据。这是他们能为第二行建立统算数据点条目的形式:

要建立下面的条目,他们:

1)输出一系列统算数据点,他用双引号隔开每一统算数据点: Facebook, 0.0, USD, , 3.5

2)用括弧将字符串括出来: [Facebook, 0.0, USD, , 3.5]

建立条目后,透过将其分配给名叫的表达式,将其储存在计算机的缓存中row_1。

要建立统算数据点条目,他们只须要:

1)用双引号隔开统算数据点。

2)用括弧将统算数据点的字符串括出来。

现在,他们建立四个条目,统算数据分散的每一行两个:

索引大统算数据分析Python条目

条目能包涵各种统计正则表达式。类似的条目[4, 5, 6]具备相同的统计正则表达式(仅有理数),而条目[Facebook, 0.0, USD, , 3.5]具备混合的统计正则表达式:

1)左锥螺(Facebook, USD)

2)两个浮点数(0.0,3.5)

3)一有理数()

该[Facebook, 0.0, USD, , 3.5]条目有四个统算数据点。要搜寻条目的宽度,他们能采用下列len()指示:

对于小条目,他们只需在萤幕上算数统算数据点即可找出宽度,但是len()当您采用包涵许多原素的条目,或者须要为不知道宽度的统算数据撰写代码时,该指示将非常管用提前时间。

条目中的每一原素(统算数据点)都有两个与之关连的特定序号,称作索引序号。索引始终从0开始,因而第二个原素的索引号为0,第二个原素的索引号为1,以此类推。

若要快速找出条目原素的索引,请确定其在条目中的边线序号,然后乘以1。比如,数组USD是条目的第二个原素(边线序号3),因而其索引序号必须为2,因为3 – 1 = 2。

索引号帮助他们从条目中索引一般而言原素。简述row_1下面的代码实例中的条目,他们能Facebook透过运行代码来索引索引序号为0 的第二个原素(数组)row_1[0]。

索引一般而言条目原素的句法遵从该数学模型list_name[index_number]。比如,下面的条目的名称作row_1,第二个原素的索引号为0-在list_name[index_number]数学模型后,他们得到row_1[0],其中索引号0在表达式name后面的方括弧中row_1。

这是他们怎样索引中的每一原素row_1:

索引条目原素使执行操作更加容易。比如,他们能选择Facebook和Instagram的打分,并找出平均数或二者之间的差异:

让他们采用条目索引从前三行中提取打分数量,然后取平均数:

对条目采用负索引

在大统算数据分析Python中,他们有两个条目索引系统:

1)正索引:_first)原素的索引号为0,第二个原素的索引号为1,以此类推。

2)负索引:最后两个原素的索引号为-1,倒数第二个原素的索引号为-2,以此类推。

实际上,他们几乎总是采用正索引来索引条目原素。当他们要选择条目的最后两个原素时,负索引很管用-特别是如果条目很长,并且他们无法透过算数来判断宽度。

请注意,如果他们采用的索引号不在两个索引系统的范围内,则会得到两个IndexError。

让他们采用负索引从前三行中的每行中提取用户打分(最后两个值),然后取平均数。

切片大统算数据分析Python条目

代替单独选择条目原素,他们能采用句法快捷形式来选择两个或更多连续原素:

当他们从两个名叫list的条目中选择第二个n原素(n代表两个数字)时a_list,能采用句法快捷形式a_list[0:n]。在下面的实例中,他们须要从条目中选择前三个原素row_3,因而他们采用row_3[0:3]。

当选择前三个原素时,他们将条目的一部分切成薄片。因而,选择条目的一部分的过程称作条目切片。

他们可能想采用多种形式对条目进行切片:

要索引他们想要的任何条目切片:

a)他们首先须要确定切片的第二个和最后两个原素。

b)然后,他们须要确定切片的第二个和最后两个原素的索引号。

c)最后,他们能采用句法索引所需的条目切片a_list[m:n],其中:

1)m表示切片的第二个原素的索引号;和

2)n表示切片的最后两个原素的索引号加上两个(如果最后两个原素的索引号为2,则他们n将为3,如果最后两个原素的索引号为4,n则将为5,以此类推)。

当他们须要选择第二个或最后两个x原素(x代表两个数字)时,他们能采用更简单的句法快捷形式:

1)a_list[:x]当他们要选择第二个x原素时。

2)a_list[-x:]当他们要选择最后两个x原素时。

让他们看看怎样从第二行中提取前四个原素(以及有关Facebook的统算数据):

以及第四象中的原素3和4(以及有关Pandora的统算数据):

大统算数据分析Python条目条目

之前,他们介绍了条目,它是每一统算数据点采用两个表达式的更好选择。Facebook, 0.0, USD, , 3.5他们能将四个统算数据点捆绑在一起,而不是为四个统算数据点分别设置两个表达式,然后将条目储存在两个表达式中。

到目前为止,他们一直与具备四个行的统算数据集,他们已经储存在单独的表达式每行做为两个条目(表达式row_1,row_2,row_3,row_4,和row_5)。但是,如果他们的统算数据集包涵5,000行,那么最终将得到5,000个表达式,这将使他们的代码混乱,几乎无法采用。

为了解决这个问题,他们能将四个表达式储存在两个条目中:

正如他们所看到的,data_set是两个条目,记录了其它四个条目(row_1,row_2,row_3,row_4,和row_5)。包涵其他条目的条目称作条目条目。

该data_set表达式仍然是两个条目,这意味着他们能索引一般而言条目原素并采用他们学到的句法执行条目切片。在下面,他们:

a.采用索引第二个条目原素(row_1)data_set[0]。

b.采用索引最后两个条目原素(row_5)data_set[-1]。

c.透过采用进行条目切片, 索引前两个条目原素(row_1和row_2)data_set[:2]。

他们会经常须要索引这是两个条目的条目的一部分条目各个原素-比如,他们可能要索引的值3.5从[Facebook, 0.0, USD, , 3.5],这是一部分data_set名单条目。下面,他们3.5从data_set采用中学到的内容中进行摘录:

a.他们row_1采用进行索引data_set[0],并将结果分配给名叫的表达式fb_row。

b.他们打印fb_row,输出[Facebook, 0.0, USD, , 3.5]。

c.他们索引的最后两个原素fb_row采用fb_row[-1](因为fb_row是两个条目),并将结果分配给指定的表达式fb_rating。

d.打印fb_rating,输出3.5

下面,他们3.5分两步进行索引:首先索引data_set[0],然后索引fb_row[-1]。但是,3.5透过链接两个索引([0]和[-1]),有一种更简单的方法来索引相同的值-代码将data_set[0][-1]索引3.5:

下面,他们已经看到了两种获取值的方法3.5。两种方法都导致相同的输出(3.5),但是第二种方法涉及较少的键入操作,因为它很好地结合了他们在第一种情况下看到的步骤。虽然您能选择任一选项,但人们通常会选择第二个选项。

让他们将四个单独的条目转换为条目条目:

重复清单程序

在执行此任务之前,他们对计算插件的平均打分感兴趣。当他们只处理三行时,这是两个可行的任务,但是添加的行越多,它变得越难。采用之前的策略,他们将:

a.索引每一单独的打分。

b.总结一下打分。

c.除以打分数。

如您所见,四个等级会使情况变得复杂。如果他们正在处理包涵1,000行的统算数据,则将须要不切实际的代码量!他们须要找出一种简单的方法来索引许多评级。

查看下面的代码实例,他们看到两个过程不断重复:他们为中的每一条目选择了最后两个条目原素app_data_set。该app_data_set卖场五名名单,所以他们重复相同的过程五次。如果他们能直接告诉大统算数据分析Python他们要为其中的每一条目重复该过程app_data_set怎么办?

幸运地的是,他们能做到这一点-大统算数据分析Python为他们提供了一种简单的方法来重复两个过程,当他们须要重复数百,数千甚至数百万次过程时,这能极大地帮助他们。

比方说,他们有两个条目[3, 5, 1, 2]分配给两个表达式ratings,他们想重复下列过程:对每一原素在 ratings,打印原素。这就是他们能将其转换为大统算数据分析Python句法的形式:

在他们下面的第二个例子,他们想重复这个过程是_”提取的最后两个原素为每一条目中的 app_data_set “_。这是他们能将该过程转换为大统算数据分析Python句法的形式:

让他们试著更好地了解上述情况。大统算数据分析Python一次将两个条目原素从中分离出来app_data_set,然后将其分配给each_list(基本上成为两个储存条目的表达式-他们将在下两个萤幕上进一步讨论):

采用上述技术须要他们为统算数据分散的每一行撰写一行代码。但是采用该for each_list in app_data_set技术只须要他们写两行代码,而不管统算数据分散的行数是多少—统算数据集能有四象或一百万。

他们的中间目标是采用这项新技术来计算上述四象的平均打分,而最终目标是计算包涵7,197行的统算数据集的平均打分。他们将在此任务的接下来的几个萤幕中执行此操作,但现在,他们将分散精力练习此技术以更好地掌握它。

在撰写任何代码之前,他们须要缩进他们要在右边重复四个空格字符的代码:

从技术上讲,他们只须要在代码的右边至少缩进两个空格字符,但是大统算数据分析Python社区中的约定是采用四个空格字符。这有助于提高可读性-遵从此约定的其他人将更容易阅读您的代码,并且您将更容易阅读他们的代码。

让他们采用这种技术来打印每一插件的名称和等级:

大统算数据分析Python中的条目和For循环

他们刚刚学到的技术称作循环。循环是两个非常管用的工具,可用于采用大统算数据分析Python条目执行重复过程。大统算数据分析Python条目采用教程因为他们总是以for(像in for some_variable in some_list:)开始,所以这种技术被称作for循环。

这些是for循环的结构部分

主体中 的缩进代码

a.对于第一次迭代,该值是iterable的第二个原素(来自下面的实例1)。

b.对于第二次迭代,该值是iterable的第二个原素(来自下面的实例3)。

c.对于第三次迭代,该值是iterable的第二个原素(来自下面的实例5)。

插入表达式的名称能是您喜欢的任何名称–如果value在下面dog的代码中将替换为,则代码将以完全相同的形式工作。也就是说,习惯上采用有助于传达统算数据含义的东西。

循环主体之外的 代码能与代码交互

a.初始化表达式 a_sum

b.他们循环(或迭代a_list

1)在迭代表达式的当前值和储存在其中的当前值之间执行加法运算(在循环体内)valuea_suma_sum

2)将加法结果分配回 a_sum

3)打印a_sum表达式的值(在循环体内)。请注意,a_sum每次添加后更改的值。在循环结束时,a_sum具备值9,该值等于a_list(1 + 3 + 5)中数字的总和。

下面,他们建立了一种汇总条目中数字的方法。他们能采用这种技术总结统算数据分散的打分。一旦有了总和,他们只须要除以等级数即可得出平均数。

他们在这里介绍了for循环的基本知识,但是如果您想进行更多练习,他们还提供了有关for循环基本知识和高级for循环的教程,您能检阅。

计算条目平均数的另一种方法

现在,他们将学习计算平均评级值的另一种方法。建立条目后,能采用指示向其中添加(或追加)值append()。

与他们学过的其他指示不同,请注意 append()list_name.append()append()

现在他们知道怎样将值添加到条目中,他们能按照下列步骤计算平均应用打分:

a.他们初始化两个空条目。

b.他们开始遍历统算数据集并提取

c.他们追加

d.获得所有等级后,他们:

1)采用该sum()指示汇总所有打分(以便能够采用sum()

2)他们将总和除以打分数(能采用len()指示获得打分)。

在下面,他们能看到为四象统算数据集实施的上述步骤:

他们还能append()透过将统算数据追加为条目来将另一行添加到条目中。让他们看看它是怎样工作的:

现在,让他们采用下面学到的技术来计算所有六个插件的平均打分:

下一步

在大统算数据分析Python条目采用教程中,他们学习了怎样:

a.采用大统算数据分析Python条目储存和处理统算数据

b.采用正索引和负索引访问储存在条目中的值

c.采用条目条目来处理表格统算数据

d.用于循环自动执行重复性任务

e.将值附加到条目

如果您想练习采用大统算数据分析Python条目,那么大统算数据分析Python条目采用教程是基于他们的完全免费大统算数据分析Python基础专业课程的一部分。该专业课程能从您的Web浏览器上进行,您将撰写代码来分析7,000多个终端插件的完整统算数据集!

版权保护: 本文由 shopify 原创,转载请保留链接: http://www.shopify123.cn/shopify1/2938.html