Calc 中的数据统计

使用 Calc 中的数据统计功能执行复杂的数据分析

要进行复杂的统计或工程分析, 可以使用「Calc 数据统计」节省步骤和时间。您可以为每次分析提供数据和参数, 这组工具可使用适当的统计或工程函数来计算和并在输出表格中显示结果。

采样

使用从另一个表格中采样的数据创建一个表格。

要访问此命令...

选择「数据 - 统计 - 采样


通过采样, 您可以从「」表格中选取数据以填充「目标」表格。采样可以是随机的, 也可以是周期性的。

批注图标

采样按行进行。这意味着, 采样的数据将选取源表格的整行,并复制到目标表格的一整行中。


数据

输入范围」: 要分析的数据范围的引用。

结果输出到」: 显示结果的区域左上角的单元格的引用。

采样方法

随机」: 以随机方式选取源表格中恰好「样本大小」行。

样本大小」: 从源表格中采样的行数。

周期性」: 按「周期」定义的步伐选取行。

周期」: 采样时周期性跳过的行数。

示例

以下数据将用作采样的源数据表示例:

A

B

C

1

11

21

31

2

12

22

32

3

13

23

33

4

14

24

34

5

15

25

35

6

16

26

36

7

17

27

37

8

18

28

38

9

19

29

39


周期为 2 的采样将产生下表:

12

22

32

14

24

34

16

26

36

18

28

38


描述性统计

用数据集的主要统计属性填充电子表格中的表格。

要访问此命令...

选择「数据 - 统计 - 描述性统计


「描述性统计」分析工具为输入范围内的数据生成单变量统计报告, 提供有关数据的中心趋势和可变性的信息。

批注图标

关于「描述性统计」的更多信息,请参考阅读相应的维基百科文章


数据

输入范围」: 要分析的数据范围的引用。

结果输出到」: 显示结果的区域左上角的单元格的引用。

分组条件

选择输入数据是否具有「」或「」布局。

示例

以下面的数据为例

A

B

C

1

数学

物理

生物

2

47

67

33

3

36

68

42

4

40

65

44

5

39

64

60

6

38

43

7

47

84

62

8

29

80

51

9

27

49

40

10

57

49

12

11

56

33

60

12

57

13

26


下表显示了上述示例数据的描述性统计结果。

第 1 列

第 2 列

第 3 列

平均值

41.9090909091

59.7

44.7

标准误差

3.5610380138

5.3583786934

4.7680650629

模式

47

49

60

中位数

40

64.5

43.5

方差

139.4909090909

287.1222222222

227.3444444444

标准偏差

11.8106269559

16.944681237

15.0779456308

峰度

-1.4621677981

-0.9415988746

1.418052719

偏度

0.0152409533

-0.2226426904

-0.9766803373

区域

31

51

50

最小

26

33

12

最大

57

84

62

总和

461

597

447

计数

11

10

10


方差分析 (ANOVA)

生成给定数据集的方差分析 (ANOVA)

要访问此命令...

选择「数据 - 统计 - 方差分析 (ANOVA)


ANOVA 是「方差分析」 (ANalysis Of VAriance) 的缩写。该工具可对指定数据集进行方差分析

批注图标

关于「方差分析」的更多信息,请参考阅读相应的维基百科文章


数据

输入范围」: 要分析的数据范围的引用。

结果输出到」: 显示结果的区域左上角的单元格的引用。

分组条件

选择输入数据是否具有「」或「」布局。

类型

选择分析是针对「单因素」还是「双因素」方差分析。

参数

α」: 检测的重要性级别。

每个采样的行数」: 定义每个采样的行数。

示例

以下面的数据为例

A

B

C

1

数学

物理

生物

2

47

67

33

3

36

68

42

4

40

65

44

5

39

64

60

6

38

43

7

47

84

62

8

29

80

51

9

27

49

40

10

57

49

12

11

56

33

60

12

57

13

26


下表显示了上述示例数据的「方差分析 (ANOVA)」结果。

方差分析 - 单因素

α

0.05

分组

计数

求和

均值

方差

第 1 列

11

461

41.9090909091

139.4909090909

第 2 列

10

597

59.7

287.1222222222

第 3 列

10

447

44.7

227.3444444444

差异来源

SS

df

MS

F

P 值

F-临界值

组间

1876.5683284457

2

938.2841642229

4.3604117704

0.0224614952

3.340385558

组内

6025.1090909091

28

215.1824675325

总计

7901.6774193548

30


相关性

计算两组数字数据的相关性。

要访问此命令...

选择「数据 - 统计 - 相关性


相关系数 (介于 -1 和 + 1 之间的值) 表示两个变量之间的相关性有多大。您可以使用 CORREL 函数或「数据统计」来求两个变量之间的相关系数。

相关系数 +1 表示完全正相关。

相关系数 -1 表示完全负相关

批注图标

关于「统计相关」的更多信息,请参考阅读相应的维基百科文章


数据

输入范围」: 要分析的数据范围的引用。

结果输出到」: 显示结果的区域左上角的单元格的引用。

分组条件

选择输入数据是否具有「」或「」布局。

示例

以下面的数据为例

A

B

C

1

数学

物理

生物

2

47

67

33

3

36

68

42

4

40

65

44

5

39

64

60

6

38

43

7

47

84

62

8

29

80

51

9

27

49

40

10

57

49

12

11

56

33

60

12

57

13

26


下表显示了上述示例数据的相关性结果。

相关性

第 1 列

第 2 列

第 3 列

第 1 列

1

第 2 列

-0.4029254917

1

第 3 列

-0.2107642836

0.2309714048

1


协方差

计算两组数字数据的协方差。

要访问此命令...

选择「数据 - 统计 - 协方差


协方差是衡量两个随机变量一同变化的程度的指标。

批注图标

关于「统计协方差」的更多信息,请参考阅读相应的维基百科文章


数据

输入范围」: 要分析的数据范围的引用。

结果输出到」: 显示结果的区域左上角的单元格的引用。

分组条件

选择输入数据是否具有「」或「」布局。

示例

以下面的数据为例

A

B

C

1

数学

物理

生物

2

47

67

33

3

36

68

42

4

40

65

44

5

39

64

60

6

38

43

7

47

84

62

8

29

80

51

9

27

49

40

10

57

49

12

11

56

33

60

12

57

13

26


下表显示了上述示例数据的协方差结果。

协方差

第 1 列

第 2 列

第 3 列

第 1 列

126.8099173554

第 2 列

-61.4444444444

258.41

第 3 列

-32

53.11

204.61


指数平滑

生成平滑后的数据序列

要访问此命令...

选择「数据 - 统计 - 指数平滑


指数平滑是一种筛选技术, 当应用于数据集时, 会产生平滑化的结果。它被应用于许多领域, 如股票市场、经济学以及抽样测量。

批注图标

关于「指数平滑」的更多信息,请参考阅读相应的维基百科文章


数据

输入范围」: 要分析的数据范围的引用。

结果输出到」: 显示结果的区域左上角的单元格的引用。

分组条件

选择输入数据是否具有「」或「」布局。

参数

平滑系数」: 介于 0 和 1 之间的参数, 表示平滑方程中的阻尼因子 α。

示例

下表有两个时间序列, 一个表示时间 t=0 的脉冲函数, 另一个表示时间 t=2 的脉冲函数。

A

B

1

1

0

2

0

0

3

0

1

4

0

0

5

0

0

6

0

0

7

0

0

8

0

0

9

0

0

10

0

0

11

0

0

12

0

0

13

0

0


平滑系数为 0.5 时,产生的平滑结果如下:

α

0.5

第 1 列

第 2 列

1

0

1

0

0.5

0

0.25

0.5

0.125

0.25

0.0625

0.125

0.03125

0.0625

0.015625

0.03125

0.0078125

0.015625

0.00390625

0.0078125

0.001953125

0.00390625

0.0009765625

0.001953125

0.0004882813

0.0009765625

0.0002441406

0.0004882813


移动平均

计算时间序列的移动平均

要访问此命令...

选择「数据 - 统计 - 移动平均


批注图标

关于「移动平均」的更多信息,请参考阅读相应的维基百科文章


数据

输入范围」: 要分析的数据范围的引用。

结果输出到」: 显示结果的区域左上角的单元格的引用。

分组条件

选择输入数据是否具有「」或「」布局。

参数

间隔」: 移动平均计算中使用的样本数。

示例

下表有两个时间序列, 一个表示时间 t=0 的脉冲函数, 另一个表示时间 t=2 的脉冲函数。

A

B

1

1

0

2

0

0

3

0

1

4

0

0

5

0

0

6

0

0

7

0

0

8

0

0

9

0

0

10

0

0

11

0

0

12

0

0

13

0

0


加权平均的结果:

第 1 列

第 2 列

#N/A

#N/A

0.3333333333

0.3333333333

0

0.3333333333

0

0.3333333333

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

#N/A

#N/A


配对 t 检验

计算两个数据样本的配对 t 检验。

要访问此命令...

选择「数据 - 统计 - 配对 t 检验


配对 t 检验」是遵循学生 t 分布的任何统计假设检验。

批注图标

关于「配对 t 检验」的更多信息,请参考阅读相应的维基百科文章


数据

变量 1 范围」: 要分析的第一个数据序列的范围的引用。

变量 2 范围」: 要分析的第二个数据序列的范围的引用。

结果输出到」: 显示检验的区域左上角的单元格的引用。

分组条件

选择输入数据是否具有「」或「」布局。

示例

下表有两组数据集。

A

B

1

28

19

2

26

13

3

31

12

4

23

5

5

20

34

6

27

31

7

28

31

8

14

12

9

4

24

10

0

23

11

2

19

12

8

10

13

9

33


配对 t 检验的结果:

下表显示了上述数据序列的「配对 t 检验」:

配对 t 检验

α

0.05

假设的均差

0

变量 1

变量 2

平均值

16.9230769231

20.4615384615

方差

125.0769230769

94.4358974359

观测值

13

13

皮尔逊相关系数

-0.0617539772

观测的均差

-3.5384615385

差异的方差

232.9358974359

df

12

t 统计

-0.8359262137

P (T<=t) 单尾

0.2097651442

t 临界单尾

1.7822875556

P (T<=t) 双尾

0.4195302884

t 临界双尾

2.1788128297


F-检验

计算两个数据样本的 F 检验。

要访问此命令...

选择「数据 - 统计 - F 检验


F 检验」是基于零假设下 F 分布的任何统计检验。

批注图标

关于「F 检验」的更多信息,请参考阅读相应的维基百科文章


数据

变量 1 范围」: 要分析的第一个数据序列的范围的引用。

变量 2 范围」: 要分析的第二个数据序列的范围的引用。

结果输出到」: 显示检验的区域左上角的单元格的引用。

分组条件

选择输入数据是否具有「」或「」布局。

示例

下表有两组数据集。

A

B

1

28

19

2

26

13

3

31

12

4

23

5

5

20

34

6

27

31

7

28

31

8

14

12

9

4

24

10

0

23

11

2

19

12

8

10

13

9

33


F 检验的结果:

下表显示了上述数据序列的「F 检验」:

F 检验

α

0.05

变量 1

变量 2

平均值

16.9230769231

20.4615384615

方差

125.0769230769

94.4358974359

观测值

13

13

df

12

12

F

1.3244637524

P (F<=f) 右尾

0.3170614146

F 临界右尾

2.6866371125

P (F<=f) 左尾

0.6829385854

F 临界左尾

0.3722125312

P 双尾

0.6341228293

F 临界双尾

0.3051313549

3.277277094


Z 测试

计算两个数据样本的 z 检验。

要访问此命令...

选择「数据 - 统计 - Z 测试


批注图标

关于「Z 检验」的更多信息,请参考阅读相应的维基百科文章


数据

变量 1 范围」: 要分析的第一个数据序列的范围的引用。

变量 2 范围」: 要分析的第二个数据序列的范围的引用。

结果输出到」: 显示检验的区域左上角的单元格的引用。

分组条件

选择输入数据是否具有「」或「」布局。

示例

下表有两组数据集。

A

B

1

28

19

2

26

13

3

31

12

4

23

5

5

20

34

6

27

31

7

28

31

8

14

12

9

4

24

10

0

23

11

2

19

12

8

10

13

9

33


Z 测试的结果:

下表显示了上述数据序列的「z 检验」:

z 检验

α

0.05

假设的均差

0

变量 1

变量 2

已知方差

0

0

平均值

16.9230769231

20.4615384615

观测值

13

13

观测的均差

-3.5384615385

z

#DIV/0!

P (Z<=z) 单尾

#DIV/0!

z 临界单尾

1.644853627

P (Z<=z) 双尾

#DIV/0!

z 临界双尾

1.9599639845


卡方检验

计算数据样本的卡方测试。

要访问此命令...

选择「数据 - 统计 - 卡方检验


批注图标

关于「卡方检验」的更多信息,请参考阅读相应的维基百科文章


数据

输入范围」: 要分析的数据范围的引用。

结果输出到」: 显示结果的区域左上角的单元格的引用。

分组条件

选择输入数据是否具有「」或「」布局。

示例

下表有两组数据集。

A

B

1

28

19

2

26

13

3

31

12

4

23

5

5

20

34

6

27

31

7

28

31

8

14

12

9

4

24

10

0

23

11

2

19

12

8

10

13

9

33


卡方检验结果:

独立性检验 (卡方检验)

α

0.05

df

12

P 值

2.32567054678584E-014

检验统计

91.6870055842

临界值

21.0260698175