自动化测试

当前位置:首页 > 自动化测试

利用Python进行数据分析(二)第一章

第1章 准备工作

本书主要内容 

本书讲的是利用Python进行数据控制、处理、整理、分析等方面的具体细节和基本要点。同时,它也是利用Python进行科学计算的实用指南(专门针对数据密集型应用)。本书重点介绍了用于高效解决各种数据分析问题的Python语言和库。本书没有阐述如何 利用Python实现具体的分析方法。 


当书中出现“数据”时,究竟指的是什么呢?主要指的是结构化数据(str u c t u r e d data),这个故意含糊其辞的术语代指了所有通用格式的数据,例如: 

• 多维数组(矩阵)。 

• 表格型数据,其中各列可能是不同的类型(字符串、数值、日期等)。比如保存在关系型数据库中或以制表符/逗号为分隔符的文本文件中的那些数据。 

• 通过关键列(对于SQL用户而言,就是主键和外键)相互联系的多个表。 

• 间隔平均或不平均的时间序列。这绝不是一个完整的列表。大部分数据集都能被转化为更加适合分析和建模的结构化形式,虽然有时这并不是很明显。如果不行的话,也可以将数据集的特征提取为某种结构 化形式。例如,一组新闻文章可以被处理为一张词频表,而这张词频表就可以用于情感分析。 大部分电子表格软件(比如Microsoft Excel,它可能是世界上使用最广泛的数据分析工 具了)的用户不会对此类数据感到陌生。


文章评论

表情

共 0 条评论,查看全部
  • 这篇文章还没有收到评论,赶紧来抢沙发吧~