描述
你将获得
- 了解Pandas的基本数据结构
- 掌握评估、分析、整理、重塑数据的方法
- 熟练用Matplotlib和Seaborn进行绘图
- 学会组合数据集并处理缺失的数据
讲师介绍
Daniel Y. Chen(丹尼尔·陈),畅销书《Python数据分析:活用Pandas库》作者。
Daniel是弗吉尼亚理工大学遗传学、生物信息学和计算生物学(GBCB)的跨学科博士研究生,也是软件工程方向的讲师及课程开发人员。目前他在弗吉尼亚理工大学生物复杂性研究所的社会和决策分析实验室工作,在那里他利用数据为政策的制定提供决策信息。
课程介绍
注:本课程出品方为机械工业出版社华章公司。课程基于Pandas0.19版本进行演示讲解。
Pandas是Python的核心数据分析支持库,它提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。它能够处理不同类型和大小的数据,使用起来非常容易,而且它有大量的函数,这使得之前很多繁琐的数据操作变得小菜一碟。
我们这个课程将为数据分析人员、数据科学家提供关于Python和Pandas的实用介绍,熟练掌握 Pandas之后,你就可以不再局限于使用电子表格程序(如 Excel 等)进行低效的数据分析工作,熟练运用Pandas将使你的数据分析工作流程更加自动化、更加高效,从而解放你的时间和精力。
在这个课程中,Daniel 会先从最基础的如何安装和启动Python开始,带你熟悉Python和 Pandas的基本使用环境。随后我们将介绍使用Python和Pandas处理数据集的基本知识,你将了解如何导入并执行第一个简单的分析集,并了解Pandas的基本数据结构及常用的操作。之后我们会进入图形可视化的部分,逐步带你了解如何在Matplotlib、Seaborn中创建一组基本的图形。最后,你会学习到如何进行数据的组装和操作,如何处理那些麻烦的缺失数据,以及通过数据整理使数据更清晰、更易操作,同时,这里我们也会介绍重塑数据的各种方法。
学完这门课程后,你将会真正理解为什么Python和Pandas在当今数据科学家中如此受欢迎,并能够熟练使用Pandas完成相应的数据分析工作以及创建自动化的数据工作流。
课程目录
适合人群
数据分析人员、数字架构师、数据科学家、市场营销和运营人员。
订阅须知
- 本课程出品方为机械工业出版社华章公司;
- 本课程为视频课程,共33讲,现已全部更新完毕.