您所在的位置:首页 图书资源 高等教材

高等教材

海量数据采集与处理

本书以Python作为主要工具,着重讲解海量数据采集与处理相关内容。力求通过由浅入深、先理论基础后实践应用的思路,培养学生应用Python解决实际问题的能力。全书内容分为上、下篇共9章。上篇主要介绍数据采集的基本概念、Python开发环境、数据采集常用的两种框架Numpy和Pandas的使用;下篇对数据采集原理、爬虫基础库的使用、页面采集框架的使用、数据的存储与使用、数据的清洗与预处理,以及综合实例的应用进行介绍。本书在内容编写与安排上尽量做到结构合理、逻辑严谨,可供信息管理与信息系统、大数据、计算机、人工智能等相关专业的学生使用;亦可供经济管理类其他专业学生入门参考,用于交叉方向的科学研究。

江成,计算机应用技术专业博士,教授,博导。北京市属高校教师队伍建设支持计划优秀青年人才,北京市优秀青年骨干教师,首都经济贸易大学后备学科带头人。兼任中国计算机学会计算经济学专委会执行委员、中国优选法统筹法与经济数学研究会应急管理专委会理事、京津冀协同发展促进30人专家委员、《安全与环境学报》编委等职务。研究领域为经济社会复杂系统,主持国家社会科学基金项目、国家自然科学基金项目、北京市社会科学基金重点项目及企事业委托课题等10余项。在Applied Soft Computing和Knowledge-Based Systems以及《管理评论》《计算机科学与探索》等国内外期刊发表论文30余篇,出版专著和教材6部。主笔的近20项资政报告获省部级及以上领导肯定性批示或部门采纳,多篇成果被中央“三报一刊”报道。

海量数据采集与处理-封面.jpg