ChatGPT数据分析实践_史浩然;赵辛;吴志成_AZW3_MOBI_EPUB_PDF_电子书(无页码)_史浩然;赵辛;吴志成
内容节选
6.3 ChatGPT探索性数据分析实战 在本节中,我们将使用B公司的线上经营数据进行探索性数据分析,将使用ChatGPT完成数据解读、描述性统计分析、相关性分析和可视化等一系列操作。在这个过程中,我们将会逐步加深对于B公司经营状况的理解,并得出探索分析的结论。 6.3.1 ChatGPT数据解读实战 在前文关于数据解读的讲解中,我们知道数据解读要分为两个部分,先进行数据集的整体解读,再进行对各个字段的解读。在使用ChatGPT进行数据解读前,我们需要厘清需求和标准。 (1)Cha tGPT是否依次输出了数据集解读和字段解读两部分。 (2)输出的数据集解读和字段解读是否完整(数据解读的完整内容可回顾6.2.2节)。 (3)针对字段的解读是否完整地涵盖了数据集中的所有字段。 基于这些考虑,我们的提示词应当包括以下内容。 (1)我们需要告知B公司的大致背景并简单介绍上传的数据集,以便进行数据集解读。 (2)赋予ChatGPT的角色应当为数据分析专家(本章其余部分若未做特别说明,则赋予的角色均为数据分析专家)。 (3)我们需要在提示词中直接具体说明数据解读的流程步骤,让ChatGPT按照我们指定的流程进行输出。 让我们先向ChatGPT提问。 User: B公司是一家母婴电商公司,该数据集为B公司经营相关数据。请你扮演B公司数据分析专家的角色,对该数据集进行数据解读。请注意,你进行数据解读的流程请遵循以下步骤: 1.数据集描述,包括数据来源、时间范围、目的、数据集大小; 2.字段描述,包括字段名称、数据类型、单位、缺失值。 ChatGPT给出的回答如下。 ChatGPT: 好的,首先我们将载入数据集并进行初步的观察。 步骤1:数据集描述 我们将首先查看数据集的基本信息,例如数据的来源、时间范围、目的和数据集的大小。 步骤2:字段描述 接着,我们将查看数据集的各个字段,包括字段名称、数据类型、单位、缺失值。 让我们开始第一步并加载数据。 1.数据集描述: (1)数据来源:这是一份包含B公司的经营相关数据的数据集。 (2)时间范围:数据集包含的日期从2019-04-01到2023-3-31。 (3)目的:该数据集可能用于分析B公司的销售、访客、购买用户数、GMV(总毛利润)、转化率和商品详情页跳失率的变化情况。 (4)数据集大小:该数据集包含1461行和13列。 2.字段描述: (1)字段名称和类型: 日期:这是数据集中的日期字段,数据类型为日期。 一级类目:这是商品的一级分类,数据类型为字符串。 二级类目:这是商品的二级分类,数据类型为字符串。 用户所在城市:这是用户所在的城市,数据类型为字符串。 用户职业:这是用户的职业,数据类型为字符串。 用户性别:这是用户的性别,数据类型为字符串。 商品名称:这是商品的名称,数据类型为字符串。 当日销量:这是当日的销量,数据类型为浮点数。 当日访客数:这是当日的访客数量,数据类型为浮点数。 当日购买用户数:这是当日的购买用户数量,数据类型为浮点数。 当日GMV:这是当日的总毛利润,数据类型为浮点数。 转化率:这是当日的转化率,数据类型为浮点数。 商品详情页跳失率:这是当日的跳失率,数据类型为浮点数。 (2)单位: 当日销量(当日销量):单位是件。 当日访客数(当日访客数):单位是人。 当日购买用户数(当日购买用户数):单位是人。 当日GMV(当日GMV):单位是元。 转化率(转化率):无单位,是一个比率。 商品详情页跳失率(跳失率):无单位,是一个比率。 其他字段,如日期、一级类目、二级类目、用户所在城市、用户职业、用户性别和商品名称,都是分类字段,没有单位。 (3)缺失值:数据集中的所有列都是非空的,也就是说,数据集中没有缺失值。 至此,我们已经完成了对数据集的初步解读。接下来我们可以进行更深入的数据分析,例如分析不同城市、职业、性别的用户的购买情况,或者分析不同商品的销售情况。请问您想进行哪方面的分析?或者有其他的问题或要求吗? 可以看到,ChatGPT按照我们要求的步骤和分析内容输出了针对数据集和各个字段的探索结果,并且输出的结果中涵盖了数据集描述(数据来源、时间范围、目的、数据集大小)和字段描述(字段名称、数据类型、单位、缺失值)的所有内容。可见ChatGPT输出的结果是符合预期和需求的。阅读该输出结果,我们将会对数据有一个基本了解。但是,长篇的文字叙述十分不便于我们的阅读,因此为了让结果更加适宜阅读,我们可以继续向ChatGPT提出要求。 User: 请将上述数据解读的结果输出为表格形式,表头为流程、探索内容、详细信息,数据集描述、字段描述、缺失值放在“流程”列中,并保持和探索内容、详细信息的对应关系。 ChatGPT将文本转变为表格,如表6.4所示。 表6.4 数据解读结果 可以看到......
- 信息
- 作者简介
- 内容简介
- 前言
- 第1章 ChatGPT简介与基本原理
- 1.1 ChatGPT简介
- 1.2 ChatGPT和数据分析
- 第2章 ChatGPT使用方法
- 2.1 基础用法:从注册账号到谈笑风生
- 2.2 ChatGPT提示工程:prompt的艺术
- 2.3 实用ChatGPT应用
- 第3章 ChatGPT插件应用
- 3.1 插件的基本使用
- 3.2 Code Interpreter功能用法详解
- 3.3 其他数据分析常用插件介绍
- 第4章 ChatGPT构建指标体系实战
- 4.1 案例背景和任务
- 4.2 指标体系知识提要
- 4.3 使用ChatGPT搭建指标体系
- 4.4 ChatGPT指标体系搭建实战总结
- 第5章 ChatGPT数据采集与清洗实战
- 5.1 案例背景和任务
- 5.2 数据采集和数据清洗知识提要
- 5.3 ChatGPT数据采集实战
- 5.4 ChatGPT数据清洗实战
- 5.5 ChatGPT数据采集和清洗实战总结
- 第6章 ChatGPT探索性数据分析和可视化实战
- 6.1 案例背景和任务
- 6.2 探索性数据分析和可视化知识提要
- 6.3 ChatGPT探索性数据分析实战
- 第7章 ChatGPT推断性统计分析实战
- 7.1 案例背景和任务
- 7.2 推断性统计分析知识回顾
- 7.3 ChatGPT参数估计实战
- 7.4 ChatGPT假设检验和方差分析实战
- 7.5 ChatGPT推断性统计分析实战总结
- 第8章 ChatGPT预测分析实战
- 8.1 案例背景和任务
- 8.2 预测模型知识提要
- 8.3 ChatGPT数据预测实战
- 8.4 ChatGPT预测分析实战总结
- 第9章 ChatGPT文本分析实战
- 9.1 案例背景和任务
- 9.2 文本分析知识提要
- 9.3 ChatGPT评论文本分析实战
- 9.4 ChatGPT文本分析实战总结
- 第10章 ChatGPT分类和聚类分析实战
- 10.1 案例背景和任务
- 10.2 分类和聚类知识提要
- 10.3 ChatGPT分类和聚类分析应用实战
- 10.4 ChatGPT分类和聚类分析实战总结
- 第11章 ChatGPT推荐算法实战
- 11.1 案例背景和任务
- 11.2 推荐算法知识提要
- 11.3 ChatGPT推荐算法应用实战
- 11.4 ChatGPT推荐算法实战总结
- 第12章 ChatGPT行业数据分析实战
- 12.1 电商行业分析实战
- 12.2 金融行业分析实战
- 12.3 ChatGPT行业数据分析实战总结