本書主要介紹了Excel 2021與Python和Power Bi Desktop相結(jié)合進(jìn)行數(shù)據(jù)的采集、運(yùn)算、分析、大數(shù)據(jù)處理及可視化等方面的內(nèi)容,主要包括數(shù)據(jù)輸入、圖表設(shè)計(jì)、函數(shù)、名稱、數(shù)據(jù)表結(jié)構(gòu)變換、表格與結(jié)構(gòu)化引用、數(shù)據(jù)模型、Python編程基礎(chǔ)、爬蟲程序、數(shù)據(jù)倉(cāng)庫(kù)、M語(yǔ)言、DAX語(yǔ)言等基礎(chǔ)知識(shí);數(shù)據(jù)排序、查找、透視、篩選、迷你圖、切片器、分類匯總、數(shù)據(jù)建模等數(shù)據(jù)管理功能;采集文本數(shù)據(jù)、數(shù)據(jù)庫(kù)數(shù)據(jù)和網(wǎng)頁(yè)數(shù)據(jù)的方法;使用Python批量操作數(shù)據(jù)的方法,Power Query數(shù)據(jù)清洗與整合、Power Pivot數(shù)據(jù)建模與分析、Power View數(shù)據(jù)可視化等大數(shù)據(jù)處理方面的內(nèi)容。 本書通俗易懂,內(nèi)容翔實(shí),重視知識(shí)性和實(shí)用性的結(jié)合,每章配有相應(yīng)的習(xí)題,可作為高等學(xué)校數(shù)據(jù)科學(xué)(大數(shù)據(jù))、經(jīng)濟(jì)管理、財(cái)政金融、統(tǒng)計(jì)、文秘等專業(yè)數(shù)據(jù)分析課程的教材,也可作為計(jì)算機(jī)應(yīng)用和辦公自動(dòng)化方面的培訓(xùn)教材或參考用書。
李昌兵,工學(xué)博士,碩士生導(dǎo)師,教授。2007年12月畢業(yè)于重慶大學(xué)控制理論與控制工程專業(yè),并獲得工學(xué)博士學(xué)位;現(xiàn)任教于重慶郵電大學(xué)經(jīng)濟(jì)管理學(xué)院。中國(guó)系統(tǒng)工程學(xué)會(huì)會(huì)員。主要從事機(jī)器學(xué)習(xí)與自然語(yǔ)言處理、大數(shù)據(jù)分析及挖掘、復(fù)雜網(wǎng)絡(luò)分析及優(yōu)化等領(lǐng)域的研究。主持和參與了國(guó)家和省部級(jí)各類項(xiàng)目10余項(xiàng)。在《Intelligent Decision Technologies》、《系統(tǒng)工程理論與實(shí)踐》、《系統(tǒng)工程學(xué)報(bào)》、《系統(tǒng)仿真學(xué)報(bào)》、《計(jì)算機(jī)集成制造系統(tǒng)》等國(guó)內(nèi)外重要學(xué)術(shù)刊物上發(fā)表學(xué)術(shù)論文 40 余篇,其中SCI及EI檢索10篇,CSSCI期刊10余篇!犊刂婆c決策》、《通信學(xué)報(bào)》、《重慶郵電大學(xué)學(xué)報(bào)》審稿人。參編專著及教材5部,獲各級(jí)教學(xué)成果獎(jiǎng)3項(xiàng)。
第1章 Excel應(yīng)用基礎(chǔ) 1
1.1 工作表、單元格、公式和引用 1
1.1.1 Excel的數(shù)據(jù)組織和文件格式 1
1.1.2 模板、用戶界面和工作表結(jié)構(gòu) 2
1.1.3 工作表、單元格操作基礎(chǔ) 4
1.1.4 公式和運(yùn)算符 8
1.1.5 單元格引用 9
1.2 數(shù)據(jù)輸入和編輯基礎(chǔ) 12
1.2.1 Excel的數(shù)據(jù)類型 13
1.2.2 基本數(shù)據(jù)類型的輸入 13
1.2.3 使用Tab鍵和Enter鍵輸入選定區(qū)域的數(shù)據(jù) 16
1.2.4 輸入相同數(shù)據(jù) 16
1.3 編號(hào)的輸入 18
1.3.1 連續(xù)編號(hào)的輸入 18
1.3.2 使用自定義格式產(chǎn)生特殊編號(hào) 19
1.3.3 超長(zhǎng)數(shù)字編號(hào)的輸入 20
1.3.4 使用“&”組合多個(gè)單元格數(shù)據(jù) 21
1.4 使用下拉列表輸入數(shù)據(jù) 22
1.4.1 使用數(shù)據(jù)驗(yàn)證功能創(chuàng)建數(shù)據(jù)輸入下拉列表 22
1.4.2 使用快捷菜單從下拉列表中進(jìn)行數(shù)據(jù)輸入 23
1.4.3 使用組合框創(chuàng)建下拉列表 23
1.4.4 使用數(shù)據(jù)驗(yàn)證功能創(chuàng)建二級(jí)下拉列表 24
1.5 設(shè)置受限輸入數(shù)據(jù) 25
1.6 使用填充序列輸入數(shù)據(jù) 27
1.6.1 內(nèi)置序列的輸入 27
1.6.2 自定義序列 28
1.7 行列轉(zhuǎn)置輸入 29
1.8 使用隨機(jī)函數(shù)產(chǎn)生批量仿真數(shù)據(jù) 29
1.9 編輯工作表數(shù)據(jù) 30
1.10 數(shù)據(jù)格式化 33
1.10.1 格式化數(shù)字 33
1.10.2 文本格式化函數(shù)TEXT 37
1.10.3 格式化日期和時(shí)間 39
1.10.4 條件格式 40
小結(jié) 46
習(xí)題1 47
第2章 函數(shù) 51
2.1 名稱 51
2.1.1 名稱的定義 51
2.1.2 名稱應(yīng)用舉例 54
2.2 函數(shù)簡(jiǎn)介 55
2.3 邏輯函數(shù) 57
2.3.1 比較運(yùn)算和邏輯運(yùn)算 57
2.3.2 條件函數(shù)IF 58
2.4 常用的統(tǒng)計(jì)函數(shù) 61
2.4.1 匯總求和函數(shù) 61
2.4.2 平均值函數(shù) 62
2.4.3 統(tǒng)計(jì)個(gè)數(shù)的函數(shù) 64
2.4.4 計(jì)算最值、中值、眾數(shù)、百分比和排名的函數(shù) 65
2.5 數(shù)學(xué)和三角函數(shù) 68
2.6 日期及時(shí)間函數(shù) 70
2.6.1 Excel的日期系統(tǒng) 70
2.6.2 YEAR、MONTH、DAY、NOW和TODAY函數(shù) 70
2.6.3 WEEKDAY和NETWORKDAYS函數(shù) 71
2.6.4 EDATE、YEARFRAC和DATEDIF函數(shù) 71
2.6.5 日期函數(shù)舉例——計(jì)算工齡、小時(shí)加班工資 72
2.7 常用文本函數(shù) 74
2.7.1 文本轉(zhuǎn)換與合并函數(shù) 74
2.7.2 文本子串提取函數(shù) 76
2.7.3 文本重復(fù)、清理和替換
函數(shù) 77
2.8 錯(cuò)誤信息函數(shù) 79
2.8.1 Excel的常見(jiàn)錯(cuò)誤信息 79
2.8.2 錯(cuò)誤信息函數(shù) 80
小結(jié) 82
習(xí)題2 82
第3章 動(dòng)態(tài)報(bào)表與數(shù)據(jù)查找 85
3.1 表格與動(dòng)態(tài)報(bào)表 85
3.1.1 表格概述 86
3.1.2 結(jié)構(gòu)化引用和動(dòng)態(tài)報(bào)表 88
3.1.3 刪除重復(fù)數(shù)據(jù) 91
3.1.4 查詢不同工作表中的數(shù)據(jù) 91
3.2 D函數(shù)與動(dòng)態(tài)報(bào)表 92
3.2.1 D函數(shù)簡(jiǎn)介 92
3.2.2 D函數(shù)與表結(jié)合構(gòu)造動(dòng)態(tài)數(shù)據(jù)分析報(bào)表 93
3.2.3 使用D函數(shù)進(jìn)行查找統(tǒng)計(jì) 95
3.3 查找與引用函數(shù) 96
3.3.1 使用行、列計(jì)算函數(shù)定位與提取數(shù)據(jù) 96
3.3.2 使用INDIRECT函數(shù)和名稱查詢其他工作表中的數(shù)據(jù) 98
3.3.3 使用ADDRESS函數(shù)和OFFSET函數(shù)進(jìn)行定位查找與數(shù)據(jù)提取 99
3.3.4 使用CHOOSE函數(shù)進(jìn)行值查詢 102
3.3.5 使用MATCH函數(shù)和INDEX函數(shù)構(gòu)造靈活多樣的查詢 103
3.3.6 使用LOOKUP函數(shù)查找不同工作表中的數(shù)據(jù) 106
3.3.7 使用VLOOKUP函數(shù)進(jìn)行表查找 107
3.3.8 使用XLOOKUP函數(shù)查詢數(shù)據(jù)行 112
3.4 文本比對(duì)和查找 113
3.5 使用SQL查詢工作表數(shù)據(jù) 114
3.5.1 Excel SQL查詢基礎(chǔ) 115
3.5.2 SQL條件查詢和多表查詢 117
3.5.3 使用SQL進(jìn)行分組統(tǒng)計(jì)查詢 118
3.5.4 使用SQL從重復(fù)數(shù)據(jù)中提取不重復(fù)數(shù)據(jù) 120
3.6 數(shù)據(jù)提取與表格結(jié)構(gòu)轉(zhuǎn)換 121
3.6.1 隨機(jī)編排座次表問(wèn)題 121
3.6.2 提取間隔數(shù)據(jù)行問(wèn)題 123
3.6.3 數(shù)據(jù)表行列轉(zhuǎn)換問(wèn)題 125
小結(jié) 127
習(xí)題3 127
第4章 數(shù)據(jù)管理與數(shù)據(jù)透視表基礎(chǔ) 132
4.1 數(shù)據(jù)排序 132
4.1.1 排序規(guī)則 132
4.1.2 數(shù)字排序 133
4.1.3 漢字與字符排序 133
4.1.4 多關(guān)鍵字排序 134
4.2 數(shù)據(jù)篩選 135
4.2.1 自動(dòng)篩選 135
4.2.2 高級(jí)篩選 137
4.3 數(shù)據(jù)分類匯總 140
4.4 數(shù)據(jù)透視表 143
4.4.1 數(shù)據(jù)透視表概述 143
4.4.2 建立數(shù)據(jù)透視表 144
4.4.3 建立多字段數(shù)據(jù)透視表 147
4.4.4 修改匯總函數(shù)并多次透視同一字段 147
4.4.5 修改透視表數(shù)據(jù)的顯示方式 148
4.4.6 顯示數(shù)據(jù)項(xiàng)的明細(xì)數(shù)據(jù) 149
4.4.7 按年、季、月對(duì)時(shí)間進(jìn)行分組透視 149
4.4.8 篩選器在數(shù)據(jù)透視表和數(shù)據(jù)透視圖中的應(yīng)用 151
4.5 合并計(jì)算與多工作簿、工作表匯總 152
4.5.1 多工作簿中不同結(jié)構(gòu)數(shù)據(jù)表的合并計(jì)算 152
4.5.2 同一工作簿中結(jié)構(gòu)相同的多工作表匯總 154
4.5.3 數(shù)據(jù)鏈接與多工作簿匯總 155
小結(jié) 156
習(xí)題4 157
第5章 使用Python提高數(shù)據(jù)處理效率 159
5.1 Python編程基礎(chǔ) 159
5.1.1 Python概述 159
5.1.2 Python編程環(huán)境搭建 160
5.1.3 數(shù)據(jù)類型、變量、表達(dá)式、賦值語(yǔ)句和切片 164
5.1.4 Python語(yǔ)句 172
5.1.5 函數(shù) 177
5.2 使用Python批量操作工作簿 178
5.2.1 基礎(chǔ)知識(shí) 178
5.2.2 批量創(chuàng)建、更名和查找工作簿 180
5.3 使用Python批量操作工作表 182
5.3.1 基礎(chǔ)知識(shí) 182
5.3.2 批量創(chuàng)建、添加和更名工作表 183
5.3.3 批量復(fù)制工作表 185
5.3.4 批量拆分每個(gè)工作表 189
5.4 使用Python批量操作單元格、行、列、區(qū)域和表 190
5.4.1 基礎(chǔ)知識(shí) 190
5.4.2 批量讀取、插入、修改工作表的單元格、行和列數(shù)據(jù) 191
5.5 Python批量格式化工作表、單元格 193
5.5.1 基礎(chǔ)知識(shí) 193
5.5.2 批量添加網(wǎng)格線、合并單元格、設(shè)置行列字體和顏色 195
5.6 Python批量操作工作表數(shù)據(jù) 197
5.6.1 基礎(chǔ)知識(shí) 197
5.6.2 使用Pandas讀寫Excel文件 203
5.6.3 使用Python批量合并工作表 207
5.6.4 拆分工作表并批量創(chuàng)建工作簿和工作表 211
5.6.5 使用Python批量計(jì)算多工作簿多工作表的數(shù)據(jù) 212
5.7 Python批量操作圖表 217
5.7.1 基礎(chǔ)知識(shí) 217
5.7.2 使用Matplotlib批量繪制圖表 218
小結(jié) 220
習(xí)題5 220
第6章 數(shù)據(jù)采集與轉(zhuǎn)換 224
6.1 數(shù)據(jù)采集與轉(zhuǎn)換概述 224
6.2 文本數(shù)據(jù)采集 225
6.3 數(shù)據(jù)庫(kù)數(shù)據(jù)采集 229
6.3.1 數(shù)據(jù)庫(kù)采集的基本方法 230
6.3.2 Excel與Access的數(shù)據(jù)交互 230
6.3.3 使用Power Query采集數(shù)據(jù)庫(kù)中的表 233
6.3.4 使用Python采集數(shù)據(jù)庫(kù)中的表 238
6.4 網(wǎng)絡(luò)數(shù)據(jù)采集 239
6.4.1 網(wǎng)絡(luò)爬蟲基本知識(shí) 239
6.4.2 使用Excel爬取網(wǎng)頁(yè)表格數(shù)據(jù) 246
6.4.3 使用Python爬取網(wǎng)頁(yè)數(shù)據(jù) 252
小結(jié) 259
習(xí)題6 259
第7章 數(shù)據(jù)清洗、轉(zhuǎn)換與Power Query 263
7.1 商業(yè)智能數(shù)據(jù)分析 263
7.2 Power Query概述 264
7.3 Power Query應(yīng)用基礎(chǔ) 266
7.3.1 將查詢表返回到Excel工作表中的基本過(guò)程 266
7.3.2 Power Query功能界面簡(jiǎn)介 267
7.3.3 Power Query操作基礎(chǔ) 268
7.4 數(shù)據(jù)清洗的基本操作 271
7.5 數(shù)據(jù)合并 277
7.5.1 合并同一工作簿中結(jié)構(gòu)相同的工作表 278
7.5.2 合并同一文件夾中結(jié)構(gòu)相同的所有文件 280
7.5.3 使用追加查詢功能合并結(jié)構(gòu)相同的工作表 283
7.5.4 橫向合并具有共同字段不同結(jié)構(gòu)的數(shù)據(jù)表 285
7.6 數(shù)據(jù)表結(jié)構(gòu)變換 290
7.6.1 理解透視列和逆透視列 290
7.6.2 將二維表轉(zhuǎn)換為一維表 292
7.6.3 將一維表轉(zhuǎn)換為多類型報(bào)表 293
7.7 篩選、條件列和分組運(yùn)算 299
7.7.1 數(shù)據(jù)篩選 299
7.7.2 條件列 301
7.7.3 分組運(yùn)算 302
7.8 M語(yǔ)言簡(jiǎn)介 303
7.8.1 M語(yǔ)言入門基礎(chǔ) 303
7.8.2 表結(jié)構(gòu)在M函數(shù)中的引用 306
7.8.3 M函數(shù)對(duì)象與學(xué)習(xí)方法 309
7.8.4 M語(yǔ)言應(yīng)用案例 309
小結(jié) 314
習(xí)題7 315
第8章 數(shù)據(jù)建模與分析Power Pivot 317
8.1 Power Pivot基礎(chǔ) 317
8.1.1 Power Pivot與Pivot 317
8.1.2 操作Power Pivot的基本過(guò)程 318
8.1.3 Power Pivot的基本操作 322
8.2 Power Pivot數(shù)據(jù)建模 325
8.2.1 關(guān)系數(shù)據(jù)模型 325
8.2.2 數(shù)據(jù)倉(cāng)庫(kù)模型 329
8.2.3 人力資源建模示例 330
8.3 DAX語(yǔ)言 335
8.3.1 DAX公式初體驗(yàn) 336
8.3.2 上下文:度量公式的運(yùn)算基礎(chǔ) 337
8.3.3 DAX語(yǔ)言基礎(chǔ) 339
8.4 DAX函數(shù) 342
8.4.1 DAX函數(shù)與Excel函數(shù)的關(guān)系 342
8.4.2 日期和時(shí)間函數(shù) 344
8.4.3 數(shù)學(xué)和三角函數(shù) 346
8.4.4 文本函數(shù)和統(tǒng)計(jì)函數(shù) 348
8.4.5 邏輯函數(shù)和信息函數(shù) 348
8.5 篩選器函數(shù)和計(jì)算器函數(shù) 349
8.5.1 篩選器函數(shù)概述 350
8.5.2 Related和RelatedTable函數(shù) 351
8.5.3 Calculate函數(shù) 351
8.5.4 Calculate函數(shù)、度量值與上下文轉(zhuǎn)換 353
8.5.5 Filter篩選器 355
8.5.6 All、AllSelected和AllExcept函數(shù) 358
8.5.7 唯一值、X函數(shù)與數(shù)據(jù)透視表“總計(jì)”不等的處理 360
8.6 RankX、TopN函數(shù)和排名 363
8.7 時(shí)間智能函數(shù)和人力資源分析模型中的度量公式 365
8.7.1 常用的時(shí)間智能函數(shù) 365
8.7.2 人力資源分析模型中的度量公式 367
小結(jié) 369
習(xí)題8 370
第9章 圖表與數(shù)據(jù)可視化 371
9.1 Excel圖表基礎(chǔ) 371
9.1.1 認(rèn)識(shí)Excel圖表 371
9.1.2 圖表設(shè)計(jì)功能簡(jiǎn)介 372
9.1.3 圖表格式化 375
9.2 圖表建立的一般過(guò)程 377
9.2.1 插入初始圖表 378
9.2.2 圖表設(shè)計(jì) 378
9.3 圖表類型與基本用法 384
9.4 迷你圖 388
9.5 圖表設(shè)計(jì)技術(shù)基礎(chǔ) 389
9.5.1 圖表類型選擇 389
9.5.2 數(shù)據(jù)表設(shè)計(jì) 391
9.5.3 使用格式化添加漲/跌柱線、垂直線、系列線和高低點(diǎn)連線 396
9.6 圖表應(yīng)用基礎(chǔ) 397
9.6.1 使用樹狀圖和旭日?qǐng)D進(jìn)行經(jīng)營(yíng)分析 397
9.6.2 使用漏斗圖分析商業(yè)過(guò)程中的流失率 398
9.6.3 使用瀑布圖分析成本、工資結(jié)構(gòu) 398
9.6.4 使用分析工具庫(kù)中的直方圖進(jìn)行質(zhì)量分析 399
9.6.5 使用甘特圖進(jìn)行項(xiàng)目進(jìn)度管理 401
9.7 Power BI Desktop與數(shù)據(jù)可視化 403
9.7.1 數(shù)據(jù)可視化與Power View 403
9.7.2 Power View圖表 404
9.7.3 Power View儀表板 404
9.8 人力資源分析模型可視化案例 407
小結(jié) 411
習(xí)題9 412
參考文獻(xiàn)