有時我們需要從網(wǎng)站獲取一些數(shù)據(jù),傳統(tǒng)方法是通過復制粘貼,直接粘到 Excel 里。不過由于網(wǎng)頁結構不同,并非所有的復制都能有效。有時即便成功了,得到的也是“死數(shù)據(jù)”,一旦后期有更新,就要不斷重復上述操作。能否制作一個隨網(wǎng)站自動同步的 Excel 表呢?答案是肯定的,這就是 Excel 里的 Power Query 功能。
1. 打開網(wǎng)頁
下圖這個網(wǎng)頁,是中國地震臺網(wǎng)的官方頁面(http://news.ceic.ac.cn/)。每當有地震發(fā)生時,就會自動更新到這里。既然我們要抓取它,就要首先打開這個網(wǎng)頁。
2. 確定抓取范圍
打開 Excel,點擊“數(shù)據(jù)”→“獲取數(shù)據(jù)”→“自其他源”,將要抓取的網(wǎng)址粘貼進來。此時 Power Query 會自動對網(wǎng)頁進行分析,然后將分析結果顯示在選框內(nèi)。以本文為例,Power Query 共分析出兩組表格,點擊找到我們所需的那個,然后再點擊“轉換數(shù)據(jù)”。片刻后,Power Query 就會自動完成導入。
3. 數(shù)據(jù)清洗
導入完成后,就可以通過 Power Query 進行數(shù)據(jù)清洗了。所謂“清洗”說白了就是一個預篩選過程,我們可以在這里挑選自己所需的記錄,或者對不需要的列進行刪除與排序操作。其中右鍵負責刪除數(shù)據(jù)列,面板中的“保留行”用來篩選自己所需的記錄。清洗完成后,點擊左上角的“關閉并上載”即可上傳 Excel。
4. 格式調(diào)整
數(shù)據(jù)上傳 Excel 后,可以繼續(xù)進行格式化處理。這里的處理主要包括修改表樣式、文字大小、背景色、對齊、行高列寬,添加標題等等,通俗點說就是一些美化操作,最終我們便得到了下圖這個表。
5. 設置自動同步間隔
目前表格基礎已經(jīng)完成,但和復制粘貼一樣,此時得到的仍然只是一堆“死數(shù)據(jù)”。想讓表格自動更新,需要點擊“查詢工具”→“編輯”→“屬性”,并勾選其中的“刷新頻率”和“打開文件時刷新數(shù)據(jù)”。處理完成后,表格就可以自動同步了。
注:默認情況下數(shù)據(jù)刷新會導致列寬變化,此時可以點擊”表格工具“→“外部表數(shù)據(jù)”→“屬性”,取消“調(diào)整列寬”前面的復選框解決這個問題。
寫在最后
這個技巧很實用,特別是在制作一些動態(tài)報表時,能夠大大減輕人工提取所產(chǎn)生的麻煩。好了,這就是本期要和大家分享的一個小技巧,是不是很有用呢!