數據沒有用,我們需要的是數據所反映出來的東西。增長率,排名,占比等。而這些結果是通過分析數據得到的。
從網上搜集到數據后,導入到表格程序中便可以進行方便地分析處理了。下面介紹將網頁中的表格數據導入到 Google Sheet 中的操作。
當我嘗試去 Google 相關方法的時候,對于這個搜索結果相當的滿意。不僅給出了來自 Youtube 的視頻教程,還給出了建議觀看的位置。這樣的產品細節讓很多競品難以匹敵。
Import HTML in Google Docs,你可以自行觀看也可以繼續閱讀本文。
利用 importHTML
公式可以輕松實現將網頁中的數據導入到我們的工作表當中。
該公式需要三個入參,分別是:
url
導入數據的網頁地址query
指定數據的類型,是頁面中的列表(ul,ol)還是表格(table)index
指定需要導入的索引,如果頁面中不止一個數據源,則可以通過這個來指明導入第幾個
我們以 [List of countries by GDP](https://en.wikipedia.org/wiki/List_of_countries_by_population_(United_Nations)這個來自 Wikipedia 的國家 GDP 排名頁面為列,將其中的表格數據進行導入。
在需要導入的單元格里輸入以下公式:
=importHTML("https://en.wikipedia.org/wiki/List_of_countries_by_GDP_(nominal)","table",3)
然后執行。數據加載完成后,頁面中第三個 table 的數據就被導入了。
回顧上面的參數,第一個 url 沒問題,就是瀏覽器地址欄里的,直接復制粘貼。
第二個參數自不必多說,我們需要導入的不是列表,而是table
。
而最后個參數為什么是3?因為如果是1的話導入的數據并不正常,所以頁面的 HTML 代碼中有隱藏的用于布局的 table
,我們需要跳過,嘗試到3的時候有數據了。
對于沒有網頁編程相關經驗的人來說,總之可以從1開始試,通過導入的結果便可知道是否是想要的數據。
當數據在專業的表格程序中的時候,分析處理起來就很得心應手了。譬如我們覺得表格數據不夠直觀,可以快速簡單點兩下就能插入一個地區圖。
假設我們想要觀察 GDP 排名前20的國家在地圖上的分布。首先選中所需數據。
選擇Insert->Chart...
在彈出的圖表編輯框中,指定圖表類型為Geo chart
。
數據一下子就直觀起來了!
但通過圖片看出問題來了,也就是少了些很重要的經濟體,譬如兔子,戰斗民族。
回頭看表格中的數據,China 的名字似乎不對,將數據復制一分出來到 Sheet2
,將名字更正一下,再重復上面的步驟。
這是完工后的工作表,前往參觀。
文章列表