文章出處

導讀:

本文作者為團支書、兔兔,由微信公眾號“城市數據團”(ID:metrodatateam)原創并首發,轉載請聯系首發公眾號授權,謝絕二次轉載。傳說中的春運搶票,是一

  本文作者為 團支書、兔兔,由微信公眾號“城市數據團”(ID:metrodatateam)原創并首發,轉載請聯系首發公眾號授權,謝絕二次轉載。

  傳說中的春運搶票,是一項對手眼協調速度、徒手計算機操作速度、奇特圖形辨識速度等個人身體能力,對計算機配置、網速、網絡穩定性等硬件基礎設施條件,對地區經濟發展、交通運輸水平等宏觀經濟背景,以及運氣等不確定因素的綜合比拼。

  所以……

  你搶到回家的票了嗎?

  已搶到的,恭喜恭喜;沒搶到的,快點放棄。

  最近,我們做了一個測試實驗,從12306網站上采集了春節期間從上海出發去往全國各個城市大約500班列車的實時余票數據(數據技術細節請看文末),希望能用這些數據幫我們搞清楚一個問題:

  春運搶票到底有多難?

  我們抽選了幾條線路的余票數量變化情況,一看便知:

  

  上圖是G1359次列車的上海虹橋-長沙南站的余票情況。這個區段的特等座和一等座有部分余票,主要競爭在于二等座。二等座在放票后1分鐘有58張票剩余,之后經歷了數搶票-退票風潮(退票也可能是付款失敗造成的),在放票后1600秒左右(約27分鐘)售罄。

  (注:類似58-20,20-58,58-20這樣整齊的票數波動情況在理論上不會存在,但在我們的樣本中很常見,可能是受到數據采集時網絡穩定程度的影響,對真實情況的表征有一定偏差。)

  與長沙的票數階梯狀逐步減少相比,其他線路的競爭則要激烈得多:

  

  上圖是K152的上海-商丘段的余票情況。開始放票后,硬座、硬臥、軟臥瞬間被搶空,而少量剩余的無座票則經歷了無數輪血腥激烈的拼搶,退票搶票的時間間隔往往只有幾秒。半小時后,戰斗才暫時告一段落。

  相比商丘的血腥激烈,到重慶的余票數量變化則體現了搶票人的猶豫糾結:

  

  上圖中是D636次列車的從上海虹橋-重慶北站區間的余票情況。絕大部分票瞬間被搶購一空。此后半小時內,陸續產生了3張無座票的余票,分別在2分鐘后、16分鐘后和半分鐘后才被搶走。是的,這班車歷時12小時51分鐘,要不要站回去,的確令人糾結。

  在這些隨機抽取出的個案后面,其實都是無數不停刷新和點擊鼠標的搶票乘客。我們把所有班次的數據匯總,可以得到以下結論:

  一、春運搶票,一分鐘定生死

  按照目的地進行統計,可以看到,開始放票后1分鐘,有35座城鎮的全部列車、全部座位的火車票售罄;而我們把統計時間延長到放票30分鐘之后,城鎮數量也只是增加到了36座。搶票最難的35座城鎮列表見下圖:

  

  很明顯,1分鐘內票被搶光的城市,30分鐘內也基本不可能搶到票了;而1分鐘內票沒有被搶光的城市,則可能根本不需要搶。

  所以,假如你在1分鐘內沒有搶到票,那么恭喜你,你可以停止刷新并離開戰斗頁面了。

  春運搶票就是這么殘酷:1分鐘定死生。

  二、哪些地方還有余票?

  現在,我們已經知道1分鐘生死線原理了,那接下來我們就計算一下放票1分鐘后各個城鎮的剩余票量,落在地圖上:

  

  在上圖中,顏色越綠表示該城鎮的余票量越多,紅色的表示余票量在10張以下。可以看到:

  1. 全國大部分地區城市仍有余票;

  2. 余票量較低的城市集中在山西陜西、湖北湖南、以及西南云貴一帶;

  3. 有36座城鎮(包括哈爾濱、寶雞、唐山、昆明、咸陽、延安、荊州等)在放票后1分鐘各種票全部售罄,共占樣本城鎮總數的18%。

  總體而言:82%的城鎮在1分鐘生死線后還仍有余票。

  比如說鄭州。從上海前往鄭州的車票,經過1分鐘生死線后,余票總計仍有4600余張。

  比如說成都。從上海前往成都的車票,經過1分鐘生死線后,余票仍有2000余張。

  但是問題來了:

  傳說中的全河南全四川都買不到火車票呢?這到底是怎么回事呢?

  三、起訖時段和有無座位,才是隱藏在“仍有余票”信息下的關鍵因素

  還是以鄭州為例吧,我們仔細查看一下余票信息便知,這些余票主要分布在K4046、K4168、G368、G1826等列車上。而列車時刻表顯示:

  K4046和K4168的發車時間為凌晨:2:50和3:55;

  G368和G1826的發車時間在晚飯時分,而到達時間則在深夜:23:02和23:28。

  再來來看看成都的例子。一分鐘生死線后,上海往成都方向有余票2000余張,但值得注意的是,這些余票全部都顯示為:

  無座。

  上海前往成都的3256次列車,歷時47小時18分鐘;上海前往成都的K4138次列車,歷時40小時1分鐘。

  很簡單:一些春運熱門目的地在1分鐘生死線后仍會有余票,因為這些班次立車要么時段很差,要么根本買不到座位。

  四、1分鐘生死線后,60%的車次都買不到有座位的票

  考慮到我們并不是每個人都愿意半夜摸黑出入火車站,或者有強大的體力和意志力一路站回家,假設我們希望出發到達時刻至少有一個在“朝六晚九”時段內(該標準的制定,參考了每半小時的出發達到列車數,和大部分乘客的主觀感受),且回家路上至少有一個座位/鋪位的話,搶票會變得多困難呢?

  如果我們只搶符合上述要求的票,那么1分鐘生死線后車票售罄的城鎮數量將從36個劇增到122個,樣本數占比也從18%上升到60%,增長了3倍還要多。

  這些新進入售罄名單的城鎮包括:成都、重慶、東莞、桂林、懷化、錦州、烏魯木齊等。

  我們將新條件下的余票情況畫在地圖上:

  

  由上圖可知:

  1. 從上海出發的時間適宜、有座位/鋪位的列車,僅在長三角地區、京滬線上以及福建等地區還有有少量余票;

  2. 全國大部分地區都已經全部呈現紅色。1分鐘生死線過后,一票難求。

  現在我們明白了:

  春運也許并非一票難求,真正難求的是那張能讓我們有尊嚴地坐著回家的票。

  五、越是偏遠且經濟落后地區,越是一票難求

  以上,我們分析了不同條件下的余票情景,但作為一個在魔都生活的外地人,還有一個問題沒有回答:

  到底上海前往哪里的春運票更難搶呢?

  我們仍然以搶到“可以有尊嚴地坐著回家的火車票”作為目標,按照與城鎮等級和與上海的距離對城鎮進行分類,比較各類城鎮在1分鐘生死線后的余票情況,統計結果如下圖所示:

  

  從距離上看,目的地距離上海越遠,票越難搶;

  從城市等級來看,目的地越是小城鎮,票越難搶。

  從上海去到同為一線城市的北廣深,票不需要搶;

  去往同處長三角的南京杭州,票不需要搶。

  真正被瘋搶的車票,是那些遠離上海的小城鎮,比如湖北恩施、四川達州、遼寧鐵嶺以及河南駐馬店……

  而真正搶不到那張車票的,也很可能正是最需要那張票的、想帶著尊嚴回家的人。

  大概就是這樣。

以下是本次數據采集情況的說明

數據采集源

www.12306.cn

數據采集對象

  出發站為“上海、上海南、上海西及上海虹橋”、到達站為“與上海聯系度最高的200個城鎮”的火車站(共計297個)的所有班次列車(共計478班)。

數據采集字段

478班列車的所有實時余票數量數據。

數據采集時間

  2016年12月22日下午三個主要放票時間點開始后的1-30分鐘,分別為13:31-14:00、14:31-15:00、15:31-16:00。

  之所以在放票1分鐘后才開始采集,是為了盡量不干擾售票系統的正常運行;據估算,我們當天對12306網站的訪問量約為40萬次,只占該網站的總訪問量(超過400億次)的十萬分之一,影響可以忽略不計。

數據采集精度

15秒。在采集時間內的三個時段內,我們每隔15秒刷新并采集一次新的余票數量數據。

之所以選擇15秒作為采集精度,是因為數據團的小伙伴人肉測試了一下搶票時間,從刷到票到輸完驗證碼確認訂票花費時間差不多是在15秒左右。如果你速度更快那么我只能表示欽佩。

城市數據團 (metrodatateam)

  近期精彩活動(直接點擊查看):

  福利 · 閱讀 | 免費申請讀大數據新書 第15期

  END

  投稿和反饋請發郵件至holly0801@163.com。轉載大數據公眾號文章,請向原文作者申請授權,否則產生的任何版權糾紛與大數據無關。

  大數據

  為大家提供與大數據相關的最新技術和資訊。

  長按指紋 > 識別圖中二維碼 > 添加關注

  近期精彩文章(直接點擊查看):

  161224 2016年“大數據”產業的“真實面目”

  161222 傅盛:深度學習是一種新的思維方式

  161216 CCF:2017年大數據發展趨勢報告及解讀

  161213 一文看懂人工智能:原理,技術和未來

  161208 如何七周成為數據分析師

  161206 一篇文看懂Hadoop:風雨十年,未來何去何從

  161205 2017年大數據的十大發展趨勢

  161129 大數據等最核心的關鍵技術:32個算法

  161126 2016十大熱門大數據崗位,拿走不謝

  161122 2017年關于數據科學六大預言

  161119 漫畫:什么是機器學習?

  161114 終年32歲的傳奇數學家,生前寂寂無聞,一個世紀后卻讓硅谷領袖們集體落淚致敬

  161112 如何用大數據思維找女朋友?

  161108 漫畫:什么是大數據

  161107 數據可視化的七大秘密

  161105 Gartner公布2017年十大戰略科技發展趨勢

  161028 經驗貼│怎樣進行大數據入門級學習

  161025 干貨:數據分析師的能力和工具體系

  161023 不裝逼地說,在Google十年,到底學到啥?

  161016 大數據投資人必讀:中國大數據發展與投資分析報告

  161014 您的位置信息如何被利用?——基于位置信息的應用和地理信息匹配算法

  161010 數據分析:微信紅包金額分配的秘密

  161009 硅谷教父凱文·凱利最新預言:未來20年最重要的2個科技趨勢!

  161005 1000位產品經理推薦的數據分析書

  161001 十張圖看懂未來的大數據世界

  更多精彩文章,請在公眾號后臺回復000查看,謝謝。

看文倉www.kanwencang.com網友整理上傳,為您提供最全的知識大全,期待您的分享,轉載請注明出處。
歡迎轉載:http://www.kanwencang.com/xinwen/20170106/82977.html

文章列表




Avast logo

Avast 防毒軟體已檢查此封電子郵件的病毒。
www.avast.com


arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()