導讀:
本文作者為團支書、兔兔,由微信公眾號“城市數據團”(ID:metrodatateam)原創并首發,轉載請聯系首發公眾號授權,謝絕二次轉載。傳說中的春運搶票,是一
本文作者為 團支書、兔兔,由微信公眾號“城市數據團”(ID:metrodatateam)原創并首發,轉載請聯系首發公眾號授權,謝絕二次轉載。
傳說中的春運搶票,是一項對手眼協調速度、徒手計算機操作速度、奇特圖形辨識速度等個人身體能力,對計算機配置、網速、網絡穩定性等硬件基礎設施條件,對地區經濟發展、交通運輸水平等宏觀經濟背景,以及運氣等不確定因素的綜合比拼。
所以……
你搶到回家的票了嗎?
已搶到的,恭喜恭喜;沒搶到的,快點放棄。
最近,我們做了一個測試實驗,從12306網站上采集了春節期間從上海出發去往全國各個城市大約500班列車的實時余票數據(數據技術細節請看文末),希望能用這些數據幫我們搞清楚一個問題:
春運搶票到底有多難?
我們抽選了幾條線路的余票數量變化情況,一看便知:
上圖是G1359次列車的上海虹橋-長沙南站的余票情況。這個區段的特等座和一等座有部分余票,主要競爭在于二等座。二等座在放票后1分鐘有58張票剩余,之后經歷了數搶票-退票風潮(退票也可能是付款失敗造成的),在放票后1600秒左右(約27分鐘)售罄。
(注:類似58-20,20-58,58-20這樣整齊的票數波動情況在理論上不會存在,但在我們的樣本中很常見,可能是受到數據采集時網絡穩定程度的影響,對真實情況的表征有一定偏差。)
與長沙的票數階梯狀逐步減少相比,其他線路的競爭則要激烈得多:
上圖是K152的上海-商丘段的余票情況。開始放票后,硬座、硬臥、軟臥瞬間被搶空,而少量剩余的無座票則經歷了無數輪血腥激烈的拼搶,退票搶票的時間間隔往往只有幾秒。半小時后,戰斗才暫時告一段落。
相比商丘的血腥激烈,到重慶的余票數量變化則體現了搶票人的猶豫糾結:
上圖中是D636次列車的從上海虹橋-重慶北站區間的余票情況。絕大部分票瞬間被搶購一空。此后半小時內,陸續產生了3張無座票的余票,分別在2分鐘后、16分鐘后和半分鐘后才被搶走。是的,這班車歷時12小時51分鐘,要不要站回去,的確令人糾結。
在這些隨機抽取出的個案后面,其實都是無數不停刷新和點擊鼠標的搶票乘客。我們把所有班次的數據匯總,可以得到以下結論:
一、春運搶票,一分鐘定生死
按照目的地進行統計,可以看到,開始放票后1分鐘,有35座城鎮的全部列車、全部座位的火車票售罄;而我們把統計時間延長到放票30分鐘之后,城鎮數量也只是增加到了36座。搶票最難的35座城鎮列表見下圖:
很明顯,1分鐘內票被搶光的城市,30分鐘內也基本不可能搶到票了;而1分鐘內票沒有被搶光的城市,則可能根本不需要搶。
所以,假如你在1分鐘內沒有搶到票,那么恭喜你,你可以停止刷新并離開戰斗頁面了。
春運搶票就是這么殘酷:1分鐘定死生。
二、哪些地方還有余票?
現在,我們已經知道1分鐘生死線原理了,那接下來我們就計算一下放票1分鐘后各個城鎮的剩余票量,落在地圖上:
在上圖中,顏色越綠表示該城鎮的余票量越多,紅色的表示余票量在10張以下。可以看到:
全國大部分地區城市仍有余票;
余票量較低的城市集中在山西陜西、湖北湖南、以及西南云貴一帶;
有36座城鎮(包括哈爾濱、寶雞、唐山、昆明、咸陽、延安、荊州等)在放票后1分鐘各種票全部售罄,共占樣本城鎮總數的18%。
總體而言:82%的城鎮在1分鐘生死線后還仍有余票。
比如說鄭州。從上海前往鄭州的車票,經過1分鐘生死線后,余票總計仍有4600余張。
比如說成都。從上海前往成都的車票,經過1分鐘生死線后,余票仍有2000余張。
但是問題來了:
傳說中的全河南全四川都買不到火車票呢?這到底是怎么回事呢?
三、起訖時段和有無座位,才是隱藏在“仍有余票”信息下的關鍵因素
還是以鄭州為例吧,我們仔細查看一下余票信息便知,這些余票主要分布在K4046、K4168、G368、G1826等列車上。而列車時刻表顯示:
K4046和K4168的發車時間為凌晨:2:50和3:55;
G368和G1826的發車時間在晚飯時分,而到達時間則在深夜:23:02和23:28。
再來來看看成都的例子。一分鐘生死線后,上海往成都方向有余票2000余張,但值得注意的是,這些余票全部都顯示為:
無座。
上海前往成都的3256次列車,歷時47小時18分鐘;上海前往成都的K4138次列車,歷時40小時1分鐘。
很簡單:一些春運熱門目的地在1分鐘生死線后仍會有余票,因為這些班次立車要么時段很差,要么根本買不到座位。
四、1分鐘生死線后,60%的車次都買不到有座位的票
考慮到我們并不是每個人都愿意半夜摸黑出入火車站,或者有強大的體力和意志力一路站回家,假設我們希望出發到達時刻至少有一個在“朝六晚九”時段內(該標準的制定,參考了每半小時的出發達到列車數,和大部分乘客的主觀感受),且回家路上至少有一個座位/鋪位的話,搶票會變得多困難呢?
如果我們只搶符合上述要求的票,那么1分鐘生死線后車票售罄的城鎮數量將從36個劇增到122個,樣本數占比也從18%上升到60%,增長了3倍還要多。
這些新進入售罄名單的城鎮包括:成都、重慶、東莞、桂林、懷化、錦州、烏魯木齊等。
我們將新條件下的余票情況畫在地圖上:
由上圖可知:
從上海出發的時間適宜、有座位/鋪位的列車,僅在長三角地區、京滬線上以及福建等地區還有有少量余票;
全國大部分地區都已經全部呈現紅色。1分鐘生死線過后,一票難求。
現在我們明白了:
春運也許并非一票難求,真正難求的是那張能讓我們有尊嚴地坐著回家的票。
五、越是偏遠且經濟落后地區,越是一票難求
以上,我們分析了不同條件下的余票情景,但作為一個在魔都生活的外地人,還有一個問題沒有回答:
到底上海前往哪里的春運票更難搶呢?
我們仍然以搶到“可以有尊嚴地坐著回家的火車票”作為目標,按照與城鎮等級和與上海的距離對城鎮進行分類,比較各類城鎮在1分鐘生死線后的余票情況,統計結果如下圖所示:
從距離上看,目的地距離上海越遠,票越難搶;
從城市等級來看,目的地越是小城鎮,票越難搶。
從上海去到同為一線城市的北廣深,票不需要搶;
去往同處長三角的南京杭州,票不需要搶。
真正被瘋搶的車票,是那些遠離上海的小城鎮,比如湖北恩施、四川達州、遼寧鐵嶺以及河南駐馬店……
而真正搶不到那張車票的,也很可能正是最需要那張票的、想帶著尊嚴回家的人。
大概就是這樣。
以下是本次數據采集情況的說明
數據采集源
www.12306.cn
數據采集對象
出發站為“上海、上海南、上海西及上海虹橋”、到達站為“與上海聯系度最高的200個城鎮”的火車站(共計297個)的所有班次列車(共計478班)。
數據采集字段
478班列車的所有實時余票數量數據。
數據采集時間
2016年12月22日下午三個主要放票時間點開始后的1-30分鐘,分別為13:31-14:00、14:31-15:00、15:31-16:00。
之所以在放票1分鐘后才開始采集,是為了盡量不干擾售票系統的正常運行;據估算,我們當天對12306網站的訪問量約為40萬次,只占該網站的總訪問量(超過400億次)的十萬分之一,影響可以忽略不計。
數據采集精度
15秒。在采集時間內的三個時段內,我們每隔15秒刷新并采集一次新的余票數量數據。
之所以選擇15秒作為采集精度,是因為數據團的小伙伴人肉測試了一下搶票時間,從刷到票到輸完驗證碼確認訂票花費時間差不多是在15秒左右。如果你速度更快那么我只能表示欽佩。
城市數據團 (metrodatateam)
近期精彩活動(直接點擊查看):
福利 · 閱讀 | 免費申請讀大數據新書 第15期
END
投稿和反饋請發郵件至holly0801@163.com。轉載大數據公眾號文章,請向原文作者申請授權,否則產生的任何版權糾紛與大數據無關。
大數據
為大家提供與大數據相關的最新技術和資訊。
長按指紋 > 識別圖中二維碼 > 添加關注
近期精彩文章(直接點擊查看):
161224 2016年“大數據”產業的“真實面目”
161222 傅盛:深度學習是一種新的思維方式
161216 CCF:2017年大數據發展趨勢報告及解讀
161213 一文看懂人工智能:原理,技術和未來
161208 如何七周成為數據分析師
161206 一篇文看懂Hadoop:風雨十年,未來何去何從
161205 2017年大數據的十大發展趨勢
161129 大數據等最核心的關鍵技術:32個算法
161126 2016十大熱門大數據崗位,拿走不謝
161122 2017年關于數據科學六大預言
161119 漫畫:什么是機器學習?
161114 終年32歲的傳奇數學家,生前寂寂無聞,一個世紀后卻讓硅谷領袖們集體落淚致敬
161112 如何用大數據思維找女朋友?
161108 漫畫:什么是大數據
161107 數據可視化的七大秘密
161105 Gartner公布2017年十大戰略科技發展趨勢
161028 經驗貼│怎樣進行大數據入門級學習
161025 干貨:數據分析師的能力和工具體系
161023 不裝逼地說,在Google十年,到底學到啥?
161016 大數據投資人必讀:中國大數據發展與投資分析報告
161014 您的位置信息如何被利用?——基于位置信息的應用和地理信息匹配算法
161010 數據分析:微信紅包金額分配的秘密
161009 硅谷教父凱文·凱利最新預言:未來20年最重要的2個科技趨勢!
161005 1000位產品經理推薦的數據分析書
161001 十張圖看懂未來的大數據世界
更多精彩文章,請在公眾號后臺回復000查看,謝謝。
看文倉www.kanwencang.com網友整理上傳,為您提供最全的知識大全,期待您的分享,轉載請注明出處。
歡迎轉載:http://www.kanwencang.com/xinwen/20170106/82977.html
文章列表