跳到主要內容

桃園大眾捷運之市民卡乘車紀錄

資料集評分: 
平均 5 (1 vote)
資料集描述: 
本資料集為民眾持市民卡搭乘桃園大眾捷運系統時之乘車紀錄,原始資料由桃園大眾捷運股份有限公司提供,經由桃園市政府資訊科技局進行資料清洗轉化與整併,並且針對資料內容進行去識別化後發佈。本資料資源內各欄位之說明如下: ▲IdCode:電子票證之識別代碼,每張電子票證之識別代碼皆不同。 ▲Gender:乘客之性別。M:男性。F:女性。O:其他。X:未知(註1)。 ▲AgeRange:乘客之年齡。E:資料錯誤(註2)。X:未知(註1)。 ▲Issue:發卡公司代碼。EZ:悠遊卡。IP:一卡通。 ▲CardType:卡片種類代碼。REG:一般卡。ELD:敬老卡。COM:愛心卡。ACO:愛心陪伴卡。STD:學生卡。EMP:員工卡。 ▲ETime:上車之日期時間。 ▲ES:上車之站名。 ▲DTime:下車之日期時間。 ▲DS:下車之站名。 ▲Price:此次消費應付金額。 ▲Cost:此次消費實際金額(應付金額減去折扣優惠)。 【註1】:由於本欄位資料係來自桃園市民卡之卡務系統,若該電子票證非桃園市民卡,則系統中並無該持卡人之個人資料,故該欄位以X(未知)表示。 【註2】:該電子票證之持卡人個人資料在桃園市民卡之卡務系統中有誤,無法計算其年齡。 有關桃園市民卡之卡片種類等相關介紹,請參閱桃園市民卡官方網站: https://card.tycg.gov.tw/
主要欄位說明: 
IdCode(電子票證之識別代碼)、Gender(乘客之性別)、AgeRange(乘客之年齡)、Issue(發卡公司代碼)、CardType(卡片種類代碼)、ETime(上車之日期時間)、ES(上車之站名)、DTime(下車之日期時間)、DS(下車之站名)、Price(此次消費應付金額)、Cost(此次消費實際金額)
資料下載網址: 
CSV 檢視資料108年第一季
資料資源欄位: 
IdCode(電子票證之識別代碼)、Gender(乘客之性別)、AgeRange(乘客之年齡)、Issue(發卡公司代碼)、CardType(卡片種類代碼)、ETime(上車之日期時間)、ES(上車之站名)、DTime(下車之日期時間)、DS(下車之站名)、Price(此次消費應付金額)、Cost(此次消費實際金額)
檔案格式: 
CSV
編碼格式: 
UTF-8
資料量: 
0
資料資源描述: 
108年第一季
資料資源更新時間: 
2020/06/16 18:25

經本平臺品質檢測後符合表格化資料之資料資源將會轉為CSV、XLSX、ODS、XML、JSON檔案格式,若所轉出之資料內容與機關所提供之原始資料有所出入,請以機關所提供之原始資料為主。

CSV 檢視資料108年第二季
資料資源欄位: 
IdCode(電子票證之識別代碼)、Gender(乘客之性別)、AgeRange(乘客之年齡)、Issue(發卡公司代碼)、CardType(卡片種類代碼)、ETime(上車之日期時間)、ES(上車之站名)、DTime(下車之日期時間)、DS(下車之站名)、Price(此次消費應付金額)、Cost(此次消費實際金額)
檔案格式: 
CSV
編碼格式: 
UTF-8
資料量: 
0
資料資源描述: 
108年第二季
資料資源更新時間: 
2020/06/16 18:25

經本平臺品質檢測後符合表格化資料之資料資源將會轉為CSV、XLSX、ODS、XML、JSON檔案格式,若所轉出之資料內容與機關所提供之原始資料有所出入,請以機關所提供之原始資料為主。

提供機關聯絡人姓名: 
吳義聖 ((03)3322101 ext.6964)
更新頻率: 
每半年
授權方式: 
政府資料開放授權條款-第1版
計費方式: 
免費
上架日期: 
2019/09/20
資料集類型: 
系統介接程式
詮釋資料更新時間: 
2020/01/06 01:11
關鍵字: 
主題分類: 
其他
服務分類: 
資料集分類: 
開放資料
備註: 
瀏覽次數: 689 下載次數: 165 意見數: 2 品質檢測金標章

回應

回應: 
此筆資料相當有價值,但如果要做長期趨勢分析,似乎比較適合做成 open algorithm 而非 open data 的情況? 舉例來說,第一季十七歲的這筆紀錄: 2/9pu68bqUOBgqxd1qlCu2pYyYw,F,17,...,2019/03/31 14:56:16 在第二季時開始時則是十八歲: 2/9pu68bqUOBgqxd1qlCu2pYyYw,F,18,...,2019/04/01 15:52:26 可以分析出其生日顯然在第一季。大約有 1384 個 Id 都是如此。 要運用連結資料,重新識別這些 Id 的身份,也會稍低於其他 Id 的成本。

回應: 
簡單來說,只要跟蹤某人的出入站位置及時間數次後,就可以比對出某人的 IdCode,那就可以往前查某人的出入站軌跡,也可以知道某人未來的出入站動向。 時序性的資料,最好不要放出假名化後的 ID。