reviewed_by: rd: Ronny pm: Zoe

tw.gov.cec~ref~candidates — 中選會候選人資料

版本:2026-05 最後更新:2026-05-20 維護:歐噴資料(data.openfun.tw) 授權:CC-BY 4.0 International 原始資料授權:政府資料開放授權條款-第 1 版

資料集概述

中央選舉委員會所公開之歷屆公職人員選舉候選人 metadata。涵蓋全國性與地方選舉的所有候選人,包含姓名、號次、政黨、性別、出生日期、出生地、學歷、現任狀態、當選註記、副手等基本資料。

本資料集為選舉資料的核心人物 metadata,可串接:

資料來源

項目 說明
原始資料 中央選舉委員會選舉資料庫 https://www.cec.gov.tw/central/menu/132
開放平台 政府資料開放平台 https://data.gov.tw/dataset/13119
整理來源 歐噴資料庫(data.openfun.tw)
原始授權 政府資料開放授權條款-第 1 版
引用標示 CC-BY 歐噴資料庫,中選會,政府資料開放平台
總筆數 見 Portal 資料集頁面
更新頻率 每週

主鍵設計:候選人代碼 vs 人物代碼

候選人代碼

每位候選人在每場選舉中的唯一識別碼,格式:

{vote_id}:{選區代碼}:{號次}

範例:ELC-D2-98:10013070:2 拆解:

  • ELC-D2-98 → 98 年鄉鎮市長選舉(vote_id)
  • 10013070 → 屏東縣麟洛鄉(選區代碼)
  • 2 → 號次

同一人若參選多次,會有多筆紀錄,每筆 候選人代碼 不同。

人物代碼

為串接同一人跨屆紀錄而設計,等於該人第一次參選的 候選人代碼

範例:某人在民國 99、103、107 年連續三屆參選縣議員,會有 3 筆紀錄;3 筆的 人物代碼 都是 99 年那次的 候選人代碼

人物代碼 做歷屆比較,不要用 姓名(同名問題嚴重)。

欄位說明

選舉代碼

對應 tw.gov.cec~ref~election-eventvote_id。可 JOIN 取得選舉日期、層級、屆次。

姓名

候選人姓名(中文)。

選區別 與衍生欄位

  • 選區別:原始選區描述字串(如 屏東縣麟洛鄉新北市第三選舉區
  • 選區別.縣市 / 選區別.鄉鎮市區 / 選區別.村里:從 選區別 解析出之行政區代碼,對應 tw.openfun~entity~geo。可做精確篩選與統計聚合。

衍生欄位(含 . 者)由系統自動解析,可用於 query 與 /agg,但不會出現在記錄輸出。

號次

候選人號次(整數)。

政黨政黨.代碼

  • 政黨:政黨名稱(原始申報名稱)
  • 政黨.代碼:對應 tw.gov.moi~ref~party政黨編號

特殊值:「無黨籍及未經政黨推薦」表示獨立候選人。

性別

/

出生日期 與衍生 出生日期.日期

  • 出生日期:原始字串
  • 出生日期.日期:解析為標準日期格式,可做日期比較與年齡計算

出生地

中選會分類,值以縣市名稱為主,另有若干特殊類別:

類別 代表值 說明
臺灣省 絕大多數臺灣本省出生候選人
縣市 高雄市新北市臺南市臺北市臺中市桃園市 各直轄市及縣市名稱皆有
特殊地區 金馬地區 金門、連江出生者
大陸出生 其他省市 中國大陸各省出生候選人
其他 其他國家香港其他 海外出生等
空白 (約佔 25%) 早期或補選資料較常缺值

⚠️ 注意事項:

  • 新舊拼法並存台北市臺北市台南市臺南市台中市臺中市 各自獨立存在,篩選時兩種拼法都要查
  • 不用「福建省」或「金門縣」:金馬出生者登記為 金馬地區,用縣市名稱篩選會 0 筆
  • 空白率高:約四分之一紀錄無出生地資料,分析時需注意樣本偏誤

學歷

候選人申報之最高學歷,常見值:國小國中高中大專大學碩士博士其他

⚠️「大專」與「大學」並列存在 — 「大專」為早期五專、二專、三專等專科分類,「大學」為四年制大學畢業。做學歷分布或統計時兩者應分開計算,不要合併。

現任

YN 字串。表示「投票日當下是否為該職位之現任者」。

Y 不僅代表現任續任,也包括「現任 A 職位、改參選 B 職位」的情況(例如現任立委改選縣長,現任欄仍記為 Y)。實際語意請結合 選舉代碼.vote_level_id(該次參選的職位)一併解讀。

當選註記

中選會用 5 種符號標示候選人的選舉結果:

含義
* 當選
空字串 落選(一般情況)
! 議員選舉婦女保障名額當選 — 全部為女性候選人。依《地方立法機關組織準則》第 5、6、7 條,地方議員(直轄市議員、縣(市)議員、鄉(鎮、市)民代表)每選舉區應選名額達 4 人者應有婦女當選名額 1 人;超過 4 人者每增加 4 人增 1 人。當婦女當選人未達應有名額時,依《公職人員選舉罷免法》第 68 條,將婦女候選人所得選舉票單獨計算,由得票較多之婦女候選人依序當選
- 被婦女保障名額擠下落選 — 其得票數原本足以當選,但因婦女保障規定,席位被女性候選人遞補
? 同票須抽籤 — 例如 107年村里長選舉中,每個抽籤選區恰好 2 名候選人同時標記 ?,最終當選結果未反映在本資料集

分析時的注意事項:

  • 「全部當選人」= * + !(不能只篩 *,會漏掉婦女保障名額當選者)
  • ⚠️ 民國 111 年(2022)起 - 標記消失:111 年以後的議員選舉只有 ! 而無對應 -,跨年代比較時不能用 - 的數量推估婦女保障影響範圍
  • ? 紀錄的最終當選結果需另查中選會官網該選區公告

副手

Y 或空字串。Y 表示此筆為副手候選人,空字串表示正候選人。主要用於總統副總統選舉,但實際上也適用於其他聯名選舉的副手。候選人代碼 通常會在副手紀錄上加 :副手 後綴,例如 ELC-P0-9:1 是正候選人陳履安、ELC-P0-9:1:副手 是其副手王清峰(副手欄位 = Y)。

要找正副候選人配對時,以 候選人代碼 去掉 :副手 後綴後比對即可。

資料特性與限制

涵蓋範圍

  • 中選會選舉資料庫所載之公職選舉候選人
  • 涵蓋總統、立委、地方首長、地方議員、村里長等各層級

常見誤用與注意事項

  1. 沒有得票數:本資料集只記載「誰參選」,不含「誰得幾票」、「投票率」等選舉結果資訊。候選人得票數請查 tw.gov.cec~txn~candidates-votes(以 候選人代碼 串接);選舉人數/投票率/廢票請查 tw.gov.cec~txn~votes-geo
  2. 學歷依候選人申報、未經查核:學歷誇大或不實時有所聞;做學歷統計時請理解這是「自我申報值」而非「教育部認證值」。
  3. 政黨名稱在不同年代會變動:政黨改名、合組、分裂頻繁;跨年代統計請改用 政黨.代碼(對應 tw.gov.moi~ref~party 的政黨編號),編號是穩定的、名稱不是。
  4. 「選區描述」格式因選舉類型而異:鄉鎮市長用「屏東縣麟洛鄉」、立委用「新北市第三選舉區」、不分區立委或政黨票則沒有地理選區。做地理層級分析時建議用衍生欄位 選區別.縣市 等,而非 選區別 原始字串。
  5. 選舉名稱 vs 選舉代碼.vote_name 格式不同:本資料集 選舉名稱 是文字(如 113年立法委員選舉),但 JOIN tw.gov.cec~ref~election-event 取出的 vote_name 是「第 N 屆」格式(如 第11屆立法委員選舉)。同一場選舉但兩種寫法,比對時須注意。

與其他資料來源的差異

屬性 本資料集 中選會官網查詢
欄位數 多(含衍生欄位、結構化) 同左
跨年代查詢 透過 人物代碼 直接 JOIN 需逐次點擊
API 查詢 支援 filter、agg 僅網頁瀏覽
得票數 連接 tw.gov.cec~txn~candidates-votes(得票)與 tw.gov.cec~txn~votes-geo(投票概況)

相關資料集與主題

類型 連結 關聯說明
資料集 tw.gov.cec~txn~candidates-votes 候選人各層級得票數;該表 候選人代碼 引用本表主鍵
資料集 tw.gov.cec~txn~votes-geo 選區投票概況(選舉人數、投票率、廢票)
資料集 tw.gov.cec~ref~election-event 投票事件 metadata,選舉代碼 引用
資料集 tw.gov.cec~ref~election-level 選舉層級代碼
資料集 tw.gov.cec~ref~election-type 投票種類代碼
資料集 tw.gov.moi~ref~party 政黨資料
資料集 tw.openfun~entity~geo 行政區代碼
資料集 tw.openfun~bulk~campaign-finance 政治獻金,姓名 + 選舉可對照

更新頻率與版本記錄

版本 更新日期 說明
2026-05 2026-05-20 知識文件初始建立
2026-05 2026-05-22 校對更新:現任 更新為 Y/N 字串說明、出生地 補上完整分類(含「金馬地區」等特殊值)及注意事項、學歷 補上「大學」、副手 更新為 Y/空旗標說明;補上 選舉名稱選舉代碼.vote_name 格式差異說明;補上 當選註記 5 種值的詳細說明(含婦女保障名額規則與 ? 同票須抽籤確認)

AI 使用指引

AI agent 使用指引見 skill.md