跳至主要內容

政府資料開放平臺

參、作業原則

第一條

AI-Ready Data 詮釋資料框架指標涵蓋資料來源之透明度,良好的資料品質,包含標示資料來源、時間範圍及品質管控方式等要素,有助於提升資料可信度。考量訓練資料對於時效與趨勢分析的依賴,具備時序性、可累積性之資料集常態上更具利用價值,資料提供方透過提高更新頻率、明確標註資料時間或資料版本之作法,將有助於 AI 模型掌握時態變化及進行動態學習。

對外公開之資料內容原則建議採用 UTF-8 編碼格式,資料如儲存於對外可存取的網路空間,並透過 HTTPS(HyperText Transfer Protocol Secure)協定提供下載服務,以確保資料傳輸的安全性。同時,宜明確闡述詮釋資料的內容及相關外部取得資訊,方便使用者查詢與連結下載。

資料提供方於資料產出過程,宜適當考量其資料屬性,優先採用結構化格式(如 CSV、JSON、XML 等),並統一欄位命名規則,同時搭配資料詞彙表(Data Vocabulary)與欄位說明文件,使資料易於理解與使用;結構化資料建議採用開放格式,或依數位發展部「共通性應用程式介面指引」提供應用程式介面(API 或 Web Service)服務,方便各界查詢與取用,達成機器對機器的識別、讀取及利用。

AI-Ready Data 詮釋資料框架指標可與結構化資料規則搭配,另行建構制定符合各領域需求、機器可讀的詮釋資料欄位,例如全球資訊網協會(World Wide Web Consortium,以下簡稱 W3C)推薦的資料目錄詞彙(Data Catalog Vocabulary,以下簡稱 DCAT)檢核規則,以提升資料的完整性與使用效率。

為權衡兼顧資料利用與隱私保護,AI-Ready Data 詮釋資料框架指標包含可信任指標的評估,以利瞭解資料產出適用範圍,促進適切合規利用。