多數企業的 ESG 報告,仍然停在「年底趕工、手動貼數字」的階段。數據科學可以怎麼改變這件事?這篇拆解流程差異,講清楚哪些環節值得自動化,哪些不該急。
作者:王駿瑋 David Ishayahu ・ 2026-06-22 ・ 閱讀約 8 分鐘
如果你待過永續部門,這個場景應該不陌生:年底截止日逼近,各部門的 Excel 陸續匯進來,格式全都不一樣。有的用公斤,有的用噸。有的填了上半年,下半年空白。有的乾脆用文字描述「大約減少一成」。
永續專員的工作,大部分時間花在「把這些東西湊成一份看起來合理的報告」。分析?洞察?等湊完數字再說,通常也沒時間了。
這不是能力問題,是流程問題。當數據收集本身就耗掉 70% 的時間,留給分析的空間自然不夠。
把兩種做法拆開來比,差異在三個地方:資料怎麼來、分析怎麼做、結果怎麼用。
重點不在「用了什麼技術」,而在「人的時間花在哪裡」。傳統流程裡,人的時間花在搬運數據。數據科學流程裡,搬運交給程式,人專注在解讀和決策。
碳排放計算需要電費、水費、運輸里程、原料採購量。這些數據分散在 ERP、電力公司帳單、物流系統裡。寫一支 Python 腳本串 API,比寄 Email 催各部門快十倍。
CertiCarb 的碳排驗證技術就是用這個邏輯:讓資料從源頭直接流進分析管道,跳過人工轉手。
ESG 報告書裡有大量文字。「本公司致力於永續發展」這類句子,聽起來正確,但資訊量是零。NLP(自然語言處理)可以做的事是:比對報告內容與 GRI 準則或 IFRS S1/S2 的具體要求,算出「哪些揭露項目有實質回應,哪些只是空話」。
TISEE 在做的事跟這個直接相關:用數據拆解永續報告書的實質內容。
拿到乾淨的歷史數據後,時間序列模型可以預測下一季的碳排放量。如果某個月的用電量突然飆高,異常偵測演算法會自動標記,提醒你去查原因。
這比年底才發現「今年碳排放增加 15%」然後不知道為什麼,實用太多了。
講完值得做的,也要講不該急的。兩件事建議慢慢來:
利害關係人溝通
ESG 報告的讀者是投資人、員工、社區。他們在意的不只是數字,還有「這家公司到底有沒有在認真做」。這個判斷需要人寫,模型寫不出溫度。
重大性評估的最終判斷
數據科學可以跑出哪些 ESG 議題跟財務表現相關性高,但「哪些議題對這家公司最重要」的最終判斷,涉及策略取捨,需要管理層決定。模型給的是排序建議,不是答案。
不是買工具,不是找顧問。第一步是盤點你手上的數據。
列出你目前 ESG 報告需要的所有數據項目
標記每一項的來源:哪個系統、哪個部門、什麼格式
找出最花時間的三個環節(通常是跨部門催數據和格式轉換)
從最痛的那個點開始寫第一支自動化腳本
想了解完整的數據科學流程,可以從研究室的基礎介紹開始。
數據科學透過自動化資料收集、NLP 文本分析、統計建模等技術,取代傳統人工填表流程。用 Python 串接電費帳單 API 自動計算碳排放,或用 NLP 模型比對 ESG 報告與 GRI 準則的語意一致性,都是具體的應用方式。
三個最常見的問題:數據散落在不同部門的 Excel 裡且格式不統一、歷史數據有大量缺值導致無法做趨勢分析、定性描述多於定量數據使得建模困難。數據清洗通常佔整個分析流程 60% 以上的時間。
可以從小處開始。不需要整套系統,先把最耗時的手動環節(通常是資料收集和格式統一)用簡單的腳本自動化,就能省下大量時間。關鍵是先做數據盤點,搞清楚「數據在哪裡、什麼格式」。
想看數據科學怎麼實際拆解碳排放數據?
看 CertiCarb 的碳排驗證技術本內容僅供參考,不構成投資建議或法規遵循之保證。ESG 分析結果受方法論與數據來源影響,實際應用請依據專業機構之查證結果。