LowCarbonPower.org 方法論
本文檔解釋了LowCarbonPower.org 上發布的電力數據是如何產生的:數據從何而來,如何調和不同來源之間的差異,以及如何將多個獨立的數據集轉化為單一且一致的畫面展示每個國家和地區如何發電。
我們試圖衡量的內容
對於每個國家和地區,以及數據允許的盡可能多的年份(包括近幾個月),我們希望獲得完整且內部一致的細分數據:
從這些細分數據中,我們派生出網站上顯示的數字:電力的低碳份額、估算的CO₂排放、電氣化估算和國家排名。
不同的提供商以不同的單位報告電力,因此我們對每個數字的第一步就是將其轉換為一個共同單位:太瓦時(TWh)。
能源類型的統一定義
主要挑戰是在於每個數據提供商對燃料的描述不同。一個來源說“天然氣”,另一個說“G3000”,再一個說“燃氣”,還有一個說“Generation_NG_natural_gas”。一個提供商報告單個“可再生能源”數據,另一個則將其分為風能、太陽能、水電和生物質能。
為了使不同來源的數據具有可比性,我們將每個提供商的標籤映射到能源類型的統一層次結構。最高層為總電力,細分為低碳和化石來源(加上其他和淨進口)。低碳重點分為核能和可再生能源;可再生能源分為水電和非水電可再生能源;非水電可再生能源再分為風能、太陽能、地熱能和生物燃料;太陽能進一步細分為公用規模和屋頂太陽能。化石能源分為煤炭、天然氣、石油和“不明確的化石”殘餘。
由於每個來源都被轉換到這個統一的樹形結構,我們可以直接對比數據,用一個來源填補另一個來源的空白,並始終確保任何總和(如“化石”)能對應其組成部分(煤 + 天然氣 + 石油 + 不明確)。我們同樣將每個國家和地區名稱規範為單一的 ISO 標準,以便“捷克”“捷克共和國”和“捷克共和國”被識別為同一地方,而像“經合組織”或“歐盟27”這樣的超國家總和被排除以避免重複計數。
數據來源
我們結合了大約十五個獨立的提供商,每一個在覆蓋範圍、及時性和詳細程度上都有不同的優勢。最重要的提供商包括:
- 國際能源署(IEA)——根據燃料來源的全球年度發電量和初級能源平衡,加上一個涵蓋許多國家的月度系列數據,包括淨生產、進口和出口。
- 美國能源信息署(EIA)——全球和美國年度發電量,以及對個別美國州和電網區域的詳細月度發電(包括基於每日和每小時數據重建的數據)。
- EMBER——全球年度和月度的電力生成和淨進口。
- 能源研究所統計回顧(前 BP)——長期全球年度發電和初級能源消耗數據。
- 歐洲統計局(Eurostat)——按燃料類型的歐洲國家月度發電數據。
- 歐洲電網運營商聯盟(ENTSO-E)——基於子小時測量的歐洲近實時發電和跨境流量及需求數據。
- 世界銀行——年度發電份額,我們將其轉化為絕對數據。
- 大型市場的國家統計數據——美國(如上所述的EIA),中華人民共和國(國家統計局和國家能源部)和臺灣,官方數據可能比全球聚合器更詳細或更及時。
- Enerdata 和 IEA——年度淨進口(貿易)數據。
- 桑迪亞國家實驗室——全球能源儲存項目數據庫。
- 歷史重建——從1900年起用於填補前期年份的長期世界發電數據。
每個提供者的原始文件存放在項目的sources目錄中,與用於下載它們的腳本放在一起。
每個來源的數據解析
每個提供者的數據都會被轉換成相同的格式:對於指定的燃料和國家,每一年(或者每個月,格式為YYYY-MM)都有一個值。在此過程中會發生數次重複的轉換:
- 單位轉換。 將GWh、kWh、ktoe、焦耳(PJ)和埃焦耳(EJ)轉換為 TWh。
- 累計到時段轉換。 中國的統計數據通常是年初至今的累計數,因此我們對連續的月份進行差分,恢復每個月和季度的單獨數據,並將其與發布的年度數據對比,以官方、未经修订、精度更高的數據為準。
- 次小時到月度聚合。 ENTSO-E 以15、30或60分鐘的分辨率發布發電和跨境流水數據,我們將這些數據匯總為月度總數。
- 每月匯總到每年度。 當一年的所有十二個月都已經存在時,我們將它們相加,以生成該年度的總數。最不完整的最後時期被視為暫時性,通常不包括在年度總和中。
- 缺失處理。 對缺少或不可靠的燃料數據的早期年份進行修剪,以避免扭曲一個國家的歷史。
確保數據可靠:持續的交叉檢查
我們並不將任何一個數字視為理所當然。在整個過程中,我們運行兩種一致性檢查:
- 組成部分必須與其總和一致。 煤 + 氣 + 油 + 未明確必須等於報告的化石總數;風能 + 太陽能 + 水電 + 生物燃料 + 地熱必須等於可再生能源總和;依此類推,按照整個層次結構。
- 國家總和必須等於全球總和。 如果一個來源報告全球總數,那麼它必須與其各個國家的總和一致。
每個檢查都有一個容差,這編碼了我們對一個來源特性特點的了解,例如某一特定提供商的生物燃料數據在1990年之前缺失,某個年份被認為是不完整的,或可以接受小的四捨五入差異。當某個偏差超過容差時,該過程會停止並標記出問題數字,而不是靜默發布我們不能解釋的數字。這就是如何在數據質量問題到達網站之前就被捕獲的方法。
對於當前仍未完成的年份,我們放鬆了對受部分報告年份影響最大的燃料的某些檢查,以便暫時的月度數據不會因不等於完整的年度數據而被拒絕。
將多個來源組合成一個答案
解析完數據後,我們對同一國家年份有多個重疊的數據觀察——例如,IEA、Ember 和 Eurostat 可能都對2022年的德國有數據。對於每個國家和每一年(月),我們選擇一個使用的來源,基於以下因素:
- 可靠性——基於每個提供商的使用經驗手動調整的偏好順序(例如,國家統計數據和 IEA 的年度數據排在前列;近實時和預測來源排在後面)。
- 細節程度——能夠將電力細分為更具體燃料的來源比只提供粗略類別的來源優先,因為這樣能產生更豐富的細分數據。
我們記錄網站上每一個數據點所選擇的來源,以便每個數字的出處都可以完全追溯。
當選定的來源缺少一些其他來源擁有的數據——例如,初級能源值,或僅報為“化石”的煤氣油分布——我們會從次佳來源中補充這些細節,並使用次級來源的比例而非其絕對總數以便數字保持與選定來源一致。
這裡處理了幾個特殊情況:
- 屋頂太陽能。 一些來源的總數包括小規模的屋頂太陽能,一些則不包括。我們明確記錄這一點以便將公用事業規模和屋頂太陽能分開發布,還可以發布包括和不包括屋頂太陽能版本的數據。
- 電氣化。 在有初級能源數據和逐年熱效率假設的情況下,我們估計一個國家總能源使用中的電力占比。
最後,我們根據選擇的數據重建燃料層次結構(從其組成部分重新推導化石、低碳和其他父類總數),並再次驗證一切是否合數。
淨進口(貿易)
淨進口的處理與發電分開,因為符號問題(國家可以是淨進口國或淨出口國),並且提供商在貿易方面的不一致多於發電。
我們收集所有可用的貿易數據來源——來自 Enerdata 和 IEA 的年度數據,以及來自 ENTSO-E、IEA、Ember 和 EIA 的月度數據——並進行相互調和。對於每個國家和時段,來源相互比較和平均,超出耐受度的分歧被標記出;當有更好的來源可用時,可靠性較低的來源會被丟掉。最完整的來源(年度數據一般來自Enerdata)通常優先選擇。
然後,我們將和解後的貿易數值合併到發電數據集中:淨進口會加到一個國家的總電力供應中,而淨出口則被記錄但不從發電中扣除。我們產出包含淨進口和不包含淨進口的數據版本。
為了獲得最新情況,我們還從月度來源為每個國家計算滾動的過去十二個月數字,選擇一致的十二個月窗口,以便例如,屋頂太陽能的處理不會在窗口內部改變。
建立地區、排放、排名和儲能
一旦對每個國家完成編輯,我們開始建立剩餘的公佈數量:
- 地區組。 我們將國家聚合為如歐盟、撒哈拉以南非洲和全球的組,累加成員數據並統一每個組可以覆蓋的年份範圍。
- CO₂排放。 每種燃料分配了一個每千瓦時的CO₂當量排放因子(例如,煤 ~820,氣 ~490,油 ~650,生物燃料 ~230,太陽能 ~45,水力 ~24,核能 ~12,風力 ~11)。將每種燃料的發電量乘以其因子即得排放估算;對於聚合燃料或不確定燃料我們使用範圍產生低、中和高估算。
- 排名。 根據電力的低碳份額排名各國,涵蓋最新年份和所有歷史年份。
- 儲能。 根據儲能項目數據庫,根據每個項目的啟用(和停用)時間,我們估算每個國家和年份的已安裝儲能功率和能源。
發布的內容
該過程產生了一小組涵蓋所有來源和所有地區的合併數據集中,提供 JSON 和 CSV 兩種格式:
- 一個包含淨進口的主數據集和一個不包含淨進口的匹配數據集。
- 月度版本,以及有和沒有屋頂太陽能的版本。
- 各個來源數據集,所以可以單獨檢查每個提供者的觀點,以及合併的各提供商的年度和月度數據視圖。
- 單獨的儲能數據集。
每個數據集列出可用年份和能源類型,並且為每個地區提供按燃料的發電時間序列、每年中最具具體性的燃料、每年選擇的來源,以及推導出的排放、電氣化、排名和(如適用)一個組的成員國。
數據修訂
我們釋放的某個月份數字首次發布時並非最終數字。整個網站的圖表總是顯示最新數據,因此一個數字在首次出現後有可能改變 —— 並且較舊的月度報告中的圖表可能不再與撰寫該報告時的散文相符。
月度數值因幾個原因會改變:
- 後續月份影響較早月份。 對於某些國家,總數(季度或年度)分配到每個月份。當一個新月份到來時,該總數重新分配,因此同一時期的較早月份值會發生變化,即使沒有提供商更正它們。年初至今的總數通常保持不變,而月份之間的分裂會發生變化。
- 所選來源或基準可能會變更。 隨着更多數據的到來,我們可能會轉而使用更完整或更詳細的地區和月份提供商,這會移動基準。隨着該估計固定,月底是否包括屋頂太陽能也可能變化,移動比較。
- 提供商修訂其自身數據。 上游來源經常重新陳述最近的月份,因為審計數據會替換暫時數據。
因此,當報告的圖表引用報告期之後的月份數據時,我們顯示一個通知說明這些數字自發布以來可能已被修訂,並鏈接回此頁面。原始書面評論保持不變,作為報告發布時已知信息的記錄。
總結
- 從大約十五個提供商處下載原始電力數據。
- 將所有東西轉換為共同單位(TWh),並將每個提供商的燃料標籤和國家名稱轉換為一個共享定義。
- 持續交叉檢查燃料是否加總到其總和國家是否加總至世界總合,在無法調和時停止。
- 為每個國家和時段選擇一個擁有完整數據的最可靠和最詳盡的來源——記錄每一個數字來源——並從其他來源補充缺失細節。
- 分別調和淨進口並將之納入總數。
- 加入屋頂太陽能處理、排放、電氣化、地區組、排名和儲能。
- 發布 JSON 和 CSV 格式的合併和各來源數據集。

