LowCarbonPower.org 方法學
本文檔解釋了LowCarbonPower.org上發布的電力數據的生產過程:數字的來源、如何調和不一致的數據來源,以及如何將許多獨立的數據集轉換為一個單一且一致的國家和地區電力生產情況的圖景。
我們試圖衡量的內容
對於每個國家和地區,以及盡可能多的年份(和最近的月份),我們希望有一個完整而內部一致的細分,包括:
從這些細分中,我們得出網站上顯示的數字:電力的低碳份額、估計的CO₂排放、電氣化估算和國家排名。
不同的數據提供商以不同的單位報告電力,因此我們首先將每個數字轉換為一個共同的單位:太瓦時(TWh)。
單一且共享的能源類型定義
核心挑戰在於每個數據供應商對燃料的描述不同。一個來源可能稱為"天然氣",另一個可能稱為"G3000",還有的稱為"燃氣"或者"Generation_NG_natural_gas"。有的來源只報告"可再生能源"的總數,另一些則分為風能、太陽能、水能和生物質能。
為了使來源具有可比性,我們將每個供應商的標籤映射到一個共享的能源類型層級結構。在頂層是總電力,它被分為低碳和化石來源(加上其他和淨進口)。低碳分為核能和可再生能源;可再生能源再分為水能和非水可再生能源;非水可再生能源分為風能、太陽能、地熱和生物燃料;太陽能進一步分為公用和用戶端(屋頂)太陽能。化石能源分為煤、天然氣、石油和未指定的化石殘渣。
因為每個來源都翻譯成這個相同的結構,我們可以直接比較它們,用一個來源填補另一個來源的空白,並始終知道任何匯總(如"化石能源")如何與其組成部分(煤 + 天然氣 + 石油 + 未指定)相關。我們同樣把每個國家和地區名稱的規範化到單一的ISO標準上,以便"Czechia"、"Czech Republic"和"Czech Rep."被認為是同一個地方,並且排除"OECD"或"EU27"等超國家聚合以避免雙重計算。
數據來源
我們結合了大約15個獨立供應商,每一個都有其在覆蓋範圍、及時性和詳情上的優勢。最重要的有:
- 國際能源署(IEA) — 按燃料和初級能源平衡的全球年度生產,以及涵蓋許多國家網生產、進口和出口的每月系列。
- 美國能源資訊署(EIA) — 全球和美國的年度生產,以及美國各州和電網地區的詳細月度生產(包括從每日和每小時數據重建的數據)。
- Ember — 全球年度和月度的電力生產和淨進口。
- 能源研究所統計評論(前身為BP) — 長期的全球年度生產和初級能源消耗。
- 歐盟統計局(Eurostat) — 按燃料的每月歐洲國家電力生產。
- ENTSO-E — 近實時的歐洲生產、跨境流動和需求,從亞小時測量聚合而成。
- 世界銀行 — 年度生產份額,我們將其轉換為絕對數字。
- 大型市場的國家統計 — 美國(如上所述的EIA)、中華人民共和國(國家統計局和國家能源局)和中華民國(台灣),在這些地方,官方數據比全球彙編商更詳細或更新。
- Enerdata和IEA — 年度淨進口(貿易)數字。
- 桑迪亞國家實驗室 — 全球能源儲存項目數據庫。
- 歷史重建 — 長期全球生產回溯到1900年,用於填補早年的空缺。
每個提供商的原始文件存放在項目的sources目錄中,並有下載它們的腳本。
各個來源的解析
每個供應商的數據會被讀取成相同的形狀:對於給定的燃料和國家,提供每年(或每月,寫作YYYY-MM)的數值。在這一階段會發生一些重複出現的轉換:
- 單位換算。 GWh、kWh、ktoe、拍焦和艾焦都使用適當的轉換因數轉換為TWh。
- 累積到週期的轉換。 中國的統計資料以年初至今的總量發佈,因此我們進行逐月差分以恢復每個月和季度的數值,並與發布的年度數字核對,以非修訂的、精度更高的官方數字為準。
- 亞小時到每月聚合。 ENTSO-E以15、30或60分鐘的解析度發佈生產和跨國界流量;我們將這些數據加總為每月總數並將功率轉換為能量。
- 每月到每年加總。 當一年的所有12個月都有數據時,我們將它們加總以產生該年的總數。最新的不完整期間被視為臨時年份,通常不包含在年度總數中。
- 空缺處理。 有缺失或不可靠燃料數據的早期年份被刪除,以免扭曲一個國家的歷史。
信任數據:持續交叉檢查
我們對任何單一數據都不輕信。在整個過程中,我們運行兩種一致性檢查:
- 組成部分必須加總為其匯總。 煤+天然氣+油+未指定數據應等於報告的化石總數;風能+太陽能+水能+生物燃料+地熱應等於可再生能源;依此類推,整個結構層級。
- 國家須加總為世界總數。 當來源報告全球總數時,必須與其個別國家的總和相匹配。
每個檢查的容差編碼了我們對各個來源的特點的了解——例如,某個特定提供商的生物燃料數據在1990年之前缺失,某一年被認為是不完整,或小的四捨五入差異可以接受。當某個差異超過容差時,過程會停止並標記出問題數字,而不是默認發布一個無法解釋的數字。這樣可以在數據質量問題進入網站前被捕捉到。
對於目前仍未完成的年度,我們放寬了對受部分年度報告影響的燃料的某些檢查,這樣臨時月份的數據不會因為尚未構成完整年數字而被拒絕。
將多個來源結合為一個答案
在解析後,我們對同一國家年度有多個重疊的視圖——例如,IEA、Ember和Eurostat可能都有2022年德國的數據。對於每個國家和每個年份(或月份),我們選擇使用一個來源,根據以下條件:
- 可靠性 — 根據每個提供商的經驗構建的手動調整優先順序(例如,國家統計數據和IEA的年度數據排名較高;近實時和預測來源排名較低)。
- 細節 — 一個將電力細分為更具體燃料的來源比只提供大類的來源更受青睞,因為它提供了更豐富的細分。
我們記錄了每個數據點選擇的來源,所以網站上任何數字的來源都可以完全追溯。
當選擇的來源缺少其他來源擁有的某些內容時——例如,初始能源價值,或僅報告為"化石"總數的煤/天然氣/石油劃分——我們從次佳來源補充該細節,使用次要來源的比例而非其絕對總數,這樣數字仍然與選擇的來源一致。
這裡會處理一些特殊情況:
- 用戶端(屋頂)太陽能。 一些來源將小規模屋頂太陽能包括在其總數中,有些則不包括。我們對這一點進行明確追蹤,以便可以區分公共事業規模和屋頂太陽能,並可以發布"包括"和"不包括"屋頂太陽能版本的數據。
- 電氣化。 在有初級能源數據和逐年熱效率假設的情況下,我們估算一個國家使用的總能源中有多少是電力。
最後,我們使用選擇的數字重建燃料層次(從其部分重新導出化石、低碳和其他父級總數),並再次核實一切加總正確。
淨進口(貿易)
淨進口與生產分開處理,因為進出口的符號很重要(國家可以是淨進口國或淨出口國),並且因為提供商在貿易上的分歧大於在生產上的分歧。
我們收集所有可用的貿易來源——來自Enerdata和IEA的年度數據,以及來自ENTSO-E、IEA、Ember和EIA的每月數據——並將它們彼此之間進行調和。對於每個國家和期間,來源數據與其平均值進行比較,超出容差的分歧被標記;當有更好數據時,可靠性較低的來源被刪除。通常更完整的來源(Enerdata的年度數據)更受優先。
然後,我們將調和的貿易數值折疊到生產數據集中:淨進口被加到一個國家的總電力供應中,而淨出口被記錄但不從生產中扣除。我們生成同時"包括淨進口"和"不包括淨進口"版本的數據集。
為了獲得最新圖景,我們還從每月數據來源中計算每個國家的滾動十二個月數據,選擇一致的十二個月窗口,例如,屋頂太陽能的數據處理在窗口中途不會改變。
構建地區、排放排名和儲能
一旦每個國家最終確定,我們會構建其他發布量:
- 地區組別。 我們將國家聚合成EU、撒哈拉以南非洲和世界等組別,對其成員進行加總並協調每個組別能夠涵蓋的年份範圍。
- CO₂排放。 根據每千瓦時的二氧化碳當量,為每種燃料分配一個排放係數(例如,煤約820,天然氣約490,石油約650,生物燃料約230,太陽能約45,水能約24,核能約12,風能約11)。將每種燃料的生產乘以其係數來得出排放估算;對於匯總的或不確定的燃料,我們使用一個範圍產生低、中和高估算。
- 排名。 根據電力的低碳份額,對國家進行排名,既有最新年份的排名,也有每個歷史年份的排名。
- 能源儲存。 根據儲能項目數據庫,我們根據每個項目的投產(和退役)時間來估算每個國家和年份的儲能電力和能源。
發布內容
這個過程產生了一小套覆蓋所有來源和地區的融合數據集,以JSON和CSV格式提供:
- 主數據集包含淨進口,以及一個不包含淨進口的對應數據集。
- 每月版本,以及包含和不包含用戶端太陽能的版本。
- 每個來源數據集,因此每個提供者的視圖可以單獨檢查,加上融合的每個提供者視圖,結合提供者的年度和每月數據。
- 一個單獨的能源儲存數據集。
每個數據集列出了可用的年份和能源類型,並為每個地區提供按照燃料的隨時間生產情況、每年最具體的燃料、選擇的每年來源以及衍生的排放、電氣化、排名,以及(如相關)組別的成員國家。
總結
- 從約15個提供商下載原始電力數據。
- 將所有內容轉換為一個共同的單位(TWh),並翻譯每個提供商的燃料標籤和國家名稱為一個共享定義。
- 持續交叉檢查燃料總數與其匯總是否相等,確保國家總數與世界總數一致,當無法調和時停止。
- 對於每個國家和期間,選擇一個最可靠且詳細的來源具有完整數據的來源- 記錄每個數字的來源-,並補充其他來源的缺失細節。
- 單獨調和淨進口並將其融入總數中。
- 添加用戶端太陽能處理、排放評估,電氣化,地區組別、排名和儲能。
- 發布融合和每個來源的數據集,以JSON和CSV格式。
