LowCarbonPower logo
Instagram Facebook X (Twitter)

LowCarbonPower.org 方法论

本文档解释了如何生成并发布在 LowCarbonPower.org 上的电力数据:数据来源于何处,如何协调彼此存在分歧的信息源,以及如何将多个独立的数据集整合为一个完整的、连贯的画面,以呈现每个国家和地区的电力生成情况。


我们试图测量的内容

对于每个国家和地区,以及尽可能多的年份(包括最近几个月),我们希望获取一个完整且内部一致的分类:

从这个分类中,我们得出展示在网站上的数据:电力的低碳份额,估算的二氧化碳排放电气化估算以及各国排名

不同供应商以不同单位报告电力,因此我们对每个数字的首要处理是将其转换为一个统一的单位:太瓦时(TWh)


能源类型的统一定义

核心挑战在于不同的数据提供者以不同方式描述燃料种类。一些来源会说“Natural Gas”(天然气),其他则可能称为“G3000”、“燃气”或者“Generation_NG_natural_gas”。有的只给出一个“可再生能源”的总数,而有的则细分为风能、太阳能、水力和生物能源。

为了使数据可比,我们将每个提供者的标签映射到一个共享的能源类型层次结构。在最顶端是总电力,接下来分为低碳化石能源(还包括其他净进口)。低碳能源再分为核能和可再生能源;可再生能源分为水力和非水力可再生能源;非水力再分为风电、太阳能、地热和生物燃料;太阳能进一步分为大规模光伏和用户侧(屋顶)光伏。化石能源被分为煤、气、石油和一个“未指定化石”的其余部分。

由于每个来源都转换到相同的树结构,我们能够直接进行比较,用一个来源填补另一个的空缺,并始终知道任何聚合项(如“化石”)如何关联到其组成部分(煤+气+石油+未指定)。同样地,我们将每个国家或地区的名称标准化为一个ISO标准,以确保“Czechia”、“Czech Republic”和“Czech Rep.”被识别为同一地点,并排除如“OECD”或“EU27”这样的超国家组织以避免重复计数。


数据来源

我们结合了大约十五个独立的提供者,各自在覆盖面、时效性和细节上具备不同的优势。最重要的包括:

  • 国际能源署(IEA全球按燃料划分的年度发电量和一次能源平衡,加上许多国家的月度净生产、进口和出口系列。
  • 美国能源信息署(EIA — 全球和美国的年度发电量,以及详细的月度发电量数据,涵盖每个美国州和电网区域(包括从每日和每小时数据重建的数据)。
  • Ember — 全球年度和月度的电力生成和净进口数据。
  • 能源研究院统计评估(前BP) — 长期的全球年度发电量和一次能源消费。
  • 欧洲统计局(Eurostat — 欧洲国家按燃料划分的月度电力生成。
  • 欧洲输电系统运营商网络(ENTSO-E — 来自分小时测量数据的实时欧洲发电、跨国流量和需求。
  • 世界银行 — 年度发电份额,我们将其转换为绝对数值。
  • 主要市场的国家统计 — 美国(如上所述的EIA)、中华人民共和国(国家统计局和国家能源局)以及中华民国(台湾),官方数据比全球聚合数据更加详细或最新。
  • Enerdata 和 IEA — 年度净进口(贸易)数据。
  • 桑迪亚国家实验室 — 关于能源存储项目的全球数据库。
  • 历史重建 — 世界发电长达至1900年的长期数据用于补齐早期年份数据。

每个提供者的原始文件存放于项目的 sources 目录内,该目录旁还存放用于下载它们的脚本。


如何解析每个来源

每个提供者的数据都被读入相同的格式:针对特定燃料和国家的数据,提供每年的值(或者每个月,格式为 YYYY-MM)。在这个阶段会发生几个经常重复的转化:

  • 单位转换。 GWh、kWh、千吨石油当量(ktoe)、拍焦耳(PJ)和艾焦耳(EJ)都使用适当的转换系数转换为TWh。
  • 累积到周期的转换。 中国的统计数据以年度迄今为止的累计总额公布,因此我们会计算连续月份的数据差,以恢复每个月和季度的独立值,并将其与年度公布值对比,以非修订的、高精度的官方数据为优先。
  • 子小时到月度聚合。 ENTSO-E以15、30或60分钟分辨率发布发电和跨国流量;我们将这些数据汇总为月度总数,并将功率转换为能源。
  • 月度到年度的汇总。 当一年的所有12个月都存在时,我们将其汇总为该年度的总量。最新的不完全周期被视为临时处理,并通常排除在年度总数之外。
  • 缺失数据处理。 早期年度中缺失或不可靠的燃料数据被剪去,以免扭曲一个国家的历史。

数据一致性检查

我们不会轻易接受任何单一数字。在整个过程中,我们进行两种一致性检查:

  1. 组成部分必须相加到它们的汇总。 煤+气+油+未指定必须等于报告的化石总量;风+太阳能+水电+生物燃料+地热必须等于可再生能源,总之需涵盖整个层次结构。
  2. 国家数据必须符合全球总量。 如果一个来源报告全球总数,它必须与各国数据的总和一致。

每次检查都有一个宽容度,编码了我们对一个来源特殊情况的了解——例如,一个特定来源的生物燃料数据在1990年之前缺失,某个年份已知是不完整,或者小的四舍五入误差可以接受。当差异超出宽容度时,过程会停止并标记出现问题的数字,而不是默默地发布一个我们无法解释的数字。这就是在数据质量问题到达网站之前被捕获的方式。

对于当前仍不完整的年份,我们放宽了受部分年度报告影响最严重的燃料的某些检查,以免临时的月度数据因尚不符合全年数据而被拒。


将多种来源合并为一个答案

在解析之后,我们对同一年份的同一个国家有着多个视角——例如,IEA、Ember和Eurostat可能都有德国2022年的数据。对于每个国家和每一年份(或月份),我们选择一个来源作为数据来源,基于以下标准:

  • 可靠性 — 基于与每个提供者合作的经验建立的手动调整偏好顺序(例如,国家统计和IEA的年度数据排名较高;而实时和预测来源排名较低)。
  • 细节 — 与只提供粗略类别的数据相比,能够将电力解析为更具体燃料的来源优先,因为它能提供更丰富的细分。

我们记录每一个数据点所选择的来源,因此网站上任何数字的出处都可以被完全追溯。

当某选定来源缺少其他来源所拥有的数据时——例如主要能源数值,或在仅报告为“化石”的汇总中缺少煤、气、油的分拆——我们使用第二好的来源的比例而不是绝对总数来填补具体细节,从而使数字与所选来源保持一致。

此处涵盖了一些特殊案例:

  • 用户侧(屋顶)光伏。 某些来源包括小规模屋顶光伏在他们的总数中,而某些则不包括。我们明确追踪这个差异,以便能够区分大规模光伏和屋顶光伏,并可以发布包括和不包括屋顶光伏版本的数据。
  • 电气化。 在主要能源数据和逐年热效率假设可用的情况下,我们估计一个国家总能源使用中的电力份额。

最后,我们从所选数据中重建燃料层次结构(从其组成部分重新导出化石、低碳和其他父级总量),并再一次验证所有部分加总正确。


净进口(贸易)

净进口与发电单独处理,因为其符号重要(一个国家可以是净进口国或净出口国),并且供应商之间在贸易数据上的分歧大于发电数据。

我们收集每一个可用的贸易来源——来自Enerdata和IEA的年度统计,和来自ENTSO-E、IEA、Ember和EIA的月度统计——并相互核对。对于每个国家和周期,来源相较于它们的平均值比较,超出宽容度的分歧会被标记;当有更好来源时,较不可靠的来源会被放弃。最完整的数据来源(通常是Enerdata的年度数据)通常获得优先权。

然后我们将对齐后的贸易数据纳入发电数据集:净进口加到一个国家的总电力供应中,而净出口被记录但不从发电中减去。我们同时生成“包括净进口”和“排除净进口”两个数据集版本。

为了提供最新的画面,我们还从月度来源计算出每个国家的滚动后十二个月数据,并选择一致的十二个月窗口,以保证例如屋顶光伏的处理不会在窗口中途变动。


构建区域、排放、排名和存储

一旦每个国家的数据确定后,我们构建其余的已发布量:

  • 区域分组。 我们将国家分组为EU、撒哈拉以南非洲和世界等区域,汇总其成员并统一每个组可以涵盖的年份范围。
  • 二氧化碳排放。 每种燃料被分配了每千瓦时的等效二氧化碳排放因子(例如,煤炭约820,天然气约490,石油约650,生物燃料约230,太阳能约45,水电约24,核电约12,风电约11)。将每种燃料的发电量乘以其因子即得出排放估算值;对于汇总项或不确定的燃料,我们使用一个范围生成低、中、高估算值。
  • 排名。 根据电力的低碳份额对各国进行排名,涵盖最新年份和每个历史年份。
  • 能源存储。 从存储项目数据库中,我们根据每个项目的启用(和退役)时间估算每个国家和年份的已安装存储功率和能量。

发布内容

该过程生成覆盖所有来源和地区的少量组合数据集,提供JSON和CSV格式:

  • 一个包括净进口的主要数据集以及一个排除净进口的匹配数据集。
  • 月度版本,以及有和没有屋顶光伏的版本
  • 按来源的数据集,因此每个提供者的视角可以独立查看,还包括合并的按提供者视图,结合了提供者的年度和月度数据。
  • 一个单独的能源存储数据集。

每个数据集列出可用年份和能源类型,并为每个地区提供随时间变化的燃料发电量、每年存在的最具体燃料、每年选择的来源以及推导出的排放、电气化、排名和(如相关)一个组的成员国家。


总结

  1. 从大约十五个提供者下载原始电力数据。
  2. 将一切转换为一个共同单位(TWh)并将每个提供者的燃料标签和国家名称翻译为共享定义。
  3. 持续检查燃料之和是否与其总和一致,确保国家总和与全球一致,出现无法协调的问题时停止。
  4. 在每个国家和周期,选择一个最可靠和最具细节的来源,并记下每个数字的来源,用其他来源填补缺席细节。
  5. 单独协调净进口并将其纳入总量。
  6. 添加屋顶光伏处理、排放、电气化、区域分组、排名和存储。
  7. 在JSON和CSV中发布组合数据集和按来源数据集。

下载年度的数据: CSV JSON

下载月度的数据: CSV JSON

Instagram Facebook X (Twitter)