LowCarbonPower.org 方法论
本文档解释了如何生成发布在 LowCarbonPower.org 上的电力数据:数据来源,如何整合彼此不一致的信息来源,以及如何将大量分散的数据集转化为一个一致的全球各国和地区电力生成图景。
我们试图测量什么
对于每个国家和地区,以及数据所允许的尽可能多的年份(和最近月),我们希望获得一个完整且内部一致的分类说明:
通过这一分类,我们得出网站上显示的数字:电力的低碳比例、估算的二氧化碳排放、电气化估计,以及国家排名。
不同的数据提供商以不同的单位报告电力,因此我们对每个数字做的第一件事就是将其转换为一个共同的单位:太瓦时(TWh)。
能源种类的单一共享定义
中心挑战在于每个数据提供商对燃料的描述方式各异。一个来源称之为“天然气”,另一个称为“G3000”,还有的称为“燃气”,或者“Generation_NG_natural_gas”。一个报告单一的“可再生能源”数据;另外一个将其分为风能、太阳能、水电和生物质能。
为了使来源可比较,我们将每个提供商的标签映射到一个共享的能源类型层级。在顶层是总发电量,它分为低碳和化石来源(加上其他和净进口)。低碳分为核能和非核低碳;非核低碳分为水电和非水电低碳;非水电低碳分为风能、太阳能、地热和生物燃料;太阳能则进一步分为公用级和用户侧(屋顶)太阳能。化石燃料分为煤炭、天然气、石油和一个“未指定化石”的剩余类别。
由于每个来源都被转换成这个相同的结构,我们可以直接比较它们,使用另一个来源填补一个来源的空白,并且始终知道任何总量(例如“化石燃料”)与其部分(煤+气+油+未指定)如何相关。我们同样将每个国家和地区名称标准化为单一的ISO标准,因此“捷克”、 “捷克共和国”和“捷克共和”被视为同一地点,并将超国家聚合体如“经合组织”或“欧盟27国”排除以避免重复计算。
数据来源
我们结合了大约十五个独立提供商,每个提供商在覆盖范围、时效性和细节上各有优势。最重要的是:
- 国际能源署(IEA)—— 全球年度按燃料统计的发电量和一次能源平衡,还有涵盖许多国家的月度净生产、进口和出口系列。
- 美国能源信息署(EIA)—— 全球及美国年度和详细的美国各州和电网地区按月份的发电数据(包含从每日和每小时数字重构的数据)。
- Ember—— 全球年度和月度电力生成以及净进口。
- 能源研究所统计评估(前BP)—— 长期全球年度发电量和一次能源消耗。
- Eurostat—— 欧洲国家的月度按燃料统计的电力生成。
- ENTSO-E—— 近实时的欧洲发电量、跨境流动和需求,汇总自每小时以下的测量。
- 世界银行—— 年度发电份额,我们将其转换为绝对数字。
- 主要市场的国家统计数据—— 美国(如上所述,EIA),中华人民共和国(国家统计局和国家能源局)和中华民国(台湾),这些地方的官方数据比全球汇总的数据更详细或更新。
- Enerdata和IEA—— 年度净进口(贸易)数据。
- Sandia国家实验室—— 能源储存项目的全球数据库。
- 历史重建—— 全球发电历史追溯至1900年,用于弥补早期年份。
每个提供商的原始文件都位于项目的sources目录中,与用于下载它们的脚本在一起。
如何解析每个来源
每个提供商的数据都以相同的形式读取:对于给定的燃料和国家,为每年(或每月,以YYYY-MM格式表示)提供一个值。在这一阶段会发生若干常见的转换:
- 单位转换。 GWh、kWh、千吨油当量、拍焦耳和艾焦耳都转换为TWh,使用相应的转换系数。
- 累积到周期转换。 中国的统计数据以年初至今的累计总数发布,因此我们通过相邻月份的差分还原每个月和每个季度的值,并将这些值与公布的年数据核对,在存在版本冲突时,优先采用官方的、未修订的高精度数字。
- 子小时到月度聚合。 ENTSO-E发布的发电和跨境流动以15分钟、30分钟或60分钟的分辨率发布;我们将这些数据汇总为月度总量并将功率转换为能源。
- 月度到年度汇总。 当一个年份的所有十二个月都在时,我们将它们汇总以生成该年的总数。最近期的、不完整的期间被视为临时性的,通常从年度总数中排除。
- 缺口处理。 早期年份缺少或不可靠的燃料数据经过修整,因此它们不会扭曲一个国家的历史。
数据可靠性:持续交叉核对
我们不轻信任何单一数字。在整个过程中,我们进行两种一致性检查:
- 组成部分必须与其总量相等。 煤+天然气+石油+未指定必须等于报告的化石总量;风能+太阳能+水电+生物燃料+地热必须等于低碳;等等,贯穿整个层级。
- 国家必须与全球总量相等。 当一个来源报告全球总量时,它必须与其单个国家的总和相符。
每个检查都有一个可容忍的公差,用以编码我们对来源特性的了解——例如,一个特定提供商的生物燃料数据在1990年之前缺失,一个已知是不完整的年份,或者小的舍入误差是可以接受的。当一个偏差超出公差时,过程将停止并标记有问题的数字,而不是无声地发布一个我们无法解释的数字。这是如何在数据质量问题达到网站之前就被捕捉到的。
对于当前尚未完成的一年,我们对因局部年度报告影响最大的燃料放宽一些检查,这样临时的月度数据不会仅仅因为还没有加起来到完整的年度数字而被拒绝。
将多个来源整合为一个答案
解析后,我们对同一国家年份有多种重叠的看法——例如,IEA、Ember和Eurostat都可能有2022年德国的数据。对于每个国家和每一年(或每个月),我们选择一个来源使用,基于以下考量:
- 可靠性—— 一个手动调整的优先顺序,基于对每个提供商的经验(例如,国家统计数据和IEA的年度数据排名很高;接近实时和预测来源排名较低)。
- 细节—— 能够将电力分解为更具体燃料的来源优于仅提供广泛类别的来源,因为它提供了更丰富的分解。
我们记录每一个数据点选择了哪个来源,因此网站上的任何数字的出处都是完全可追溯的。
当所选来源缺少其他来源所拥有的某些内容时——例如,一个一次能源价值,或者一个被仅仅报道为“化石”的块的煤/气/油分解——我们从下一个最佳来源中添加该细节,使用次级来源的比例而不是其绝对总量,以便数字与所选来源保持一致。
在这里处理的一些特殊情况:
- 用户侧(屋顶)太阳能。 一些来源在他们的总量中包括小规模屋顶太阳能,而一些则没有。我们明确跟踪这一点,以便公用级和屋顶太阳能可以分开,并且我们可以发布包括及不包括屋顶太阳能的数据版本。
- 电气化。 当一次能源数据和逐年热效率假设可用时,我们估计一个国家总能源使用中电力的比例。
最终,我们从选定的数据重新建立燃料层级(从它们的组成部分重新导出化石、低碳和其他父总量),并再次验证一切是否相加。
净进口(贸易)
净进口与发电分开处理,因为符号很重要(一个国家可以是净进口国或净出口国),并且提供商在贸易方面的分歧较大。
我们收集所有可用的贸易来源——来自Enerdata和IEA的年度数字,以及来自ENTSO-E、IEA、Ember和EIA的月度数字——并将它们相互对比。对于每个国家和时期,将各个来源与其平均值进行比较,超出公差的分歧被标记;当有更好的来源可得时,不太可靠的来源被舍弃。最完整的来源(Enerdata提供的年度数据)通常被优先选用。
然后,我们将调整后的贸易值纳入发电数据集中:净进口被添加到一个国家的总电力供应中,而净出口被记录但不从发电中减去。我们同时生成“包括净进口”和“不包括净进口”的数据集版本。
为了获得当前最完整的图景,我们还从月度数据中计算每个国家的滚动十二个月数据,选择一致的十二月窗口,以避免窗口期间处理改变,特别是在屋顶太阳能方面。
构建地区、排放、排名和储能
一旦每个国家的数据确定下来,我们构建剩余的可发布数量:
- 区域组。 我们将国家聚合为如欧盟、撒哈拉以南非洲和世界等组,将其成员相加,并统一每个组可覆盖的年份范围。
- 二氧化碳排放。 每种燃料都分配了一个以每千瓦时一氧化碳当量克表示的排放因子(例如,煤~820,气~490,油~650,生物燃料~230,太阳能~45,水电~24,核能~12,风能~11)。通过将每种燃料的发电量乘以其系数,我们得出排放估计;对于汇总或不确定的燃料,我们使用范围来产生低、中和高估值。
- 排名。 国家按其电力的低碳比例进行排名,不仅是最新年份,也包括每个历史年份。
- 储能。 根据储能项目数据库,我们根据每个项目的建成(及退役)日期,估算每个国家和年份的安装储能功率和能量。
发布内容
该过程生成了一小组覆盖所有来源和所有地区的数据集,提供JSON和CSV格式:
- 一个包括净进口的主数据集和一个匹配的不包括净进口的数据集。
- 包含和不包含用户侧太阳能的月度版本。
- 每个来源的数据集,以便可以单独检查每个提供商的视野,以及合并的每个提供商视野,结合提供商的年度和月度数据。
- 一个单独的储能数据集。
每个数据集列出可用的年份和能源类型,并为每个地区提供随时间变化的燃料发电,特定年份中最具体的燃料,每年选择的来源,以及推导的排放、电气化、排名和(如适用)组中的成员国家。
数据修订
我们为给定月份发布的数字在首次发布时并不是最终的。网站上的图表始终显示最新数据,因此一个数字在首次出现后可能会发生变化——并且旧的月度报告中的图表可能与发布该报告时所写的文字不再匹配。
月度值变化有多个原因:
- 后续月份会重新分配之前的月份。 对于某些国家,一个粗略的总量(一个季度或一年)被分配到其各个月份。当新的月份到来时,该总量被重新分摊,因此同一期间较早月份的值会发生变化,尽管没有提供商修正它们。年初至今的总量通常保持不变,而月份之间的分配发生变化。
- 选择的来源或基础可以变化。 随着更多数据的可用,我们可能会为某个地区和月份切换到更完整或更详细的提供商,这可能会移动基线。在那月份的总量包括用户侧(屋顶)太阳能中与否,也可能随着该估计的确立而发生变化,从而改变对比。
- 提供商修正了他们自己的数据。 上游来源常常重新声明最近的月份,因为经过审计的数字取代了临时的数字。
因此,当一个报告的图表依赖于报告期间后的月份的数据时,我们显示一个通知,表示自发布以来数字可能修改过,并链接回此页面。原始书面评论保持不变,作为当时已知内容的记录。
总结
- 从大约十五个提供商下载原始电力数据。
- 将所有数据转换为一个共同单位(TWh),并将每个提供商的燃料标签和国家名称转换为一个共享定义。
- 持续交叉核对,确保燃料总和等于其汇总值,国家总和等于全球总量,遇到无法调和的问题就停止。
- 针对每个国家和每个时期,选择最可靠和最详细的来源,该来源必须有完整的数字——记录每个数字来自哪里——并从其他来源补充缺失的细节。
- 分别调和净进口,并将其纳入总量。
- 添加用户侧太阳能处理、排放、电气化、区域组、排名和储能。
- 以JSON和CSV形式发布结合了所有来源的和每个来源的数据集。
