1. RD设计适用于准实验情境,与在自然随机实验中直接添加虚拟变量并用OLS估计的模型有别。
2. RD估计方法通常采用局部线性回归,即在一定带宽内选择样本进行估计,旨在对断点附近的局部处理效应(LATE)进行估计。
3. 最优带宽的选择由Imbens和Kalyanaraman在2009年提供,并且通常需要展示不同带宽下的结果以展示估计的稳健性。有时,RD还使用非参数的核回归方法。
4. RD分析需检验内生排序问题,即假设个体能够预知分组规则并通过自身努力完全控制分组变量,以避免导致断点回归失效。
5. 在RD分析中加入协变量时,还需检验这些协变量在断点处的条件密度是否连续,确保断点处的跳跃不是由协变量的跳跃引起的。
6. 上述内容主要讨论的是Sharp RD。Fuzzy RD则使用大于断点的dummy(Z)作为处理变量(D)的工具变量。Z与D相关,但在断点附近相当于局部随机实验,因此D仅通过Z影响因变量y,并且与误差项不相关,满足外生性假设。可以使用Z作为D的工具变量,并采用两阶段最小二乘法(2SLS)进行估计。
下载本文