论文控制变量的选取原则(控制变量选择的计量经济学理论依据是什么)

2023-03-28 12:07:00 来源 : haohaofanwen.com 投稿人 : admin

下面是好好范文网小编收集整理的论文控制变量的选取原则(控制变量选择的计量经济学理论依据是什么),仅供参考,欢迎大家阅读!

论文控制变量的选取原则

1. 引言

大量的实证会计研究试图建立治疗 (X) 与结果 (Y) 的因果关系。但是,使用非实验数据面临的一个重要问题是,如何排除变量间的其他替代性解释。为此,研究者通常会使用控制变量 (Z) 来控制 (X) 和 (Y) 之间的混淆因素。若是忽略某个混淆因素,则可能产生遗漏变量偏误问题 (omitted variable bias, OVB),这在会计研究中是常见的。为缓解遗漏变量偏误问题,研究者会将较多控制变量纳入到回归模型中,Bertomeu (2016) 称之为 “kitchen sink approach”,直译为 “厨房水槽法”,即厨房所有东西都可以放到里面。当然之所以如此,很大程度上是由于 “更多的控制变量能够提高模型识别准确度” 的观念导致。实际上,当我们引入一些控制变量的时候,往往会引入 “控制变量偏差”,进而隔离或打开 (X) 和 (Y) 之间不必要的路径。即使是一个 “好” 的控制变量,也必须经过准确度量才能够有效缓解遗漏变量偏误。

在本文中,我们将提供一些使用控制变量的建议,以更好识别因果效应。首先,我们回顾了会计顶刊中控制变量的应用。然后,使用因果图来说明变量间的期望关系,以试图说明一个控制变量在何种条件下是合适的,或者不合适的。统计软件并不会清晰的告诉我们到底是 (X) 导致了 (Y),还是 (Y) 导致了 (X) ,抑或是 (Z) 混淆了上述关系。相反,理论会告诉我们潜在的因果关系方向,以及对统计的解释。同样地, (Z) 与 (Y) 或者 (X) 存在相关性,也并不意味着将 (Z) 纳入到回归模型中可以改善因果效应的准确识别。在研究 (X) 对 (Y) 的因果效应时,研究者应该将与 (X) 和 (Y) 相关的因素且不是二者的结果因素 (Z) 放入到回归模型中。若是将受 (X) 和 (Y) 影响的因素 放入到模型中,则会有偏估计 (X) 对 (Y) 的影响。为了更好地对上述问题理解,本文使用模拟数据「注册会计师资格执照」和档案数据「审计客户特征」进行演示。

接着,我们讨论了几个提高控制变量选择与测量的问题。首先,我们讨论了控制变量为什么需要准确地构造才能有效。其次,我们解释了引入与某个与 (X) 或 (Y) 相关的变量也是有帮助的,尽管其不是真正的混淆变量。再其次,我们讨论了固定效应在不同条件下的结果。固定效应可以理解为虚拟控制变量,主要用于识别数据组内变化。最后,我们讨论了在 (X) 与一个调节变量 (I) 交互的情况下,控制变量的重要性。在这种情况下,调节变量 (I) 与某个控制变量的交互可能会与感兴趣的交互项相关,如果排除在模型之外,则会导致遗漏变量偏误。

2. 控制变量的重要性

2.1 遗漏变量偏误与因果图

考虑以下模型:

Y_{i}=beta_{0}+beta_{1} X_{i}+varepsilon_{i} \

如果上述模型遗漏了同时影响 X 和 Y 的因素 (operatorname{cov}(X, varepsilon) neq 0), 则 X 对 Y 的估计系数 hat{beta}_{1} 是有偏 的。此时, 研究者可以将同时影响 X 和 Y 的因素 Z 纳入到模型中, 以缓解遗漏变量偏误问题。在 会计研究中, 大多数处理都是非随机或自我选择的, 研究者必须准确地识别 Z 来无偏估计 X 对 Y 的因果效应。 为了准确的构建因果模型,研究者应在因果关系图背景下考虑他们的研究问题。因果图既可以帮助 研究者识别遗漏变量偏误的来源和设定正确的模型,也可以帮助读者理清研究者设计模型时所考虑 的因果关系。例如 Figure 1, A 导致 B, B 导致 C, C 导致 D 和 E, D 导致 E_{circ} 如果我们对 D 对 E 的影响感兴趣, 则 C 是一个混淆因素。如果我们对 C 对 E 的影响感兴趣, 则 D 间接影响了 C 与 E 的关系。因果关系驱动模型设计,而回归并不能告诉我们 mathrm{C} 导致了 mathrm{E}, 还是 mathrm{E} 导致了 C。回归仅仅是简单估计系数, 只有理论才能告诉我们因果关系, 这也直接决定了回归模型的结构和系数解读。

2.2 识别好和坏的控制变量

在因果关系图背景下,好的 Z 代表着 X 与 Y 之间关系的另一种解释。其捕获的是导致 X 与 Y 方差共同变化的因素。如果模型中忽略了混淆因素 Z ,则 X 对 Y 的因果效应是有偏的。反之,模型中包括 (1) X 或 Y 的结果,(2) 捕获与 X 或 Y 相同构造,(3) 机械地与 X 或 Y 相关等变量,则会削落因果解释。Angrist 和 Pischke (2009) 提出的一个经验法则是,好的控制是那些在我们感兴趣的 X 决定时,就已经固定的变量,坏的控制是我们实验中的结果变量。

在会计研究中,学者较少使用因果图去筛选控制变量,取而代之的是 (1) 依赖前人的文献和 (2) “厨房水槽法”,即在模型中包括尽可能多的控制变量。其中,方法 (1) 通常会从与自己研究的 Y 相同或相似,而与自己研究的 X 不同的文献中寻找控制变量。不过,即使前人文献中的模型设定正确,方法 (1) 正确的前提也是与文献中的 X 和 Y 保持相同。

与之类似,会计研究者经常在预测 Y 背景下讨论控制变量,诚然这是一个有用的因素,但在大多数情况下忽视了控制变量与 X 的关系。实际上,Y=... 这种形式也在一定程度强化了对 Y 预测的认知。在上述因素作用下,我们倾向于通过 R^2 或 ROC 下的面积来判断模型好坏,并以此筛选变量。但是,这种做法存在以下两个错误:

详细内容参见连享会推文

Note:产生如下推文列表的 Stata 命令为:

. lianxh 控制变量

. songbl 控制变量

安装最新版 lianxh/ songbl命令:

. ssc install lianxh, replace

. ssc install songbl, replace

专题:其它

锚定情境法(一):有效控制变量自评偏差


相关文章

专题分类