有效规避旷工违章行为的激励机制选择
来源: 发布日期:2022-08-16 点击量:
杨雪/文
摘要:以河南省某煤矿现行激励机制为基础,构建“煤 矿决策者采用不同激励机制——矿工违章行为”博弈模 型,研究发现,传统静态激励机制不能总是满足博弈双方 期望利益最大化,不同条件下动态激励机制能更好地实现 煤矿安全生产成本与矿工违章概率的最小化。最后本文 提出减少矿工违章概率、降低煤矿生产成本的对策。
关键词:矿工 违章行为 激励机制 进化博弈
(一)引言
误所引起的事故达到事故总数的 80%以上(薛韦一、刘 泽功,2013)。与发达国家相比,我国煤矿安全形势依然严 峻。矿工违章行为是安全事故的导火索,而煤矿决策者所 采用的激励机制对矿工行为选择具有重要影响。
盖丽丽(2016)通过博弈分析发现煤矿企业应制定具 有延续累积特征的激励约束机制。杨利峰和陈红(2015) 就煤矿企业委托代理激励机制失衡问题进行了探究。曹庆 仁等(2011)实证研究了安全工作风险、安全工作绩效和政 府奖惩之间的关系。刘永亮等(2013)建立煤矿安全管理 与矿工违章博弈模型,提出影响博弈结果的主要因素。而 国内目前关于不同激励机制与矿工违章行为关系的研究较 少,且已有文献就激励机制如何影响煤矿企业安全管理与 矿工违章行为没有详细展开。本文采用进化博弈方法在煤 矿监管者与矿工博弈分析基础上,加入不同激励机制约束 的影响因素,为煤矿企业管理者重视通过不同激励机制对 矿工实施安全监管,进而提高安全管理水平提供参考。
(二)不同激励机制与矿工违章行为博弈分析
博弈分析主要涉及的对象有矿工所在煤矿、班组、矿 工自身等,为便于分析,将其分为两类:煤矿决策者和 矿工。
1.不同激励机制与矿工违章行为博弈模型
模型主要分析煤矿决策者采用不同激励机制与矿工 违章行为之间的关系,包括煤矿企业安全生产成本以及矿 工违章概率的大小。模型所采用激励机制的假设是基于 平顶山市某煤矿现行激励办法所得。
(1)模型基本构成
局中人:矿工与煤矿决策者。
策略:矿工可选择的策略空间假设为 X1=(违章,不违 章);煤矿决策者可选择的策略空间假设为 X2=(正向激励 机制,负向激励机制)。
支付:假设矿工在(不违章,负向激励机制)、(不违章, 正向激励机制)、(违章,负向激励机制)、(违章,正向激励 机制)这4种组合策略下收益分别为:PM1、PM2、PM3、PM4;煤矿决策者在上述策略组合下收益分别为 PS1、PS2、PS3、 PS4,各参数所代表收益值将在随后的计算中求得。
(2)模型构建
假设1:矿工与煤矿决策者均为有限理性人,他们所选策略相对于其他策略来说是收益最高的。
假设2:煤矿决策者采用负向激励机制时,矿工如没有 发生违章行为,则获得正常收益;矿工若发生违章行为,则 给予一定惩罚。
假设3:煤矿决策者采用正向激励机制时,矿工如在当 月没有发生违章行为,则获得本月正常收益及本月安全奖 励金。矿工如在当月发生违章行为,则不可获得本月安全 奖励金,同时扣除部分安全风险保证金。
如表 1 所示:R1 代表矿工安全作业收益值;R2 代表矿工 安全作业情况下煤矿企业收益值;C1 代表矿工缴纳的安全 风险保证金(C1/12 代表矿工当月没有发生违章行为时,煤 矿企业对矿工的安全奖励);t 代表矿工连续安全作业时 间;R3 代表矿工违章时所获收益值(R3>R1);C2 代表煤矿决 策者采用负向激励机制时对矿工违章的惩罚值;h 代表因 矿工违章造成的煤矿企业损失值;m 代表煤矿决策者采用 正向激励机制时针对矿工违章而扣掉的部分安全风险保 证金(m<C1)。
由表1可计算出各策略组合收益值分别为:
根据谢识予(2015)的研究,可以把P和g看成是时间t 的函数,则矿工违章行为可以用复制动态方程来表示。基 于表1博弈收益矩阵可以算出:
矿工不违章的期望收益:
矿工违章的期望收益:
矿工不违章和违章的平均收益:
在既定行为策略中,某一个策略期望收益越大,则煤 矿决策者以及矿工倾向于这种策略的概率就越大。因此, 矿工博弈方类型比例的进化模型为:
同理,煤矿决策者博弈方类型比例的复制动态方程:
首先对矿工博弈群体的复制动态方程分析可知:
当时,对所有的P 都是稳定状态;
当时,P*=0和P*=1是P 的两个稳定状态,其中P*=1是进化稳定策略;
当时,P*=0和P*=1是P 的两个稳定状态,其中P*=0是进化稳定策略。
同样地,对于煤矿决策者:
当时,对应的所有g 均是稳定状态;
当时,g*=0与g*=1是两个稳定状态,但g*=1是进化稳定策略;
当时,g*=0与g*=1是g 的两个稳定状态,g*=0是进化稳定策略。
进一步地,把上述两个群体类型比例变化复制动态关系用一个坐标平面(如图1)表示。
2. 结果分析
由图 1 可知,煤矿决策者采用不同激励机制与矿工违 章博弈过程是不断循环、进化的。因上述参数表达式中各 参数均可由统计分析或者实际经验给出,故此博弈的初始 情况可能落在 A、B、C、D 区域中的一个。以初始情况落在 A 区域为例,最终会收敛到 P*=0,g* =1,即矿工在负向激励 条件下采取违章行为,此时的策略组合极不稳定,矿工会 主动避免违章行为以减少自身损失,从而使 A 区域的策略 组合落入到 C 区域;C 区域最终收敛到 P*=g*=0,即矿工在 正向激励条件下采取违章行为,但此策略组合也不稳定, 此时因违章所扣除的部分安全风险保证金以及每月返还 的安全奖励的缘故,采用“违章”策略的矿工收益要明显小 于“不违章”策略,矿工群体会在不断地相互学习中调整策 略,故违章矿工会逐步采用“不违章”策略。此时,策略组 合由 C 区域转向 D 区域,最终收敛到 P*=1,g* =0,即矿工在 正向激励下采取不违章策略,但此状态也不完全稳定,煤 矿决策者采用正向激励机制旨在以“大奖励与小惩罚”的 方式来实现矿工安全生产的目的,但当矿工采用“不违章” 策略时,随着矿工连续安全作业时间的增加,煤矿企业所 需付出的成本也在增加,致使企业利润降低,理性的煤矿 决策者会逐渐调整自己的策略,使策略组合由 D 区域转向 B 区域,最终收敛到 P*=g*=1,即矿工在负向激励条件下采 取不违章行为;由于矿工在负向激励机制下没有相应的安 全奖励,且当违章作业收益值大于安全作业时,部分矿工
可能冒险采用“违章”策略,由于群体的相互学习效应,策略组合由区域 B 转向区域 A,并最终收敛到 P =0,g =1。此时,策略组合又回到原始出发点,如此循环前述过程。
(三)结论及对策
(2)从降低矿工违章概率促进安全生产角度分析,区 域 B 和区域 D 中策略组合最终收敛到 P*=1,即矿工都采用“ 不违章 ”策 略。所以应尽可能减小
,
使初始情况落在 B 和 D 区域的概率增大。对上述表达式进行化简得到:,即应适量增加安全风险保证金额度、减少矿 工因违章而被扣掉的安全风险保证金额度、增加对矿工违 章的惩罚值,从而加大初始情况落入 B 和 D 区域的概率, 矿工群体违章的期望收益小于群体的平均收益,矿工群体 通过相互学习,其行为策略倾向于“不违章”,此时矿工不 违章行为具有进化稳定性。
(3)从降低煤矿生产运营成本角度分析,区域 B 中的 策略组合最终收敛到 g*=1,即煤矿决策者采用“负向激励 机制”。应尽可能减小,使初始情况落在 B 区域的概率增大。对上述表达式进 行化简得到:,即应通过完 善井下基础设施建设来减少甚至消除矿工因违章所获得 的额外收益值、增加矿工安全作业收益值、提高矿工违章 行为的惩罚值、适度降低因矿工违章而扣除的安全风险保 证金数额、识别矿工安全风险类型并引导高安全风险类型 矿工合理选择安全风险保证金方案。
综上所述,煤矿企业所采用的激励机制与矿工违章行 为的博弈是动态变化的,而现实中多数企业的激励机制却 是静态的,这不但不能满足博弈双方期望收益最大化原 则,同时也难以实现企业激励机制实施的预期效果。煤矿 企业只有结合自身实际情况,完善矿工安全生产的监督与 考核机制、加大矿工违章惩罚力度、引导矿工理性选择适 合自身安全风险类型的安全风险保证金方案,才能实现降 低矿工违章概率、降低煤矿生产成本和提高煤矿生产效益 的目标。
参考文献(1)曹庆仁、曹明、李爽、宋学锋:《双重委托代理关系下煤矿安 全管理者激励模式》,《系统管理学报》,2011 年第 1 期。
(2)盖丽丽:《基于动态博弈的矿工不安全行为研究》,《煤矿安 全》,2016 年第 9 期。
(3)刘永亮、张建国、王华东:《煤矿安全管理与矿工违章行为进 化博弈分析》,《煤炭工程》,2013 年第 1 期。
(4)谢识予:《经济博弈论:第三版》,复旦大学出版社,2015 年。
(5)薛韦一、刘泽功:《基于 ISM 法的矿工安全心理影响因素分 析》,《中国安全生产科学技术》,2013 年第 12 期。
(6)杨利峰、陈红:《两阶段双任务委托代理情形下煤矿安全管 理激励机制》,《数学的实践与认识》,2015 年第 11 期。
- 上一篇:当前我国开发区的特征与发展趋势
- 下一篇:暂无下一篇