关键词:供应链;;建模仿真;;刺激反应理论;;粒子群算法;;Q学习算法
摘 要:随着消费者个性化需求的出现,家用汽车制造商推出多种车型以满足市场需求。汽车制造商开始考虑如何协调与管理多种车型的发展前景,研究汽车制造商在动态市场环境下多车型的经营策略具有重大意义。本文通过建立多车型制造商的供应链多Agent仿真模型,以制造商利润最大化为目标,采用不同学习机制对所建立的模型进行训练,得出制造商多种车型经营策略的理论依据。(1)概念模型的建立。通过问卷调查和实地考察了解某汽车供应链的现状,根据家用汽车供应链推拉结合的特点,提出供应链建模的思路,设置常量与决策变量,分析消费者、分销商、制造商和供应商的业务流程,并绘制消费者、分销商、制造商和供应商的行为流程图。以此建立以多车型制造商为核心的四阶推拉结合型家用汽车供应链的概念模型。(2)家用汽车供应链仿真模型的建立。采用ABM与DES相结合的混合方法,在Anylogic平台下建立家用汽车供应链仿真模型。采用状态图描述消费者Agent的购车流程;利用DES描述分销商Agent、制造商Agent和供应商Agent的运输过程、制造商Agent的生产过程、分销商Agent以及制造商Agent的资金核算行为;利用Java函数描述分销商Agent、制造商Agent和供应商Agent的行为变化及参数调整;建立信息Agent描述各Agent之间的信息交互行为。以此建立多个供应商、多个车型的制造商、多个分销商和多个消费者构成的家用汽车供应链的仿真模型。(3)仿真模型的验证。用某家用汽车制造商的实际数据对模型进行验证。通过分析分销商Agent和制造商Agent的总销量和总利润的均值、极差以及标准差系数的关系,验证模型的稳定性;通过分析分销商Agent和制造商Agent的主要参数的变化,验证模型行为规则的合理性;通过分析分销商、制造商和供应商销量的关系是否符合牛鞭效应,验证模型经济规则的合理性;通过对比模型中制造商的销量与实际销量的差异性,验证模型的可行性。(4)仿真模型的训练。从不同角度赋予汽车制造商Agent学习能力,以价格和广告投入作为决策变量,以制造商利润最大化为目标,以仿真模型为基础进行编程并仿真,分析不同的学习机制对汽车制造商销量和利润的影响。在刺激—反应学习机制中,通过销量和利润的变化来刺激制造商调整价格和广告投入。在粒子群学习机制中,赋予制造商自学和他学能力,求解在不同学习参数下制造商各车型的最佳经营策略。在Q学习机制中,求解从初始状态到最佳状态的最短路径。对比3种学习机制发现,Q学习机制的学习效果更好,对企业的总利润的贡献更大,更适合作为企业间调整经营策略的依据。
内 容:原文可通过湖北省科技信息共享服务平台(http://www.hbstl.org.cn)获取