铛铛!小秘籍来咯!
小秘籍团队独辟蹊径,以ARIMA时序预测,目标规划等强大工具,构建了解决复杂问题的独特方案。比例分配,负载均衡的妙用,为降低非法野生动物贸易提供新视角。通过综合分析,描绘出概率、成功与关键因素之间的精妙关系,为客户量身打造创新解决方案。小秘籍团队,始终引领着建模问题求解的风潮。 抓紧小秘籍,我们出发吧~
抓紧小秘籍,我们出发吧~
完整内容可以在文章末尾领取!
第一个问题是建立货量预测模型,对57个分拣中心未来30天每天及每小时的货量进行预测。
假设每个分拣中心的货量预测值为,其中表示分拣中心的编号,表示日期,表示小时。根据题目描述,我们可以得到如下公式:
其中,表示分拣中心在天的货量,表示分拣中心的物流网络配置信息,表示日期的特征信息。
在这个模型中,我们使用历史货量、物流网络配置信息和日期特征信息来预测未来的货量。历史货量可以反映出分拣中心的日常运作情况,物流网络配置信息可以反映出分拣中心之间的运输线路关系,日期特征信息可以反映出节假日等因素对货量的影响。
具体的预测方法可以使用多种机器学习算法,如线性回归、决策树、随机森林等。我们可以使用历史数据来训练模型,并通过交叉验证等方法来选择最优的算法和参数。
对于每小时的货量预测,可以将时间粒度缩小,使用同样的方法来预测每个分拣中心每小时的货量。
最终的预测结果可以写入结果表1和表2中。
对于每天的货量预测,可以使用ARIMA(Autoregressive Integrated Moving Average)模型。ARIMA模型是一种基于时间序列的统计模型,可以将时间序列数据转换为平稳序列,并通过自相关和偏相关函数的分析,确定最佳的自回归和移动平均参数。假设时间序列为,其中表示时间,ARIMA模型可以表示为:
其中,为延迟算子,和为自回归和移动平均算子,为差分阶数,为白噪声。通过对历史货量数据进行差分,将非平稳序列转换为平稳序列,然后根据自相关和偏相关函数的图像,确定最佳的模型参数,从而进行未来每天的货量预测。
其次,对于每小时的货量预测,可以使用ARIMAX(Autoregressive Integrated Moving Average with Exogenous Variables)模型。ARIMAX模型在ARIMA模型的基础上,增加了外部变量的影响,因此可以更准确地预测货量。假设外部变量为,ARIMAX模型可以表示为:
其中,为外部变量的影响项。通过对历史每小时货量数据进行差分,然后根据自相关和偏相关函数的图像,确定最佳的模型参数,从而进行未来每小时的货量预测。
需要注意的是,对于分拣中心数量较多的情况,建议将分拣中心按照地理位置或其他相关特征分组,分别建立模型进行预测,可以提高预测的准确性。
在模型建立完成后,可以利用历史数据进行模型参数的优化,比如通过交叉验证等方法确定模型的最佳参数,从而提高预测的准确性。最后,根据预测结果,可以制定相应的调度和调配计划,合理安排分拣中心的货量和人员,从而提高物流网络的运作效率和降低成本。
解:
我们可以根据历史货量数据,构建一个时间序列模型来预测未来的货量。首先,对于每个分拣中心,我们可以将过去的每天货量数据进行平滑处理,得到一个近似的每日货量趋势。具体来说,我们可以使用移动平均法来平滑数据,即计算过去k天的平均货量作为当天的预测值。这样,我们就可以得到每个分拣中心过去4个月的每天平滑后的货量数据。
假设第个分拣中心过去4个月的每天平滑后的货量数据为。其中,表示时间,表示过去4个月的第一天,表示过去4个月的最后一天。我们可以使用指数平滑法来拟合这个平滑后的货量数据,得到一个近似的每日货量趋势函数。具体来说,我们可以使用一阶指数平滑法,即:
其中,称为平滑系数,它控制着过去数据对预测结果的影响程度。的取值范围为,一般来说,越大,过去数据对预测结果的影响越大。根据经验,我们可以取。这样,我们就可以得到每个分拣中心的每日货量趋势函数。
接下来,我们可以使用指数平滑法来预测未来的货量。具体来说,我们可以使用一阶指数平滑法来预测未来的每日货量,即:
其中,表示第个分拣中心未来30天每天的货量预测值。
为了更准确地预测每小时的货量,我们可以根据过去30天的每小时货量数据,计算出每小时的平均货量,并使用指数平滑法来预测未来的每小时货量。具体来说,我们可以使用一阶指数平滑法来预测未来的每小时货量,即:
其中,表示第个分拣中心未来30天每小时的货量预测值,表示小时,表示过去30天的第一个小时,表示过去30天的最后一个小时。
综上所述,我们可以使用指数平滑法来预测未来的货量,具体步骤如下:
-
对每个分拣中心的过去4个月每天货量数据进行平滑处理,得到近似的每日货量趋势函数。
-
使用一阶指数平滑法来预测未来的每日货量,即:
- 根据过去30天的每小时货量数据,计算出每小时的平均货量,并使用一阶指数平滑法来预测未来的每小时货量,即:
最终,我们得到了57个分拣中心未来30天每天及每小时的货量预测值。这些预测值可以写入结果表1和表2中。
代码如下:
import pandas as pd
from sklearn.linear_model import LinearRegression
#读取附件1和附件2的数据
df_daily = pd.read_excel('附件1.xlsx')
df_hourly = pd.read_excel('附件2.xlsx')
#将数据按分拣中心分组
group_daily = df_daily.groupby('分拣中心').sum()
group_hourly = df_hourly.groupby('分拣中心').sum()
#对每个分拣中心建立线性回归模型
model_daily = LinearRegression()
model_hourly = LinearRegression()
#用过去4个月的每日货量作为自变量,建立每天货量的模型
model_daily.fit(group_daily['过去4个月每日货量'].values.reshape(-1,1), group_daily['未来30天每天货量'].values.reshape(-1,1))
#用过去30天的每小时货量作为自变量,建立每小时货量的模型
model_hourly.fit(group_hourly['过去30天每小时货量'].values.reshape(-1,1), group_hourly['未来30天每小时货量'].values.reshape(-1,1))
#预测未来30天每天的货量
daily_pred = model_daily.predict(group_daily['过去4个月每日货量'].values.reshape(-1,1))
#将预测结果写入结果表1
group_daily['预测未来30天每天货量'] = daily_pred
#预测未来30天每小时的货量
hourly_pred = model_hourly.predict(group_hourly['过去30天每小时货量'].values.reshape(-1,1))
#将预测结果写入结果表2
group_hourly['预测未来30天每小时货量'] = hourly_pred
#将结果保存为excel文件
group_daily.to_excel('结果表1.xlsx')
group_hourly.to_excel('结果表2.xlsx')
第二个问题是基于过去90天各分拣中心之间的运输线路平均货量以及未来30天分拣中心之间运输线路的变化情况,对57个分拣中心未来30天每天及每小时的货量进行预测,并将预测结果写入结果表3和表4中。
设为分拣中心i在t时刻的货量,为分拣中心i到j的运输线路,为分拣中心i到j的货量占比,为分拣中心i在t时刻的小时货量,为分拣中心i到j的距离,为未来的时间段,可以按照线路的平均货量计算,即,则问题2可以建模为如下的优化问题:其中第一个约束保证每个分拣中心的每天货量等于每小时货量之和,第二个约束保证每个分拣中心的每天货量等于其到其他分拣中心的运输货量之和。该模型的目标函数为总的运输距离,即希望通过调整每个分拣中心的货量,使得总的运输距离最小。
第二个问题的目标是根据过去90天各分拣中心之间的运输线路平均货量以及未来30天分拣中心之间运输线路的变化情况,预测未来30天每天及每小时的货量。为了解决这个问题,可以采用时间序列预测的方法,即通过分析历史数据的趋势和周期性,来预测未来一段时间的数据。具体而言,可以采用ARIMA模型(自回归移动平均模型)来进行预测。
ARIMA模型是一种常用的时间序列分析方法,它能够很好地处理非平稳的时间序列数据。ARIMA模型的核心思想是通过对时间序列数据进行差分运算,使其变成平稳的数据,然后再建立自回归模型和移动平均模型,来拟合时间序列数据的趋势和周期性。ARIMA模型的参数包括自回归阶数p、差分阶数d和移动平均阶数q,通过对这些参数的选择和拟合,可以得到最优的ARIMA模型来进行预测。
在本问题中,可以将每个分拣中心的每天货量作为一个时间序列数据,对其进行差分运算,获取平稳的数据。然后,根据过去90天各分拣中心之间的运输线路平均货量以及未来30天分拣中心之间运输线路的变化情况,来选择ARIMA模型的参数。最后,使用拟合好的ARIMA模型来预测未来30天每个分拣中心的每天及每小时货量,将预测结果写入结果表3和表4中。
在选择ARIMA模型参数的过程中,可以使用一些常用的方法,比如自相关函数(ACF)和偏自相关函数(PACF)来辅助选择p和q的值。同时,可以通过一些评价指标来评估模型的拟合效果,比如均方根误差(RMSE)和平均绝对误差(MAE),以此来选择最优的模型。
总的来说,通过建立ARIMA模型,可以很好地解决第二个问题,预测未来30天每天及每小时的货量,并将预测结果写入结果表3和表4中。同时,通过选择合适的模型参数和评价指标,可以提高预测的准确性和稳定性。
问题2:建立货量预测模型,对57个分拣中心未来30天每天及每小时的货量进行预测,将预测结果写入结果表3和表4中。
解决方案:
根据问题描述,问题2可以分为两部分:一是预测57个分拣中心未来30天每天的货量,二是预测57个分拣中心未来30天每小时的货量。以下分别介绍两部分的解决方案。
- 预测57个分拣中心未来30天每天的货量
首先,根据过去90天各分拣中心之间的运输线路平均货量,可以得到每个分拣中心之间的平均每天货量,记为,其中为起点分拣中心,为终点分拣中心。然后,根据未来30天分拣中心之间运输线路的变化情况,可以得到每个分拣中心之间的每天运输货量的变化情况,记为。因此,未来30天每天每个分拣中心的总货量可以表示为:
其中,表示第个分拣中心未来30天每天的总货量。将该公式应用到每个分拣中心,就可以得到57个分拣中心未来30天每天的货量预测结果,即结果表3中的数据。
- 预测57个分拣中心未来30天每小时的货量
根据过去30天每小时的货量数据,可以得到每个分拣中心过去30天每小时的平均货量,记为,其中为分拣中心。然后,根据未来30天每小时的货量变化情况,可以得到每个分拣中心未来30天每小时的总货量变化情况,记为。因此,未来30天每小时每个分拣中心的总货量可以表示为:
其中,表示第个分拣中心未来30天每小时的总货量。将该公式应用到每个分拣中心,就可以得到57个分拣中心未来30天每小时的货量预测结果,即结果表4中的数据。
综上所述,根据过去90天各分拣中心之间的运输线路平均货量以及未来30天分拣中心之间运输线路的变化情况,可以得到57个分拣中心未来30天每天及每小时的货量预测结果,并将其分别写入结果表3和表4中。
# 导入所需的包
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 读取附件1-4的数据
df1 = pd.read_excel('附件1.xlsx')
df2 = pd.read_excel('附件2.xlsx')
df3 = pd.read_excel('附件3.xlsx')
df4 = pd.read_excel('附件4.xlsx')
# 合并附件1和附件2的数据,即过去4个月和过去30天的货量数据
df = pd.concat([df1, df2], axis=1)
# 对每个分拣中心进行预测
for center in df.columns:
# 构建训练集和测试集
X = df[center].dropna().index.values.reshape(-1, 1)
y = df[center].dropna().values.reshape(-1, 1)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1)
# 训练线性回归模型
lr = LinearRegression()
lr.fit(X_train, y_train)
# 预测未来30天每天的货量
future_days = np.arange(len(df1[center]), len(df[center])+30).reshape(-1, 1)
y_pred = lr.predict(future_days)
# 将预测结果写入结果表1和表2中
df.loc[len(df1)+30:, center] = y_pred.reshape(-1)
# 对分拣中心之间的运输线路进行预测
# 创建一个空的DataFrame用于存放预测结果
df_result = pd.DataFrame(columns=['start_center', 'end_center', 'avg_load'])
# 遍历附件3中的运输线路
for index, row in df3.iterrows():
# 获取起始分拣中心和结束分拣中心的名称
start_center = row['start']
end_center = row['end']
# 获取过去90天该运输线路的平均货量
avg_load = row['avg_load']
# 获取未来30天该运输线路的变化情况
change = df4.loc[df4['start'] == start_center, end_center].values[0]
# 根据变化情况对平均货量进行调整
if change < 0:
# 若变化为负数,表示该运输线路货量下降,对平均货量进行降低
avg_load = avg_load * (1 + change)
else:
# 若变化为正数,表示该运输线路货量上升,对平均货量进行增加
avg_load = avg_load * (1 + change)
# 将预测结果写入结果表3中
df_result.loc[len(df_result)] = [start_center, end_center, avg_load]
# 根据预测结果计算各分拣中心未来30天每小时的货量
# 创建一个空的DataFrame用于存放预测结果
df_hour = pd.DataFrame(columns=list(range(24)))
# 遍历附件1中的分拣中心
for center in df1.columns:
# 获取该分拣中心在附件3中的运输线路
df_temp = df_result[df_result['end_center'] == center]
# 根据运输线路计算每个小时的货量
for hour in range(24):
load = 0
for index, row in df_temp.iterrows():
# 获取起始分拣中心和该分拣中心的运输线路
start_center = row['start_center']
load_avg = row['avg_load']
# 根据每小时的货量变化情况对平均货量进行调整
change = df4.loc[df4['start'] == start_center, center].values[0]
if change < 0:
load_avg = load_avg * (1 + change)
else:
load_avg = load_avg * (1 + change)
# 计算每个小时的货量
load += load_avg / 24
# 将预测结果写入结果表4中
df_hour.loc[center, hour] = load
# 将预测结果写入结果表3和表4中
df_result.to_excel('结果表3.xlsx', index=False)
df_hour.to_excel('结果表4.xlsx')
# 以下为平均货量的可视化展示
plt.figure(figsize=(10, 8))
sns.barplot(x='start_center', y='avg_load', data=df_result)
plt.xticks(rotation=45)
plt.xlabel('Start Center')
plt.ylabel('Avg Load')
plt.title('Avg Load for Each Start Center')
plt.show()
# 以下为每个分拣中心每小时的货量可视化展示
plt.figure(figsize=(10, 8))
sns.lineplot(data=df_hour.T)
plt.xlabel('Hour')
plt.ylabel('Load')
plt.title('Load for Each Hour')
plt.legend(bbox_to_anchor=(1.02, 1), loc=2, borderaxespad=0)
plt.show()
问题3:根据附件1-4,请基于问题2的预测结果建立模型,给出未来30天每个分拣中心每个班次的出勤人数,并写入结果表5中。要求在每天的货量处理完成的基础上,安排的人天数(例如30天每天出勤200名员工,则总人天数为6000)尽可能少,且每天的实际小时人效尽量均衡。
设每个分拣中心的货量预测为,每个分拣中心共有个班次,每个班次需要安排的总人数为,每个班次使用的正式工人数为,使用的临时工人数为。
首先,根据每个分拣中心的货量预测,可以得到每个分拣中心每天的总货量,则每个班次需要处理的平均货量为。
其次,根据问题2的假设,每个分拣中心的正式工最高小时人效为25包裹/小时,临时工最高小时人效为20包裹/小时。则每个班次需要的工作时间为小时。
因此,每个班次需要安排的总人数可表示为:
通过上述公式,可以得到每个班次需要安排的总人数,从而可以得到每个班次需要的正式工人数和临时工人数,即和。
为了达到每天安排的人天数尽可能少的目标,可以设置一个变量,表示每天需要安排的总人数。则可以表示为:
为了使每天的实际小时人效尽量均衡,可以设置一个变量,表示每天的实际小时人效。则可以表示为:
因此,问题3可以建模为以下数学模型:
其中,表示每天需要安排的总人数,表示每个分拣中心的班次数,表示每天的实际小时人效,表示每个分拣中心使用的正式工人数,表示每个分拣中心使用的临时工人数,表示每个分拣中心的货量预测。约束条件1保证每天安排的总人数不变,约束条件2保证每天的实际小时人效不变,约束条件3保证每个班次需要处理的货量相同,约束条件4保证每个班次需要的工作时间相同,约束条件5和6保证每个班次使用的正式工和临时工人数不超过总人数,约束条件7和8保证每个班次使用的正式工和临时工人数为非负整数。
首先,根据问题2的预测结果,我们可以得到每个分拣中心在未来30天每天每小时的货量情况。为了尽可能少的使用人力资源,我们可以采用动态规划的方法来确定每个分拣中心每个班次的出勤人数。
设第t天第i个分拣中心的第j个班次的最优人数为,则有以下递推关系式:
其中,表示第t天第i个分拣中心在第j个班次的最优人数,为第j个班次的人数指标,即正式工和临时工的人数上限。
根据上述递推关系式,我们可以得到每个分拣中心每个班次的最优人数。为了保证每天的实际小时人效尽量均衡,我们可以将每天的货量平均分配到各个班次,即每个班次的货量比例与人数比例相同。假设第t天第i个分拣中心的总货量为,则第j个班次的货量为:
为了保证每天的货量处理完成,我们还需要满足以下约束条件:
其中,6000为总人天数,为总货量。
根据以上条件,我们可以建立一个线性规划模型,求解出每个分拣中心每个班次的最优人数,从而实现在保证每天货量处理完成的基础上,尽可能少的使用人力资源,且每天的实际小时人效尽量均衡。
综上所述,我们可以通过动态规划和线性规划的方法,根据问题2的预测结果建立模型,给出未来30天每个分拣中心每个班次的出勤人数,并将结果写入结果表5中。
问题3:假设每个分拣中心有60名正式工,在人员安排时将优先使用正式工,若需额外人员将使用临时工。请基于问题2的预测结果建立模型,给出未来30天每个分拣中心每个班次的出勤人数,并写入结果表5中。
解:
首先,根据问题2的预测结果,得到每个分拣中心每天的货量及每小时的货量,其中表示第个分拣中心,表示第天,表示第小时。根据题目描述,每个分拣中心需要安排的人员包括正式工和临时工,设每个分拣中心的正式工人数为,临时工人数为,则每个分拣中心每天需要处理的货量为:
其中表示第个分拣中心第天每小时的人效,8表示每人每天出勤8个小时。
根据题目要求,每个分拣中心每天分为6个班次,分别为:00:00-08:00,05:00-13:00,08:00-16:00,12:00-20:00,14:00-22:00,16:00-24:00,每个人员(正式工或临时工)每天只能出勤一个班次。设每个分拣中心每个班次需要出勤的正式工人数为,需要出勤的临时工人数为,其中表示第个分拣中心,表示第个班次,满足如下条件:
即每个分拣中心每天需要安排的正式工人数不能超过正式工总数,临时工也类似。
为了保证每天的实际小时人效尽量均衡,可以设定一个最小的人效阈值,表示每个班次需要达到的最小人效水平,设为,则有:
为了保证每天的实际小时人效尽量均衡,可以设定一个最大的人效阈值,表示每个班次需要达到的最大人效水平,设为,则有:
为了使得每天的人员安排尽可能少,可以设定一个最小的人效差值,表示每个班次人效的差值不能超过该阈值,设为,则有:
为了使得人员安排尽可能少,可以设定一个最小的人员阈值,表示每个分拣中心每天至少需要安排的人员总数,设为,则有:
为了使得每天安排的人员尽可能少,可以设定一个最大的人员阈值,表示每个分拣中心每天至多需要安排的人员总数,设为,则有:
为了使得正式工的出勤率尽可能均衡,可以设定一个最小的出勤率阈值,表示每名正式工的出勤率不能低于该阈值,设为,则有:
为了保证每名正式工连续出勤天数不能超过7天,可以使用0-1变量表示第个分拣中心的第个班次是否在第天出勤,如果出勤则,否则,则有:
为了使得每天的实际小时人效尽量均衡,可以设定一个最小的时间差值,表示每个班次的时间差值不能超过该阈值,设为,则有:
为了计算每个班次的时间差值,可以使用0-1变量表示第个分拣中心的第个班次是否在第天出勤,如果出勤则,否则,则有:
其中表示第天,表示第天,即如果第天出勤,则第天也需要出勤,否则不需要。
综上所述,可以建立如下混合整数规划模型:
其中,表示第个分拣中心第天的货量,表示第个分拣中心第天每小时的人效,表示第个分拣中心的正式工人数,表示第个分拣中心的临时工人数,表示最小的人效阈值,表示最大的人效阈值,表示人效差值阈值,表示最小的人员阈值,表示最大的人员阈值,表示最小的出勤率阈值,表示最小的时间阈值,表示最大的时间阈值。模型的目标函数为最小化总人数,约束条件包括每个分拣中心每天需要处理的货量、人效的最小和最大阈值、人效差值阈值、每个分拣中心每天需要安排的人员总数的最小和最大阈值、正式工的出勤率、连续出勤天数不能超过7天、时间差值阈值、0-1变量的约束和正式工和临时工的取值范围。
通过求解该模型,可以得到每个分拣中心每天每个班次的出勤人数,从而得到未来30
# 导入必要的库
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
# 读取附件1-4的数据
df1 = pd.read_csv('附件1.csv')
df2 = pd.read_csv('附件2.csv')
df3 = pd.read_csv('附件3.csv')
df4 = pd.read_csv('附件4.csv')
# 将附件1-4的数据进行合并,方便后续处理
df = pd.concat([df1, df2, df3, df4], ignore_index=True)
# 根据分拣中心和时间进行分组,计算每个分拣中心每天及每小时的平均货量
df_mean = df.groupby(['分拣中心', '时间']).mean()
# 将平均货量作为新的特征,重命名为“平均货量”
df_mean = df_mean.rename(columns={'货量': '平均货量'})
# 将附件3中分拣中心之间的平均货量作为新的特征,重命名为“线路平均货量”
df_mean = df_mean.merge(df3, on='分拣中心')
# 构建线性回归模型,预测每个分拣中心每天的货量
X = df_mean[['线路平均货量', '分拣中心']]
y = df_mean['平均货量']
lr = LinearRegression()
lr.fit(X, y)
# 使用模型预测每个分拣中心未来30天每天的货量
pred = lr.predict(df_mean[['线路平均货量', '分拣中心']])
# 将预测结果写入结果表1中
df_mean['预测货量'] = pred
# 计算每个分拣中心未来30天每天的总货量
df_total = df_mean.groupby('分拣中心').sum()
# 根据每个分拣中心未来30天每天的总货量,计算每个分拣中心未来30天每天的每小时货量
df_total['每小时货量'] = df_total['预测货量'] / 24
# 将每个分拣中心未来30天每天的每小时货量写入结果表2中
df_result2 = pd.DataFrame({'分拣中心': df_total.index, '每小时货量': df_total['每小时货量']})
df_result2.to_csv('结果表2.csv', index=False)
# 构建线性回归模型,预测每个分拣中心每小时的货量
X = df_mean[['线路平均货量', '分拣中心']]
y = df_mean['平均货量']
lr = LinearRegression()
lr.fit(X, y)
# 使用模型预测每个分拣中心未来30天每小时的货量
pred = lr.predict(df_mean[['线路平均货量', '分拣中心']])
# 将预测结果写入结果表1中
df_mean['预测货量'] = pred
# 将预测结果写入结果表3和表4中
df_result3 = df_mean[['分拣中心', '时间', '预测货量']].rename(columns={'预测货量': '每天货量'})
df_result3.to_csv('结果表3.csv', index=False)
df_result4 = df_mean[['分拣中心', '时间', '预测货量']].rename(columns={'预测货量': '每小时货量'})
df_result4.to_csv('结果表4.csv', index=False)
# 根据预测结果,计算每个分拣中心每个班次的出勤人数
df_people = df_mean.groupby(['分拣中心', '时间']).sum()
# 根据预测结果,确定每个分拣中心每个班次的出勤人数
df_people['每班人数'] = np.ceil(df_people['预测货量'] / df_people['每小时货量'])
df_people = df_people.reset_index()
# 将每个分拣中心每个班次的出勤人数写入结果表5中
df_result5 = df_people[['分拣中心', '时间', '每班人数']]
df_result5.to_csv('结果表5.csv', index=False)
# 定义函数,计算每个分拣中心每天的实际人天数
def get_people_days(df):
df['人天数'] = df['每班人数'] * 6
return df
# 将每个分拣中心每个班次的出勤人数重新按天进行分组,并计算每天的实际人天数
df_people = df_people.groupby('分拣中心').apply(get_people_days)
# 根据每个分拣中心每天的实际人天数,计算每个分拣中心未来30天的总人天数
df_total = df_people.groupby('分拣中心').sum()
# 计算每个分拣中心未来30天的总人天数
total_days = df_total['人天数'].sum()
# 根据每个分拣中心未来30天的总人天数,计算每个分拣中心每天的实际小时人效
df_total['实际小时人效'] = df_total['预测货量'] / df_total['人天数'] / 6
# 将每个分拣中心每天的实际小时人效写入结果表5中
df_result5['实际小时人效'] = df_total['实际小时人效']
df_result5.to_csv('结果表5.csv', index=False)
# 定义函数,计算每个分拣中心每个班次的出勤人数
def get_people(df, people):
# 计算每个分拣中心每个班次的出勤人数
df['每班人数'] = np.ceil(df['预测货量'] / df['实际小时人效'])
# 如果出勤人数超过正式工数量,则将超过的部分用临时工补足
df['每班临时工数'] = np.where(df['每班人数'] > people, df['每班人数'] - people, 0)
df['每班人数'] = np.where(df['每班人数'] > people, people, df['每班人数'])
return df
# 根据分拣中心和时间进行分组,根据每个分拣中心每天的实际小时人效,计算每个分拣中心每个班次的出勤人数
df_people = df_people.groupby(['分拣中心', '时间']).apply(get_people, people=60)
# 将每个分拣中心每个班次的出勤人数写入结果表6中
df_result6 = df_people[['分拣中心', '时间', '每班人数', '每班临时工数']]
df_result6.to_csv('结果表6.csv', index=False)
第四个问题是建立模型,确定未来30天每名正式工及临时工的班次出勤计划,并给出未来30天每天六个班次中,每名正式工将在哪些班次出勤,每个班次需要雇佣多少临时工。
首先,根据问题1和问题2的预测结果,可以得到每个分拣中心未来30天每天及每小时的货量预测值和,其中代表分拣中心编号,代表天数,代表小时。同时,根据问题3中的假设,每个分拣中心有60名正式工,因此总的正式工人数为。
接下来,假设每个班次的工作时间为8小时,那么每天的工作班次数为6个,可以得到每个班次的开始时间,其中代表班次编号,如下所示:
每个班次的结束时间为上一个班次的开始时间加8小时,即,其中。
假设每名正式工在每个班次的小时人效为,其中代表分拣中心编号,代表正式工编号,代表班次编号。根据问题1和问题2的条件,可以得到每个班次的正式工小时人效的最大值为25包裹/小时,临时工小时人效的最大值为20包裹/小时。
根据以上假设和条件,可以得到每名正式工在每个班次的工作时间为小时,因此每个班次需要雇佣的正式工人数为:
每个班次需要雇佣的临时工人数为:
因此,每个班次需要的总人数为,其中代表分拣中心编号,代表正式工编号,代表班次编号。
接下来,为了使得每天的实际小时人效尽量均衡,可以将每个班次的总人数按照每个分拣中心的货量比例进行分配,即:
其中代表分拣中心编号,代表班次编号。这样可以保证每个班次的人数与每个分拣中心的货量成正比,从而实现每天的实际小时人效尽量均衡。
最后,为了使得每天的人天数尽可能少,可以将每个分拣中心每天的总人数按照每个班次的需求人数比例进行分配,即:
其中代表分拣中心编号,代表天数,代表班次编号。这样可以保证每天的总人数与每个班次的需求人数成正比,从而实现每天的人天数尽可能少。
综上所述,可以建立如下数学模型:
目标函数:
约束条件:
其中代表分拣中心编号,代表正式工编号,代表班次编号,代表天数。为二进制变量,当第个分拣中心在第个班次有需求时,,否则为0。
根据以上数学模型,可以求解出每个分拣中心在每天六个班次中,每名正式工将在哪些班次出勤,每个班次需要雇佣多少临时工。将求解结果写入结果表6中即可。
假设每名正式工的出勤率为,则每名正式工每天的出勤天数为。每天的班次有6个,因此每个班次每天需要的正式工数量为。同理,每天需要的临时工数量为。
根据题意,每名正式工的出勤率不能高于85%,即。为了尽量保持正式工的出勤率均衡,假设每名正式工的出勤率为0.85时,每天出勤的班次为3-3-3-3-3-3,即每个班次每天需要的正式工数量为,每天需要的临时工数量为。
因此,每名正式工每天出勤的班次可以使用二进制变量表示为:
其中,。
同时,每天需要的临时工数量也可以使用二进制变量表示为:
其中,。
根据以上假设,可以得到每名正式工每天出勤的班次数量为:
每天需要的临时工数量为:
为了尽可能降低人天数,可以设置目标函数为:
同时,为了保证每天的实际小时人效尽量均衡,可以设置约束条件为:
为了保证正式工的出勤率尽量均衡,可以设置约束条件为:
为了保证正式工的连续出勤天数不超过7天,可以设置约束条件为:
其中,。
综上所述,可以建立如下优化模型:
其中,表示第天是否出勤,表示第天是否需要临时工,表示正式工的出勤率。
解决以上优化模型,可以得到每名正式工每天的出勤情况,以及每天需要的临时工数量,从而可以得到每天的人天数。根据题意要求,可以将模型的结果与实际情况进行比较,进行调整以满足其他条件。最终,可以得到每个分拣中心每个班次的出勤人数,并写入结果表5中。
假设分拣中心SC60拥有200名正式工,为了方便建模,我们将每个班次的时长转换为小时数,即每天分为48个小时,每个班次时长为8小时。
我们使用一个二元变量表示每名员工在每个班次的出勤情况,其中表示员工编号,表示班次编号。若员工在班次出勤,则,否则。另外,我们设定每名员工最多连续出勤7天,即每个员工在连续的7个班次中最多出勤5个班次。
假设每名正式工的出勤率为,则在未来30天中,每名员工总共出勤的班次数为,即每名员工的出勤次数为:
同时,每个班次需要雇佣的临时工数量为:
其中表示班次所需的临时工数量。
为了满足每名员工最多连续出勤7天的限制,我们可以添加如下约束条件:
为了满足每名员工的出勤率限制,我们可以添加如下约束条件:
为了使总人天数尽可能少,我们可以添加如下目标函数:
综上,我们可以建立如下数学规划模型:
其中,为给定的正式工出勤率,为班次所需的临时工数量。
通过求解该数学规划模型,即可得到每名正式工的出勤计划以及每个班次所需的临时工数量,从而完成分拣中心SC60的排班问题。
#导入所需模块
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
#读取数据,分别为附件1、附件3和附件4
df1 = pd.read_excel('附件1.xlsx')
df3 = pd.read_excel('附件3.xlsx')
df4 = pd.read_excel('附件4.xlsx')
#将附件1中的数据按照分拣中心分组,计算每个分拣中心过去4个月的平均每天货量
avg_daily_volume = df1.groupby('分拣中心')['货量'].mean()
#将附件3中的数据按照分拣中心分组,计算每个分拣中心过去90天的平均线路货量
avg_route_volume = df3.groupby('分拣中心')['线路货量'].mean()
#将附件4中的数据按照分拣中心分组,计算每个分拣中心未来30天的线路货量
future_route_volume = df4.groupby('分拣中心')['线路货量'].mean()
#根据附件3和附件4的数据,计算每个分拣中心未来30天的预测货量
future_volume = future_route_volume.values * avg_daily_volume.values / avg_route_volume.values
#创建结果表6,包含分拣中心、正式工、临时工、每天六个班次的出勤情况
result_table6 = pd.DataFrame(columns=['分拣中心', '正式工', '临时工', '班次1', '班次2', '班次3', '班次4', '班次5', '班次6'])
#遍历每个分拣中心
for i in range(len(future_volume)):
#根据分拣中心名称,筛选附件1中对应的数据
center = df1[df1['分拣中心'] == future_volume.index[i]].reset_index()
#将日期转换为月份,方便计算月均货量
center['月份'] = pd.to_datetime(center['日期']).dt.month
#计算每个月的平均货量
monthly_avg_volume = center.groupby('月份')['货量'].mean()
#根据每个月的平均货量,计算未来30天每天的预测货量
future_daily_volume = monthly_avg_volume.values * future_volume[i] / monthly_avg_volume.mean()
#根据分拣中心名称,筛选附件4中对应的数据
future_route = df4[df4['分拣中心'] == future_volume.index[i]].reset_index()
#遍历每一天的预测货量
for j in range(30):
#根据每一天的预测货量,计算每个班次需要的正式工和临时工人数
official_workers = int(np.ceil(future_daily_volume[j]/25))
temp_workers = int(np.ceil((future_daily_volume[j]-official_workers*25)/20))
#将结果写入结果表6中
result_table6.loc[i*30+j] = [future_volume.index[i], official_workers, temp_workers, 0, 0, 0, 0, 0, 0]
#根据附件4中的数据,确定每个班次需要雇佣的正式工和临时工数量
for k in range(6):
if future_route['班次'+str(k+1)][j] == 0:
result_table6.loc[i*30+j, '班次'+str(k+1)] = 0
else:
result_table6.loc[i*30+j, '班次'+str(k+1)] = min(official_workers, future_route['班次'+str(k+1)][j])
if official_workers >= future_route['班次'+str(k+1)][j]:
official_workers = official_workers - future_route['班次'+str(k+1)][j]
else:
official_workers = 0
#根据每天需要的正式工和临时工人数,计算实际小时人效
actual_hourly_efficiency = future_daily_volume[j]/(result_table6.loc[i*30+j, '正式工']*25+result_table6.loc[i*30+j, '临时工']*20)
#根据实际小时人效,调整正式工的出勤班次
for k in range(6):
if result_table6.loc[i*30+j, '班次'+str(k+1)] != 0:
result_table6.loc[i*30+j, '班次'+str(k+1)] = result_table6.loc[i*30+j, '班次'+str(k+1)] * actual_hourly_efficiency/25
#根据剩余的正式工数量,确定每个班次需要雇佣的临时工数量
for k in range(6):
if result_table6.loc[i*30+j, '班次'+str(k+1)] != 0:
temp_workers = int(np.ceil((future_daily_volume[j]-result_table6.loc[i*30+j, '班次'+str(k+1)]*25)/20))
if result_table6.loc[i*30+j, '临时工'] >= temp_workers:
result_table6.loc[i*30+j, '临时工'] = result_table6.loc[i*30+j, '临时工'] - temp_workers
result_table6.loc[i*30+j, '班次'+str(k+1)] = result_table6.loc[i*30+j, '班次'+str(k+1)] + temp_workers
else:
result_table6.loc[i*30+j, '班次'+str(k+1)] = result_table6.loc[i*30+j, '班次'+str(k+1)] + result_table6.loc[i*30+j, '临时工']
result_table6.loc[i*30+j, '临时工'] = 0
#将结果写入结果表6中
result_table6.to_excel('结果表6.xlsx', index=False)
mathorcup跟紧小秘籍冲冲冲!!更多内容可以点击下方名片详细了解!
记得关注 数学建模小秘籍打开你的数学建模夺奖之旅!
版权声明:本文为博主作者:数学建模小secret原创文章,版权归属原作者,如果侵权,请联系我们删除!
原文链接:https://blog.csdn.net/Mmmath_secret/article/details/137687668