站点图标 AI技术聚合

【python】———merge函数

@爱学习的DUO

1 数据读取(A、B表)

import pandas as pd
A = pd.read_excel('D:/pp/test.xlsx','Sheet1');A
B = pd.read_excel('D:/pp/test.xlsx','Sheet2');B

2 当右表无重复项

例1:有A(5行)、B(10行)两个表,按IDkey进行横向匹配。
(1)首先把B表的列名字【key】改为【ID】,以便于后续匹配。

B=B.rename(columns={'key':'ID'});B

(2)用B表去匹配A表(参数=‘left’)。

AB=pd.merge(A,B,on = ['ID'],how='left');AB
BA=pd.merge(B,A,on = ['ID'],how='left');BA

3 当右表有重复项

3.1 数据读取(C表)

C = pd.read_excel('D:/pp/test.xlsx','Sheet3');C

3.2 不对右表去重

AC=pd.merge(A,C,on = ['ID'],how='left');AC

3.3 对右表去重处理

(1)对C表的ID去重,重命名为C_qc

C_qc=C.drop_duplicates(['ID'])
C_qc
AC1=pd.merge(A,C_qc,on = ['ID'],how='left');AC1

3.4 总结

可以看出,使用merge函数的时候,如果右表有重复值,会导致结果的不准确。所以一般对右表做去重处理,再与左表进行横向匹配。

文章出处登录后可见!

已经登录?立即刷新
退出移动版