如何在python中的列数据帧上的特殊字符之间提取字符串?

社会演员多 python 185

原文标题How to extract a string between special character on a column dataframe in python?

我有这个 Python Pandas 数据框:

Municipio
São Caetano do Sul (SP)
Florianópolis (SC)
Vitória (ES)    

如何提取()之间的术语并将其转换为:

Municipio                   UF
São Caetano do Sul (SP)     (SP)
Florianópolis (SC)          (SC)
Vitória (ES)                (ES)

原文链接:https://stackoverflow.com//questions/71919898/how-to-extract-a-string-between-special-character-on-a-column-dataframe-in-pytho

回复

我来回复
  • Xinyi Li的头像
    Xinyi Li 评论
    df['UF'] = df['Municipio'].str.split('(').str[1].str[:-1]
    

    enter image description here

    2年前 0条评论
  • Ynjxsjmh的头像
    Ynjxsjmh 评论

    你可以试试pandas.Series.str.extract

    df['UF'] = df['Municipio'].str.extract('(\([^)]*\))')
    
    print(df)
    
                     Municipio  UF
    0  São Caetano do Sul (SP)  (SP)
    1       Florianópolis (SC)  (SC)
    2             Vitória (ES)  (ES)
    
    2年前 0条评论
  • Tim Biegeleisen的头像
    Tim Biegeleisen 评论

    使用str.extract我们可以尝试:

    df["UF"] = df["Municipio"].str.extract(r'\(([A-Z]+)\)')
    
    2年前 0条评论