•   欢迎来到21NN网.
  •   请记住本站网址www.21nn.cn

pandas修正DataFrame列名的要领引见(代码示例)【Python教程】,python,pandas

摘要: 本篇文章给人人带来的内容是关于pandas修正DataFrame列名的要领引见(代码示例),有肯定的参考价值,有须要的朋侪能够参考一下,愿望对你有所协助。本文参考自:pandas修正Dat...
本篇文章给人人带来的内容是关于pandas修正DataFrame列名的要领引见(代码示例),有肯定的参考价值,有须要的朋侪能够参考一下,愿望对你有所协助。

本文参考自:pandas 修正 DataFrame 列名
原博客针对每一个DataFrame.columns中的元素做雷同的修正操纵
而拙作是对每一个元素做差别操纵的生搬硬套, 请人人不吝赐教

提出题目

存在一个名为dataset的DataFrame

>>> dataset.columns
Index(['age', 'job', 'marital', 'education', 'default', 'housing', 'loan',
       'contact', 'month', 'day_of_week', 'duration', 'campaign', 'pdays',
       'previous', 'poutcome', 'emp.var.rate', 'cons.price.idx',
       'cons.conf.idx', 'euribor3m', 'nr.employed', 'y'],
      dtype='object')

如今, 我要将其columns名字改成:

>>> new_columns
Index(['age_0', 'job_1', 'marital_2', 'education_3', 'default_4', 'housing_5',
       'loan_6', 'contact_7', 'month_8', 'day_of_week_9', 'duration_10',
       'campaign_11', 'pdays_12', 'previous_13', 'poutcome_14',
       'emp.var.rate_15', 'cons.price.idx_16', 'cons.conf.idx_17',
       'euribor3m_18', 'nr.employed_19', 'y_20'],
      dtype='object')

该怎样操纵?

处理

一.经由过程DataFrame.columns类的本身属性修正:

1.无脑赋值直接修正

>>> # 先处理`new_columns`的推导题目
>>> # 列表推导
>>> new_columns_list = [column_str+'_'+str(i) for i ,column_str in enumerate(dataset.columns)]
>>> # 范例转换
>>> new_columns = pd.core.indexes.base.Index(new_columns_list)
>>> dataset.columns = new_columns

2.经由过程.map(mapper, na_action=None)函数来修正

>>> # 注:mapper 多应用 lambda 表达式
>>> # 但我好像没有找到在 lambda 表达式中转变两个值的要领
>>> # 所以只能糟糕地用一个全局变量i, 和映照函数mapper()
>>> # 愿望人人能帮我找到要领

>>> i = 0
>>> def mapper(x): # 映照函数即 mapper
    global i
    x += '_' + str(i)
    i += 1
    return x
>>> dataset.columns.map(mapper)

3.参考博客用到了DataFrame.columns.str对象

help(DataFrame.columns.str)翻遍了文档,
也没能找到能够被我拿来套用的要领, 想着抽时间把这段文档翻译一下

二.经由过程DataFrame.rename()函数来修正

1.暴力字典法(优点:能够只修正特定的列)

>>> # 此处先用字典推导法
>>> new_dict = {
    key:key+'_'+str(i)
    for i, key in enumerate(dataset.columns)
    }
>>> dataset.rename(columns=new_dict, inplace=True)

2.映照修正法

>>> # 原博文依旧用到了 lambda 表达式
>>> # 我就再生搬硬套一次, 把上面的复制过来
>>> # 糟糕地用一个全局变量i, 和映照函数mapper()

>>> i = 0
>>> def mapper(x): # 映照函数即 mapper
    global i
    x += '_' + str(i)
    i += 1
    return x
dataset.rename(columns=mapper, inplace=True)

轻微总结一下 : 字典推导和列表推导的使用要领很相似, 最大的区别是挑选中括号照样大括号

以上就是pandas修正DataFrame列名的要领引见(代码示例)的细致内容,更多请关注ki4网别的相干文章!

分享到:

发表评论

评论列表

还没有评论,快来说点什么吧~

公众号二维码

微信公众号