当前位置:
首页
文章
数据库
详情

Python pandas 对单列多列进行操作

其实之前都写过小笔记了Python Pandas 中lambda和apply函数的应用。用到的方法还是针对dataframe的apply函数+lambda表达式,除此之外,还存在针对series的map函数和apply函数。

下面区分单列、多列和元素级别的的操作。

1. 对单列进行操作,Series.apply()函数和Series.map()函数

针对一个Series,map函数和apply函数均可操作,看官方文档的介绍,apply适用于更复杂的操作功能。

  • Series.map()函数格式化字符串
s = pd.Series(['cat', 'dog', np.nan, 'rabbit'])

>>> s.map('I am a {}'.format, na_action='ignore')
0     I am a cat
1     I am a dog
2            NaN
3  I am a rabbit
dtype: object
  • Series.apply()函数最大最小归一化
df['new_col'] = df['col'].apply(lambda x: x+2)
2. 对多列进行操作,DataFrame.apply()函数

apply函数是针对指定的轴进行操作的,所以其实是行列都可以操作的,对列进行操作时指定axis=1,如下所示

df['new_col'] =  df.apply(lambda x: x['a'] + x['b'] - x['c'], axis=1)
def self_sum(a, b):
   return a ^ 2 + b ^ 2

df['sum'] = df.apply(lambda x: self_sum(x['from'], x['to']), axis=1)
3. 对个体元素进行操作,DataFrame.applymap()函数

针对整个dataframe,比如获取每个元素的长度

df.applymap(lambda x: len(str(x)), na_action='ignore')

针对整个dataframe的操作可以直接操作的,比如df**2就是对每个元素进行平方,效率更高。

今天动手归一化pandas中dataframe的一个列,竟然还忘记加apply了,哎,基础功一点都不扎实呀

免责申明:本站发布的内容(图片、视频和文字)以转载和分享为主,文章观点不代表本站立场,如涉及侵权请联系站长邮箱:xbc-online@qq.com进行反馈,一经查实,将立刻删除涉嫌侵权内容。