多条件过滤表格 转换多变量标签编码的表达式怎么写

图片[1]-多条件过滤表格 转换多变量标签编码的表达式怎么写-决策链社区论坛

逻辑与运算符号(英文半角)含义
==等于
!=不等于
>大于
>=大于等于
<小于
<=小于等于
|或or
&或and
~
( )①表示括号,优先运算
②( )跟随在其他运算符后,含义随运算符变化
[ ]索引括号
‘ ‘字符串
常量表达式(英文半角)常量名称
np.piπ
np.ee 自然常数
np.inf无穷大
np.nanNaN
命令函数(英文半角)含义
x1.isin([a,b])筛出x1的值在a和b中的所有行
x1.notin([a,b])筛出x1的值不在a或b中的所有行
x1.between(a,b)筛出x1在a和b之间的所有行
x1.notnull()筛出x1非空的所有行
x1.str.contains(‘abc’)筛出x1列包含abc字符串的所有行
x1.str.startswith(‘a’)筛出x1列以a字符串开头的所有行
x1.str.endswith(‘a’)筛出x1列以a字符串结尾的所有行
x1.str.upper()将x1中的字符串转换为大写格式
x1.str.lower()将x1中的字符串转换为小写格式
x1.str.replace(‘a’,’b’)将x1中的字符串中的a替换为b
x1.str.strip()除去x1中字符串的收尾空白字符
x1.str.slice(0,n)提取x1中字符串的前n个字符
x1.str.len()计算x1列的字符串长度
x1.round(n)将x1的数字格式改为保留小数点后n位
x1.dt.year提取x1列中的年份
x1.dt.month提取x1列中的月份
x1.dt.day提取x1列中的日期
x1.dt.hour提取x1列中的时间(格式为24小时制字符串,即时间日期类型)
x1.dt.minute提取x1列中的分钟
x1.dt.second提取x1列中的秒
x1.dt.dayofweek提取x1列中的星期几(以星期一为1开始)
x1.dt.weekday提取x1列中的星期几(以星期一为1开始)
DeltaDays(x1,x2)计算时间差值,得到该时间段的天数(x1为观测时间起点,x2为观测时间终点;数据为时间日期类型)
DeltaDays(x1,x2,判断)计算时间差值,得到该时间段的天数(x1为观测时间起点,x2为观测时间终点;数据为时间日期类型;判断处填True则地板取整,填False则不取整)
DeltaHours(x1,x2)计算时间差值,得到该时间段的小时数(x1为观测时间起点,x2为观测时间终点;数据为时间日期类型)
DeltaHours(x1,x2,判断)计算时间差值,得到该时间段的小时数(x1为观测时间起点,x2为观测时间终点;数据为时间日期类型;判断处填True则地板取整,填False则不取整)
time_greater_than(x1,观测时间起点,判断)筛选出x1中在某时间之后的情况(观测时间为时间日期类型;判断处填True则包含该起始时间点,填False则不包含该时间起点)
time_less_than(x1,观测时间终点,判断)筛选x1中在某时间之前的情况(观测时间为时间日期类型;判断处填True则包含该起始时间点,填False则不包含该时间终点)
x1.dt.is_month_start判断x1是否为月初
x1.dt.is_month_end判断x1是否为月末
x1.dt.is_quarter_start判断x1是否为季度初
x1.dt.is_quarter_end判断x1是否为季度末
x1.dt.is_year_start判断x1是否为年初
x1.dt.is_year_end判断x1是否为年末
x1.dt.days_in_month提取x1所在月份的天数
x1.dt.to_period(‘M’)将x1转换为以月份为单位的周期
x1.query()使用query方法筛选x1中的列
x1.dropna()去除x1列中任何Na的结果
np.isinf(x1)判断x1是否是极值,是则输出true,否则输出false
np.log(x1)计算x1的自然对数
np.log10(x1)计算x1以10为底的对数
np.logn(x1)计算x1以n为底的对数
np.sqrt(x1)平方根
np.exp(x1)计算e的x1次幂
np.power(x1,n)计算x1的n次方
np.where(条件,a,b)条件函数.满足条件时,对应元素赋值为a,不满足条件时,对应元素赋值为b.a和b两处可填常数也可填变量.
s_mean(x1,x2,x4,x6,x10)计算x1,x2,x4,x6,x10的均值.该运算会自动忽略空值及其数量,比如x2为空时,计算的是x1,x4,x6,x10的均值
s_sum(x1,x2,x4,x6,x10)计算x1,x2,x4,x6,x10的总和
s_count_notnull(x1,x2,x4,x6,x10)计算(多列)变量中非空值的总数量
s_count_null(x1,x2,x4,x6,x10)计算(多列)变量中空值的总数量
s_count_max(x1,x2,x4,x6,x10)计算(多列)变量中的最大值
s_count_min(x1,x2,x4,x6,x10)计算(多列)变量中的最小值
np.sin(x1)计算x1的正弦值
np.sinh(x1)计算x1的双曲正弦值
np.cos(x1)计算x1的余弦值
np.cosh(x1)计算x1的双曲余弦值
np.tan(x1)计算x1的正切值
np.tanh(x1)计算x1的双曲正切值
np.arcsin(x1)计算x1的反正弦值,x1的值需在[-1,1]之间
np.arcsinh(x1)计算x1的反双曲正弦值
np.arccos(x1)计算x1的反余弦值,x1的值需在[-1,1]之间
np.arccosh(x1)计算x1的反双曲余弦值,x1的值需大于1
np.arctan(x1)计算x1的反正切值
np.arctanh(x1)计算x1的反双曲正切值,x1的值需在(-1,1)
表达式举例(英文半角)解释
x1==x2对应元素是否相等,返回True/False
x1!=x2对应元素是否不相等,返回True/False
x1>x2x1对应元素是否大于x2,返回True/False
x1<x2x1对应元素是否小于x2,返回True/False
x1>=x2x1对应元素是否大于等于x2,返回True/False
x1<=x2x1对应元素是否小于等于x2,返回True/False
x1+x2相加(x1,x2对应元素)
x1-x2相减(x1,x2对应元素)
x1*x2相乘(x1,x2对应元素)
x1/x2相除(x1,x2对应元素)
(x1+x2)*x3先加法后乘法
(x1-x2)/x3先减法后除法
x1%x2x1除以x2后的余数(对应元素)
x1**x2x1的x2次方(对应元素)
np.power(x1,x2)x1的x2次方(对应元素)
x1>=2 & x2<=3筛选出x1大于等于2且x2小于等于3的所有行
x3.between(5,10)筛选出x3的值在5到10之间(包含5和10)的所有行
~x1.isin( [1,5]) | x2>7筛选出x1不在1, 5中或x2大于7的所有行
x1.isnull() &x2.notnull()筛选出x1是空值(即x1没有值)且x2非空(即x2有值)的所有行
time_greater_than(x1,’19:00:00′,False)当x1为时间日期类型的变量时,筛选出x1列中时间在夜晚19点之后的所有行,不包含等于19点的情况.
time_less_than(x1,’23:00:00′)当x1为时间日期类型的变量时,筛选出x1列中时间在夜晚23点之前的所有行,包含等于23点的情况.
x2.str.startswith(‘A’) &x3.str.endswith(‘Z’)筛选出x2列值以’A’开头且x3列值以’Z’结尾的所有行
x1.dt.year==2020筛选出x1列(日期类型)中年份为2020 的所有行
x2[x2>0 ].dropna()筛选出x2列中大于0的值,并去除任何NaN结果
np.where((x1==”‘female'”) and(x2<=0.7),x3,x2)当满足条件(x1为字符串’female’且x2<=0.7)时,取值为x3变量值,当不满足条件时,取值为x2变量值

© 版权声明
THE END
喜欢就支持一下吧
点赞8536 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容