假设您的DataFrame的列包含表达式(请参阅其他列),是否可以评估该列中包含的表达式?
我知道可以使用pd.eval()和df.eval()进行按列操作(如下所示).示例取自:
https://jakevdp.github.io/PythonDataScienceHandbook/03.12-performance-eval-and-query.html
假设您有:
import pandas as pd
df = pd.DataFrame([[1,2],[2,3],[5,6]],columns=['A','B'])
然后您可以编写:
df.eval('(A + B)')
您将获得一个包含3、5、11(预期)的系列.
现在,如果该表达式实际上在行与行之间变化并且实际上存储为列,该怎么办?例如此数据框:
df = pd.DataFrame([[1,2,"A + B"],3,"A - B"],6,"A + 2 * B"]],'B','C'])
如何评估C列中的表达式?
在这种情况下,预期结果是一个包含3,-1、17的序列.
谢谢你的帮助.
最佳答案
采用
>>> np.diag(df.C.apply(df.eval).values)
array([ 3,-1,17])
即使这是一个糟糕的IMO设计,由于您是I)对字符串中的操作进行硬编码,因此在需要时很难对其进行操作; II)将这些操作作为字符串存储在pandas DataFrame中,这对于许多字符串来说很慢涉及的操作.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。