from functools import reduce
import pandas as pd
import statsmodels.api as sm
import numpy as np
from scipy.optimize import minimize
df = pd.read_csv("pheno.asd", sep="\s+", header=0)
gmat = np.loadtxt("test.agrm.mat_fmt")
X = np.array(df.loc[:, 'mean':'sex'], dtype=np.float64)
y = np.array(df.loc[:, 'trait'], dtype=np.float64)
logit = sm.Logit(y, X)
前几天在调试这个程序的时候,突然爆出一个错误
我对 statsmodels 这个库使用的不多并没有反应出这个错误是什么
所以我问了魔法女士
我发现没有任何文章可以立即让我明白错误在哪里
于是我参照python – 值错误 : endog must be in the unit interval – IT工具网https://www.coder.work/article/1270243
这篇文章的一个答案其实就是问题所在,只是当时不知道哪里出了问题,也没有找到好的解决办法
于是我去用excel分析了一下我的数据
他出现了0 1 之外的数字
我使用 statsmodels 这个库是为了拟合逻辑回归的初值
我过滤查看的列是放入的表型
也就是 y = np.array(df.loc[:, ‘trait’], dtype=np.float64)
当使用函数 logit = sm.Logit(y, X) 拟合的时候便会出现错误,当修改数据使其不会出现除了0 1 之外的数据,报错解决
版权声明:本文为博主c1684517745原创文章,版权归属原作者,如果侵权,请联系我们删除!
原文链接:https://blog.csdn.net/c1684517745/article/details/123100037