Как проверить зависимость одного столбца к другому в кадре данных pandas

Вопрос: У меня есть следующий фреймворк: import pandas as pd df=pd.DataFrame([[1,11,'a'],[1,12,'a'],[1,11,'a'],[1,12,'a'],[1,7,'a'], [1,12,'a']]) df.columns=['id','code','name'] df id code name 0 1 11 a 1 1 12 a 2 1 11 a 3 1 12 a 4 1 7 a 5 1 12 a Как показано в приведенном выше фреймворке, значение столбца "id" напрямую связано со значением столбца

Вопрос:

У меня есть следующий фреймворк:

import pandas as pd df=pd.DataFrame([[1,11,’a’],[1,12,’a’],[1,11,’a’],[1,12,’a’],[1,7,’a’], [1,12,’a’]]) df.columns=[‘id’,’code’,’name’] df id code name 0 1 11 a 1 1 12 a 2 1 11 a 3 1 12 a 4 1 7 a 5 1 12 a

Как показано в приведенном выше фреймворке, значение столбца “id” напрямую связано со значением столбца “name”. Если я скажу, что миллион записей, как я могу знать, что столбец полностью зависит от другого столбца в фрейме данных?

Лучший ответ:

Если они полностью зависимы, то их факторизация будет одинаковой

(df.id.factorize()[0] == df.name.factorize()[0]).all() True

Оцените статью
Добавить комментарий