Hvordan finne gjennomsnittet av et sett med kolonner i en rad med en pyspark dataframe og legge den som en annen kolonne i samme dataframe?

stemmer
0

Jeg har en DataFrame bestående av 500 søyler hvorav, for hver rad jeg trenger å få gjennomsnittet av settet med kolonner som starter med country_.

expr=[F.sum(train_data_df[x])/colCount for x in train_data_df.columns if 'country_' in x]
avg_train_data_df = train_data_df.withColumn('avg', *expr)

Jeg får følgende feil svar:

TypeError: withColumn() takes 3 positional arguments but 212 were given

Publisert på 19/09/2018 klokken 13:23
kilden bruker
På andre språk...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more