Untitled
unknown
plain_text
a year ago
1.1 kB
2
Indexable
Never
#создай здесь свой индивидуальный проект! from pandas import * print("bdate -", df.bdate.unique()) # '23.4.1990', '03.05'... def change_bdate(row): # с датами работать будем так - берем год и вычитаем его и текущего года # рез-т переводим в int ('23.4.1990' -> '1990' -> 2023 - 1990 -> 2023 - 1990 -> 33, заменяем исходную дату bdate = row['bdate'].split('.') if len(bdate) == 3: row['bdate'] = 2023 - int(bdate[2])) else: row['bdate'] = np.nan return row df = df.apply(change_bdate, axis = 1) df = read_scv('test.scv') print(df.head()) df.drop(['id', 'sex', 'has_photo', 'has_mobile', 'follomers_count', 'education_from', 'graduation', 'relation', 'last_seen']) df = df.fillna(0) df.info() def fill_ed(ed_f): if ed_f == 'Distance Learning': return 0 return 1 df['education_form'] = df['education_form'].apply(fill_ed) def fill_res(row):