#создай здесь свой индивидуальный проект!
from pandas import *
print("bdate -", df.bdate.unique())
# '23.4.1990', '03.05'...
def change_bdate(row):
# с датами работать будем так - берем год и вычитаем его и текущего года
# рез-т переводим в int ('23.4.1990' -> '1990' -> 2023 - 1990 -> 2023 - 1990 -> 33, заменяем исходную дату
bdate = row['bdate'].split('.')
if len(bdate) == 3:
row['bdate'] = 2023 - int(bdate[2]))
else:
row['bdate'] = np.nan
return row
df = df.apply(change_bdate, axis = 1)
df = read_scv('test.scv')
print(df.head())
df.drop(['id', 'sex', 'has_photo', 'has_mobile', 'follomers_count', 'education_from', 'graduation', 'relation', 'last_seen'])
df = df.fillna(0)
df.info()
def fill_ed(ed_f):
if ed_f == 'Distance Learning':
return 0
return 1
df['education_form'] = df['education_form'].apply(fill_ed)
def fill_res(row):