Untitled

mail@pastecode.io avatar
unknown
plain_text
a year ago
1.1 kB
2
Indexable
Never
#создай здесь свой индивидуальный проект!
from pandas import *


print("bdate -", df.bdate.unique())
# '23.4.1990', '03.05'...
def change_bdate(row):
    # с датами работать будем так - берем год и вычитаем его и текущего года
#   рез-т переводим в int ('23.4.1990' -> '1990' -> 2023 - 1990 -> 2023 - 1990 -> 33, заменяем исходную дату
    bdate = row['bdate'].split('.')
    if len(bdate) == 3:
        row['bdate'] = 2023 - int(bdate[2]))

    else:
        row['bdate'] = np.nan
    return row
df = df.apply(change_bdate, axis = 1)
df = read_scv('test.scv')
print(df.head())
df.drop(['id', 'sex', 'has_photo', 'has_mobile', 'follomers_count', 'education_from', 'graduation', 'relation', 'last_seen'])
df = df.fillna(0)
df.info()

def fill_ed(ed_f):
    if ed_f == 'Distance Learning':
        return 0
    return 1


df['education_form'] = df['education_form'].apply(fill_ed)


def fill_res(row):