Untitled

mail@pastecode.io avatar
unknown
plain_text
a year ago
1.3 kB
3
Indexable
Never
import pandas as pd
thu_vien_dau_cau = {
    "(" : "mở ngoặc đơn ",
    ")" : " đóng ngoặc đơn ",
    "{" : "mở ngoặc nhọn ",
    "}" : " đóng ngoặc nhọn ",
    "[" : "mở ngoặc vuông ",
    "]" : " đóng ngoặc vuông ",
    "-" : " gạch ngang trên ",
    "_" : " gạch ngang dưới ",
    ":" : " hai chấm ",
    ";" : "chấm phẩy ",
    "," : " phẩy",
    ">" : " lớn hơn ",
    "<" : " bé hơn ",
    "?" : " chấm hỏi ",
    "!" : " chấm than ",
    "@" : " a còng ",
    "#" : " dấu thăng ",
    "%" : "phần trăm ",
    "." : " chấm ",
    "=" :  " bằng ",
    "..." : " ba chấm ",
    '/' : ' xuyệt trái ',
    '\\' : 'xuyệt phải ',
    '\n' : 'xuống dòng '
}

def chuyen_dau_cau_thanh_chu(text):
    for dau_cau, chu in thu_vien_dau_cau.items():
        text = text.replace(dau_cau, chu)
        # text = text.replace(".\n", " chấm xuống dòng ")
        text = text.replace("...", " ba chấm ")
    return text

with open('demo-title.txt', 'r', encoding='utf-8') as file:
    file_content = file.read()
file_content_converted = chuyen_dau_cau_thanh_chu(file_content)
with open('ten_tep_tin_moi.txt', 'w', encoding='utf-8') as new_file:
    new_file.write(file_content_converted)