Untitled
unknown
python
a year ago
429 B
10
Indexable
def preprocess_sentence(sentence):
# \n을 공백으로 바꾸기
sentence = re.sub("\n", " ", sentence)
# (ㄱ-ㅎ, ㅏ-ㅣ, ".", "?", "!", ",", ' ')를 제외한 모든 문자를 없애기
sentence = re.sub("[^ㄱ-ㅣ가-힣.?!, ]", "", sentence)
# 단어와 구두점(punctuation) 사이에 공백 추가
sentence = re.sub(r"([?.!,])", r" \1 ", sentence)
return sentence
Editor is loading...
Leave a Comment