Untitled
user_0285932
plain_text
a year ago
1.5 kB
5
Indexable
Mạng neuron tích chập: là một loại mạng neuron nhân tạo, nhận đầu vào thường là ảnh và sử dụng các phép toán tích chập nhằm trích xuất các đặc trưng của đối tượng. Mạng VGG-16: là một kiến trúc mạng CNN Batch normalization: là một phương pháp chuẩn hóa dữ liệu, giúp việc huấn luyện dễ dàng và nhanh chóng hơn nhờ việc tối ưu hàm mmục tiêu. Skip connection: cơ chế bỏ qua một số lớp trong mạng neuron và lấy đầu ra của một lớp làm đầu vào cho lớp tiếp theo. Nó có vai trò nâng cao khả năng giữ những thông tin cần thiết, tránh mất mát thông tin Để thực hiện phát hiện chữ trong ảnh, khóa luận sử dụng CRAFT - mô hình phát hiện chữ ở mức độ ký tự. Kiến trúc mô hình sử dụng VGG-16 với chuẩn hóa dữ liệu bằng phương pháp batch normalization và sử dụng cơ chế skip connection. Đầu ra gồm hai giá trị: - region score: - affinity score: Kiến trúc mạng được minh họa như hình 3.2. Training - Tạo nhãn giả với mỗi ảnh tự tạo ra, tạo nhãn giả cho giá ttrị region score và afinity score với hộp giới hạn ở mức ký tự. region score biểu diễn xác suất 1 pixel là điểm trung tâm của 1 ký tự affinity score biểu diễn xác suất của khoảng cách giữa các ký tự liền kề
Editor is loading...
Leave a Comment