NGHIÊN CỨU VỀ THUẬT TOÁN KHAI PHÁ CÂY CON PHỔ BIẾN TRONG KHO CÁC CÂY DỮ LIỆU
DOI:
https://doi.org/10.64223/tvj.p2025.v1.i1.a11Từ khóa:
Đồ thị, Dạng chuẩn theo chiều rộng, Khai phá dữ liệu, Cây con phổ biến, Cây liệt kêTóm tắt
Vấn đề quan trọng trong bài toán khai phá kho các cây dữ liệu là tìm sự xuất hiện của các cây con phổ biến. Do số lượng các cây con phổ biến tăng theo hàm mũ kích cỡ của các cây dữ liệu, vì thế các phương pháp khai phá tất cả các cây con phổ biến truyền thống không mang lại hiệu quả đối với những cây dữ liệu kích cỡ rất lớn. Có một số kỹ thuật được sử dụng để tỉa bỏ các nhánh của cây liệt kê mà chúng không phải là cây con phổ biến, trong đó phương pháp heuristic được áp dụng để tổ chức tính toán và khai phá tất cả các cây con phổ biến một cách hiệu quả. Trong bài báo này, nhóm tác giả thực hiện nghiên cứu thuật toán xác định dạng chuẩn theo chiều rộng BFCF (Breadth-First Canonical Form) của cây không có thứ tự và sử dụng dạng chuẩn của cây không có thứ tự để khai phá các cây con phổ biến trong kho các cây dữ liệu.
Tải xuống
Đã Xuất bản
Số
Chuyên mục
Giấy phép

Tác phẩm này được cấp phép theo Ghi nhận tác giả của Creative Commons Giấy phép quốc tế 4.0 .